|
|
 |
 |
Effiziente objekterkennungsbasierte Annotation von Bildern (Pixtract)| Projektleitung: | Prof. Dr. Klaus Meyer-Wegener, Dipl.-Inf. Robert Nagy | | Beteiligte: | Giacomo Inches, Andrei Galea, Alexander Uhl, Anders Dicker, Jun Chen, Dipl.-Inf. Julian Rith, Sergiy Protsenko | | Stichwörter: | Annotation; Bildbeschreibung; Image Retrieval; Suche; | | Beginn: | 1.1.2007 | | Inhalt und Ziele: | Die Anzahl der Digitalbilder nimmt mit der Verbreitung von Digitalkameras, der Digitalisierung von kunsthistorischen bzw. Bibliothekssammlungen und billigen Speichermedien stetig zu, wobei gleichzeitig auch der Wunsch besteht in diesen riesigen Datenbergen zu einem späteren Zeitpunkt relevante Dokumente in relativ kurzer Zeit wiederzufinden. Dies erfordert jedoch einerseits gute Suchstrategien und Indizierungstechniken, andererseits aber auch die Anreicherung der Dokumente durch entsprechende Metadaten. Wegen der großen Menge ist eine manuelle Anreicherung der Bilder mit Beschreibungsinformationen unmöglich. Aus diesem Grund sind im letzten Jahrzehnt verschiedene Ansätze zur automatischen Erkennung von Objekten bzw. Personen in Bildern entstanden, die mehr oder weniger generisch ausgerichtet sind.
In diesem Projekt wird eine automatische inhaltsbasierte Annotation von Bildern realisiert. Im wesentlichen wird eine Übersetzung von Bildinhalten auf eine textuelle Beschreibung angestrebt. Dabei wird die Feature- und die textbasierte Suche voneinander getrennt. Ersteres wird in Verbindung mit neuen Objekterkennungsalgorithmen für die Annotation von Bildern verwendet, dessen Effizienz durch Indexstrukturen, Zugriffspfaden und Datenorganisation verbessert werden soll. Auf den erstellten Annotationen kann dann mit bereits etablierten Methoden der Textindizierung ein Suchdienst aufgebaut werden. Zur Bewältigung der großen Datenmengen werden auch die Einsatzmöglichkeiten von Multimedia Data-Mining analysiert. Der Kernpunkt dabei ist der Entwurf einer Verwaltungsstruktur die genügend Freiheiten für Erweiterungen und Umstrukturierungen zulässt, aber auch damit verträgliche Vorgaben aufführt die für das effiziente Annotieren der Bilder basierend auf deren Inhalten ausreichen.
| | Kontakt: | Nagy, Robert Telefon 09131 8527800, Fax 09131 8528854, E-Mail: robert.nagy@cs.fau.de
| | Publikationen: | - Nagy, Robert ; Meyer-Wegener, Klaus:
Towards Extensible Automatic Image Annotation with the Bag-of-Words Approach
. In: Huet, Benoit ; Chua, Tat-Seng ; Hauptmann, Alexander (Hrsg.) : Proceedings of the International Workshop on Very-Large-Scale Multimedia Corpus, Mining and Retrieval (ACM MM VLS-MCMR 2010, Firenze, Italy, 25-29th October 2010). Bd. 1, 1. Aufl. New York, NY, USA : ACM, 2010, S. 43-48. - ISBN 978-1-4503-0166-4 Stichwörter:
object recognition; bag of words; extensibility
[doi>10.1145/1878137.1878148] - Nagy, Robert ; Dicker, Anders ; Meyer-Wegener, Klaus:
Definition and Evaluation of the NEOCR Dataset for Natural-Image Text Recognition
. Erlangen : Friedrich-Alexander-Universität Erlangen-Nürnberg. 2011 (CS-2011-07). - Interner Bericht. 31 Seiten (Department Informatik Technical Reports) ISSN 2191-5008 Stichwörter:
ocr, optical character recognition, scene text recognition, evaluation, dataset
- Nagy, Robert ; Dicker, Anders ; Meyer-Wegener, Klaus:
NEOCR: A Configurable Dataset for Natural Image Text Recognition
. In: Iwamura, Masakazu ; Shafait, Faisal (Hrsg.) : Camera-Based Document Analysis and Recognition (CBDAR, 4th Int. Workshop in conjunction with ICDAR 2011, Beijing, China, 22.09.2011). 2011, S. 53-58.
|
Examensarbeiten
|
 |
 |
|