Friedrich-Alexander-Universität DruckenUnivisEnglish FAU-Logo
Techn. Fakultät Willkommen am Institut für Informatik FAU-Logo
cpn@work cpn@home alpha-Flow
Logo IMMD
Lehrstuhl für Informatik 6
Projekte (alph.)
AnFACS
Arachne
CoBRA DB
Comquad
CubeStar
dbprost
DQ-Step
DSAM
fCMDB08
FlexWCM
i6 M²EtIS
i6sdb
iArch
iRM
Marrakesch
medITalk
Mobile
Pixtract
Prozessor. IS im Krankenhaus
ProHTA
ProMed
PubScribe
Quancom
Radiologie-Netze
Retavic
SCINTRA
SeMeOr
SFB 539
SKM
TDQMed
Department Informatik  >  Informatik 6  >  Forschung  >  Projekte  >  Pixtract

Effiziente objekterkennungsbasierte Annotation von Bildern (Pixtract)

Projektleitung:Prof. Dr. Klaus Meyer-Wegener, Dipl.-Inf. Robert Nagy
Beteiligte:Giacomo Inches, Andrei Galea, Alexander Uhl, Anders Dicker, Jun Chen, Dipl.-Inf. Julian Rith, Sergiy Protsenko
Stichwörter:Annotation; Bildbeschreibung; Image Retrieval; Suche;
Beginn:1.1.2007
Inhalt und Ziele:Die Anzahl der Digitalbilder nimmt mit der Verbreitung von Digitalkameras, der Digitalisierung von kunsthistorischen bzw. Bibliothekssammlungen und billigen Speichermedien stetig zu, wobei gleichzeitig auch der Wunsch besteht in diesen riesigen Datenbergen zu einem späteren Zeitpunkt relevante Dokumente in relativ kurzer Zeit wiederzufinden. Dies erfordert jedoch einerseits gute Suchstrategien und Indizierungstechniken, andererseits aber auch die Anreicherung der Dokumente durch entsprechende Metadaten. Wegen der großen Menge ist eine manuelle Anreicherung der Bilder mit Beschreibungsinformationen unmöglich. Aus diesem Grund sind im letzten Jahrzehnt verschiedene Ansätze zur automatischen Erkennung von Objekten bzw. Personen in Bildern entstanden, die mehr oder weniger generisch ausgerichtet sind.
In diesem Projekt wird eine automatische inhaltsbasierte Annotation von Bildern realisiert. Im wesentlichen wird eine Übersetzung von Bildinhalten auf eine textuelle Beschreibung angestrebt. Dabei wird die Feature- und die textbasierte Suche voneinander getrennt. Ersteres wird in Verbindung mit neuen Objekterkennungsalgorithmen für die Annotation von Bildern verwendet, dessen Effizienz durch Indexstrukturen, Zugriffspfaden und Datenorganisation verbessert werden soll. Auf den erstellten Annotationen kann dann mit bereits etablierten Methoden der Textindizierung ein Suchdienst aufgebaut werden. Zur Bewältigung der großen Datenmengen werden auch die Einsatzmöglichkeiten von Multimedia Data-Mining analysiert. Der Kernpunkt dabei ist der Entwurf einer Verwaltungsstruktur die genügend Freiheiten für Erweiterungen und Umstrukturierungen zulässt, aber auch damit verträgliche Vorgaben aufführt die für das effiziente Annotieren der Bilder basierend auf deren Inhalten ausreichen.
Kontakt:Nagy, Robert
Telefon 09131 8527800, Fax 09131 8528854, E-Mail: robert.nagy@cs.fau.de
Publikationen:
  1. Nagy, Robert ; Meyer-Wegener, Klaus:
    Towards Extensible Automatic Image Annotation with the Bag-of-Words Approach .
    In: Huet, Benoit ; Chua, Tat-Seng ; Hauptmann, Alexander (Hrsg.) : Proceedings of the International Workshop on Very-Large-Scale Multimedia Corpus, Mining and Retrieval
    (ACM MM VLS-MCMR 2010, Firenze, Italy, 25-29th October 2010). Bd. 1, 1. Aufl.
    New York, NY, USA : ACM, 2010, S. 43-48. - ISBN 978-1-4503-0166-4
    Stichwörter:  object recognition; bag of words; extensibility
    [doi>10.1145/1878137.1878148]
  2. Nagy, Robert ; Dicker, Anders ; Meyer-Wegener, Klaus:
    Definition and Evaluation of the NEOCR Dataset for Natural-Image Text Recognition .
    Erlangen : Friedrich-Alexander-Universität Erlangen-Nürnberg. 2011
    (CS-2011-07). - Interner Bericht. 31 Seiten (Department Informatik Technical Reports) ISSN 2191-5008
    Stichwörter:  ocr, optical character recognition, scene text recognition, evaluation, dataset
  3. Nagy, Robert ; Dicker, Anders ; Meyer-Wegener, Klaus:
    NEOCR: A Configurable Dataset for Natural Image Text Recognition .
    In: Iwamura, Masakazu ; Shafait, Faisal (Hrsg.) : Camera-Based Document Analysis and Recognition
    (CBDAR, 4th Int. Workshop in conjunction with ICDAR 2011, Beijing, China, 22.09.2011).
    2011, S. 53-58.

Examensarbeiten

NEOCR Dataset

  Impressum Stand: 2011-03-14 15:59   NR