Fellow-Klasse 2015/16 Prof. Dr. Björn Ommer
Arbeitsvorhaben am Marsilius-Kolleg
Kompositionalität von Bedeutung in Bild und Text aus informatischer, linguistischer und kunsthistorischer Perspektive
Ziel des Arbeitsvorhabens ist die Untersuchung der unterschiedlichen Realisierung bedeutungstragender Einheiten in Bild und Text aus Sichtweise der jeweils auf Text (Computerlinguistik), Bild (Bildverarbeitung), und Funktion und Bedeutung von Bildern (Kunstgeschichte) fokussierten Disziplinen.
Anhand des Exempels illustrierter Inkunabeln von kunsthistorischem Interesse soll die Frage nach der Versprachlichung bzw. Verbildlichung komplexer Konzepte gestellt werden. Die technischen Einzeldisziplinen der Bildverarbeitung und Computerlinguistik bieten jeweils Ansätze zur automatischen Erkennung einzelner Bildobjekte oder zur automatischen Annotation von Bildern mit Stichworten. Eine Schwierigkeit stellt die Analyse komplexer Szenen dar, wie sie in Inkunabeln zu finden sind.
Die Computer Vision untersucht in diesem Projekt kompositionelle Repräsentationen von Objekten mit dem Fokus auf eine inhaltsbasierte Bildsuche. Die bedeutungstragenden visuellen Einheiten sollen gemeinsam mit sprachlichen Phrasen gelernt werden, was wiederum computerlinguistische Methoden voraussetzt. Gleichzeitig bedarf es kunstgeschichtlicher Expertise, um im gemeinsamen Dialog über Bildbeschreibung zu einem automatischen Lernverfahren für robuste kompositionelle Abstraktionen von Bildinhalten zu gelangen. Dieses Projekt soll damit den Weg zu einer verbesserten Objekterkennung bahnen, die für die Kunstgeschichte und andere an Bildsuche interessierte Disziplinen einen wesentlichen Fortschritt bedeutet.
FORSCHUNGSGEBIETE
- Computer Vision
- Maschinelles Lernen
- Mustererkennung
- Computational Humanities
Lebenslauf
- 1998-2003: Diploma studies in Computer Science with minor in Physics, University of Bonn.
- 2000-2002: Teaching & research assistant, Institute of Computer Science, University Bonn.
- 2003-2007: Ph.D. student and teaching and research assistant, Machine Learning Group, Inst. of Computational Science, ETH Zurich.
- 2008-2009: Postdoctoral scholar, Computer Vision Group (Jitendra Malik), Dept. of EECS, UC Berkeley.
- 2009-2013: Assistant Professor for Scientific Computing (W1), University of Heidelberg, HCI & Interdisciplinary Center for Scientific Computing.
- 2010- heute: Member of the Executive Board, Heidelberg Graduate School HGS MathComp
- 2011- heute: Director of the HCI (jointly with B. Jähne, F. Hamprecht, and C. Schnörr) and member of the Steering Committee of the HCI (since 2009)
- 2012: Successful evaluation of assistant professorship
- 2013-heute: W3-Professor for Scientific Computing, University of Heidelberg
- 2013- heute: WIN fellow of the Heidelberg Academy of Sciences and Humanities
Ausgewählte Publikationen
Tabelle
B. Ommer and J. M. Buhmann. Learning the compositional nature of visual object categories for recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI), 32(3):501-516, IEEE, 2010. |
B. Ommer, T. Mader, and J. M. Buhmann. Seeing the objects behind the dots: Recognition in videos from a moving camera. International Journal of Computer Vision (IJCV), 83(1):57-71, Springer, 2009. |
A.S. Wahl, W. Omlor, J.C. Rubio, J.L. Chen, H. Zheng, A. Schröter, M. Gullo, O. Weinmann, K. Kobayashi, F. Helmchen, B. Ommer, M.E. Schwab. Asynchronous therapy restores motor control by rewiring of the rat corticospinal tract after stroke, Science 344(6189): 1250-1255 (full article), 2014. |
P. Yarlagadda and B. Ommer. Beyond the sum of parts: Voting with groups of dependent entities, IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI), IEEE, 2014 (accepted, in press). |
B. Ommer and J. Malik. Multi-scale object detection by clustering lines. In Proceedings of the IEEE International Conference on Computer Vision (ICCV), IEEE, 2009. |
A. Monroy, P. Bell, and B. Ommer. Morphological analysis for investigating artistic images. Image and Vision Computing 32(6):414-423, Elsevier, 2014. |
P. Bell, J. Schlecht, and B. Ommer, Nonverbal communication in medieval illustrations revisited by computer vision and art history. Visual Resources Journal (Special Issue on Digital Art History) 29(1):26-37, Taylor and Francis, 2013. |
P. Yarlagadda, A. Monroy, and B. Ommer. Voting by Grouping Dependent Parts. In Proceedings of the European Conference on Computer Vision (ECCV), LNCS 6315, pages 197-210, Springer 2010. |
B. Ommer and J. M. Buhmann. Learning compositional categorization models. In Proceedings of the European Conference on Computer Vision (ECCV), LNCS 3953, pages 316-329, Springer, 2006. |
B. Antic and B. Ommer, Learning Latent Constituents for Recognition of Group Activities in Video. In Proceedings of the European Conference on Computer Vision (ECCV), Springer, 2014. |
KONTAKT
Prof. dr. björn ommer
Interdisziplinäres Zentrum für Wissenschaftliches Rechnen
Ruprecht-Karls-Universität Heidelberg
E-Mail: ommer@uni-heidelberg.de