Please activate JavaScript!
Please install Adobe Flash Player, click here for download

uni'wissen 02-2012

von Nicolas Scherger eine Person hat viele Erscheinungsbilder, etwa wenn sie unterschiedliche Positionen einnimmt, ihre Kleidung wechselt oder von verschiedenen Seiten betrachtet wird. Kommen weitere Personen hinzu, wird die Vielfalt der Erscheinungsformen vollkommen unübersichtlich. Dennoch muss der Computer diese Variationen erfassen, wenn er Menschen zuverlässig erkennen soll. „Alle Mög- lichkeiten auswendig lernen kann er nicht, dafür bräuchte er unendlich viele Trainingsbeispiele“, sagt Brox. Stattdessen müsse der Computer ­lernen zu abstrahieren: „Er muss Merkmale finden, die allen Menschen gemeinsam sind.“ Dabei handelt es sich um typische Formen und Struk- turen, beispielsweise die Kopf-Schulter-Partie, die er auf Bildern identifizieren kann. Neu ist der Ansatz nicht, Computern das ­Erkennen von Merkmalen beizubringen, die ­bestimmte Klassen von Objekten – Menschen, Autos, Hunde, Topfpflanzen – charakterisieren. Bislang jedoch haben Wissenschaftlerinnen und Wissenschaftler Computer mit einzelnen Bildern trainiert. Auf diesen haben sie die Objekte mit so genannten Annotationen gekennzeichnet, zum Beispiel einem Rahmen und dem Hinweis, dass sich darin ein Hund befindet. Die Formen und Strukturen, die den Hund beschreiben, erkennt der Computer anhand der Kanten innerhalb des Rahmens, an denen sich die Farbe im Bild ­ändert. Dieses Vorgehen habe Nachteile, sagt Brox: „Der manuelle Aufwand für die Annotationen ist hoch, und der Computer lernt ausschließlich das, „Auf Videos kann der Computer Objekte leichter segmentieren, also vom Hintergrund trennen“ Der Informatiker Thomas Brox bringt Computern bei, wie sie mithilfe von Videos selbstständig lernen, Objekte auf Bildern zu finden

Pages