was ihm vorgegeben wird.“ Brox dagegen will ihm beibringen, sich selbst neues Wissen zu erarbeiten, um den Lernprozess zu automatisieren und die Annotationen zu reduzieren. Bildpunkte finden, die sich ähnlich bewegen Damit dies gelingt, verwendet er keine stati- schen Bilder, sondern Filme. „Auf Videos kann der Computer Objekte leichter segmentieren, also vom Hintergrund trennen“, sagt Brox. Er hat eine Analysemethode entwickelt, die den Com- puter alle Bildpunkte im Video finden lässt, die sich ähnlich bewegen – beispielsweise eine Reiterin auf einem Pferd. „Das ist ein klares Indiz dafür, dass sich diese Punkte vom Rest des Bilds unterscheiden.“ Menschen, Tiere oder Fahrzeuge bewegen sich selbst. Bei ruhenden Objekten, zum Beispiel einem Möbelstück, kommt die Bewegung dadurch zustande, dass die Kamera es umkreist, was eine dreidimensionale Rekon struktion ermöglicht. Anschließend verdichtet der Computer die Segmentierung: „Alle Bildpunkte, die er zuvor noch nicht verorten konnte, weist er mithilfe von Farbinformationen ebenfalls dem Objekt oder dem Hintergrund zu.“ Beides ist damit voneinander getrennt, ohne dass Brox dem Com- puter mit einem Rahmen zeigen musste, wo sich etwas Relevantes befindet. Er gibt ihm lediglich die Information, welcher Klasse das Objekt ange- hört, das auf dem Video zu sehen ist. Hinzu kommt: Ein Video setzt sich aus zwei Dutzend Bildern je Sekunde zusammen. Da das Objekt, beispielsweise ein Auto, auf jedem Bild aufgrund der Bewegung ein wenig anders aus- sieht, lernt der Computer schon anhand eines Films eine große Zahl von Variationen. „Zudem ist klar, dass der Grund für die Vielfalt nicht darin liegt, dass es sich um unterschiedliche Autos handelt. Das ist für das Lernen eine wichtige Information“, sagt Brox. Den ersten Teil des Lernprozesses hat der Informatiker gelöst: Der Computer erkennt auf der Grundlage der Video- analyse Variationen beispielsweise desselben Die Reiterin auf einem Video (ganz oben) löst der Computer vom Hintergrund, indem er die Bildpunkte, die sich im Film ähnlich bewegen, jeweils demsel- ben Objekt zuweist (Mitte). Die restlichen Punkte ergänzt er mithilfe von Farbinformationen. Damit ist jeder Bildpunkt zugeordnet, Reiterin und Hinter- grund sind voneinander getrennt (unten, überlagert vom Originalbild). 14