Das Seminar ist beendet, die letzten Vorträge und Reviews sind verlinkt. Vielen Dank an alle Teilnehmer für die rege Beteiligung und wir hoffen, Sie haben viel mitgenommen!
Die Aktualisierung dieser Seite wird damit beendet. Das Seminar ist für eine Prüfung im Bereich Computer Vision und verwandter Gebiete geeignet, Fragen dazu gerne per E-Mail an die Veranstalter.
Hinweis: Unser Ziel ist, mit eurer Hilfe, ein aktives, diskussionsorientiertes Seminar zu veranstalten! Um dies zu erreichen, ist die kontinuierliche Beschäftigung aller Teilnehmer mit den jeweils behandelten Themen notwendig. Dazu wird es zur Vorbereitung regelmäßig kleine theoretische und praktische Aufgaben geben. Zur Nachbereitung geben wir einen Reader heraus, zu dem alle Teilnehmer beitragen. Er soll kurz die wichtigsten Punkte der bearbeiteten Paper zusammenfassen und das Thema in den Kontext des Seminars einordnen. Eine Lesehilfe, wenn man so will.
Bei Bearbeitung der Aufgaben kann für Bachelorstudenten ein benoteter Leistungsnachweis ausgestellt werden.
Die Präsenz von Kameras im öffentlichen Raum hat in den letzten Jahren erheblich zugenommen. Als Ziel wird meist die Überwachung (zur Erhöhung der Sicherheit) angeführt. Inzwischen ist CCTV (closed circuit television) in vielen Großstädten (z.B. New York, London, Amsterdam) und in öffentlichen Gebäuden allgegenwärtig. Daneben bietet auch die Verkehrsüberwachung und -regelung vielerlei Einsatzgebiete für visuelle Überwachung. Für den Forschungsbereich der "Computer Vision" hat dies zu einem Boom von Methoden wie "Bewegungsanalyse", "visuelles Tracking", "Trajektorien-Klassifikation", "Personen-Identifikation" und "Szenenanalyse und -interpretation" geführt.
In diesem Seminar sollen verschiedene aktuelle Techniken und Systeme aus den genannten Bereichen vorgestellt und in Hinblick auf ihre Fähigkeiten und Einschränkungen diskutiert werden, um auch Fragen "Funktioniert es auch außerhalb des Labors?" zu beantworten.
Außerdem wollen wir uns auch mit den Folgen der zunehmenden Überwachung kritisch auseinandersetzen und die Sensibilität für die Wirkungen des technisch Machbaren fördern. Das Seminar bietet somit auch explizit die Möglichkeit einen Schein in "Informatik & Gesellschaft" zu erhalten. Im Seminar werden auch themenbezogene praktische Übungsaufgaben angeboten, die von den Teilnehmern zu bearbeiten sind.
Die Einführung macht eine kurze Bestandsaufnahme visueller Überwachungssysteme:
Ziel dieses Abschnitts ist, sowohl Ziele und Funktion als auch die Komponenten von Überwachungssystemen kennenzulernen. Die einzelnen Komponenten werden dann im weiteren Verlauf des Seminars vertiefend besprochen. Dabei geht es neben dem Verständnis des Verfahrens an sich auch darum, ob die Erwartungen erfüllt werden.
Unter "Tracking" versteht man die kontinuierliche Verfolgung der Position von Objekten (z.B. Autos oder Menschen) in einer Folge von Videobildern. Für viele Überwachungsanwendungen ist das Tracking der erste Schritt, alle weiteren bauen dessen Ergebnissen auf.
In diesem Abschnitt betrachten wir die einfachste und robusteste Klasse von Trackern, sog. "Blob"-(Regionen)-Tracker. Diese suchen in einer Videosequenz für jedes Bild erneut die am besten passende Region von Pixeln im Bild, z.B. anhand der (hoffentlich charakteristischen) Farbverteilung oder anderer, meistens einfacher, Features. Interessante Probleme für diesen Fall sind:
Ziel ist es, ein Verständnis für das prinzipielle Problem der visuellen Mehrdeutigkeit zu entwickeln und probabilistische Methoden kennenzulernen, mit denen es gehandhabt werden kann. Weiterhin werden wir einige grundlegende Bild-Features kennenlernen.
Um in einem Bild interessante Objekte -- zwischen all den uninteressanten Bildpartien -- herauszupicken, werden Detektionsverfahren verwendet, die auf bestimmte Objektarten trainiert wurden. Dies können zum einen relative große Regionen sein, ähnlich wie beim Tracking der Personen, zum anderen aber auch kleinen Objekte wie z.B. Gesichter.
Schwierig sind dabei Bildstellen die den interessanten Objekten ähneln, aber etwas anderes abbilden, und zu den sog. Falsch Positiven führen. Ein Lernverfahren das sich als besonders geeignet erwiesen hat, mit diesem (und vielen anderen) Problem in effizienter und effektiver Art und Weise umzugehen ist das sog. "Boosting", das wir daher hier auch explizit vorstellen wollen, um dann einige praxisrelevante Teilaspekte zu betrachten. Als Themen schlagen wir vor:
Ziel ist hier, das Problem der Detektion zu beleuchten. Es ist immer wieder schwierig, zwischen Detektionsgüte und Trainingsaufwand abzuwägen. Ebenfalls wird uns beschäftigen, wie man den Nachteil des Boostings (hoher Trainingsaufwand) durch Kombination mit anderen Lernverfahren ausgleichen kann. Last, but not least, ist die Betrachtung zeitlicher Features gerade für Überwachungsszenarien von großem Interesse.
Die Identifikation dient dazu, das gefundene Objekt mit einer speziellen Instanz in Zusammenhang zu bringen, z.B. ein Gesicht mit einem Namen zu verbinden oder ein Nummernschild zu lesen. Diese Aufgabe ist wegen der großen Varianz schwierig, z.B. ändern sich Gesichter stark über Zeit und bei verschiedenen Ausdrücke und Nummernschilder sind oft aus ungünstigen Winkeln aufgenommen, verdreckt, o.ä. Eine, keinerlei Anspruch auf Vollständigkeit erhebende, Auswahl an Themen:
Ziel dieses Abschnitts ist, einen Eindruck von den Möglichkeiten und Einschränkungen von Objektidentifikation bei hoher Varianz zu vermitteln. Einerseits ist eindrucksvoll, welche Unterschiede rein ansichtsbasiert zu ermitteln sind, andererseits gibt die hohe Fehlerrate Anlaß an automatischen Systemen zu zweifeln.
Unter Interpretation versteht man Ermittlung von Ergebnissen im Sinne des Gesamtsystems, bei einem Überwachungssystem also die Erkennung der beobachteten Aktivitäten.
Bei der Bewertung wollen wir sowohl die Zielerreichung als auch die soziale Akzeptanz betrachten, d.h.
Für die erste Frage wollen wir sowohl Evaluationsergebnisse diskutieren als auch das Auge für (absichtsvolle) Lücken in wissenschaftlichen Veröffentlichungen schärfen. Letztere sind oft typisch und können auf nicht direkt erwähnte Einschränkungen der vorgestellten Techniken hinweisen.
Die zweite Frage ist schwer eindeutig zu beantworten, da sich sowohl Gesellschaft als auch Technik im Fluss befinden. Wir werden uns ihr aber über Essays der einschlägigen Bürgerrechtsorganisationen und TA-Büros nähern.
Datum | Person(en) | Thema | Talk |
---|---|---|---|
6. April | Marc Hanheide, Ingo Lütkebohle | Seminareinführung | |
13. April | Nathalie Bibo | Überwachungssysteme auf Flughäfen: Avitrack | Vortrag |
13. April | Matthias Rolf | Personenverfolgungssysteme (Review) | Vortrag |
19. April | Matthias Hillebrand | Vergleich von Tracking-Verfahren (Review) | Vortrag |
19. April | Marc Hanheide | Demonstration von Tracking-Verfahren mit iceWing (Review) | Vortrag |
25. April | Mareike Lissek | Tracken von Menschen mit "Pfinder" (Review) | Vortrag |
25. April | Marc Hanheide, Ingo Lütkebohle | Diskussion von Ansätzen zu: 1) aktuelle Tracking-Features, 2) Disambiguierung mehrerer Personen | |
3. Mai | Johann Engelbrecht | Counting People from Multiple Cameras (Review) | Vortrag |
10. Mai | Marc Hanheide, Ingo Lütkebohle | Maschinelles Lernen für die automatisierte Interpretation von Videosequenzen | |
10. Mai | Niklas Beuter | Rapid Object Detection using a Boosted Cascade of Simple Features | Vortrag |
17. Mai | Ioannis Moutogiorgos | Detecting Pedestrians Using Patterns of Motion and Appearance | Vortrag |
17. Mai | Marco Kortkamp | Eigenfaces vs. Fisherfaces: Recognition Using Class Specific Linear Projection (Review) | Vortrag |
24. Mai | Marc Hanheide, Ingo Lütkebohle | A Unified Learning Framework for Real-Time Face Detection & Categorization | |
24. Mai | Marc Kammer | Automatic License Plate Recognition (Review) | |
7. Juni | Marc Hanheide | Face Recognition using Active Appearance Models | |
7. Juni | André Justus | Recognizing Cars (Review) | Vortrag |
14. Juni | Marc Hanheide, Ingo Lütkebohle | Wrap-Up "Identifikation" | |
21. Juni | Andre Lemme | Detecting Abnormal Gait (Review) | Vortrag |
21. Juni | Sebastian Konietzny | Human Activitiy Recognition From Video: modeling, feature selection and classification | |
28. Juni | Sascha Frey | Assessing the impact of CCTV (Review) | Vortrag |
12. Juli | Martin Höner | Videoüberwachung in Bielefeld (Review) | Vortrag |
12. Juli | Marc Hanheide, Ingo Lütkebohle | Abschlussdiskussion |