Ein Beitrag zur Entwicklung von Methoden zur Stereoanalyse und Bildsynthese im Anwendungskontext der Videokommunikation

This thesis contributes to the research area of stereo vision and view synthesis in the field of private video communication. During private video communication eye contact between the participants is typically lost due to the different placement of the camera and the video window. The goal of this thesis is to re-establish the eye contact by synthesizing of the view of a virtual camera such that the virtual camera faces towards the participant. The thesis firstly sketches the positive effect of eye contact in video communication. An in-depth review of mathematical foundations in the fields of stereo vision and view synthesis follows. On this foundation the thesis comprehensively covers the state of the art of image based rendering and particularly of eye-gaze correction via 3D-analysis and synthesis.In the first step of the method development the thesis establishes a model of quality factors which determines decisions about camera placement and recording system. Measurements with respect to synchronization and data storage are presented. Local and global algorithms for stereo vision are analyzed and adapted. The thesis contributes to the field of stereo vision algorithms by means of development and combination of different cost functions, consistency based inpainting, spatial and temporal smoothing and segmentation with respect to the use case of private video communication. Using the extracted disparity map, two approaches for view synthesis - trifocal transfer and 3D warping - are employed and extended. One important contribution of the thesis is a contour-based inpainting algorithm as well as point base image smoothing techniques. Two comprehensive subjective studies prove the assumption that eye contact can be re-established by the proposed system. They demonstrate the well perceived eye-contact as well as the significantly improved acceptance of quality due to the developed methods compared to the initial situation. The thesis finally discusses the results, followed by a qualitative comparison to the state of the art.

Die vorliegende Arbeit leistet einen Beitrag zum Forschungsbereich der Stereoanalyse und Bildsynthese im speziellen Kontext der privaten Videokommunikation. Bei der privaten Videokommunikation geht durch die unterschiedliche Positionierung der Kamera und des Videofensters typischerweise der Blickkontakt zwischen den Kommunikationsteilnehmern verloren. Ziel dieser Arbeit ist die Wiederherstellung des Blickkontaktes mittels der Synthese einer virtuellen Kameraansicht, die in Blickrichtung der Kommunizierenden ausgerichtet ist. Die Arbeit umreißt zunächst den positiven Einfluss des Blickkontaktes in der Videokommunikation. Anschließend wird eine tiefgehende Betrachtung der notwendigen technischen Grundlagen im Bereich Stereoanalyse und Bildsynthese durchgeführt. Aufbauend auf diesen Grundlagen wird der der Stand der Technik im Bereich des bildbasierten Renderings im Allgemeinen sowie der Blickkorrektur mittels 3D-Analyse und -synthese im Speziellen umfassend behandelt. Zunächst wird ein Modell von Qualitätsparametern entwickelt, welches die Entscheidungen hinsichtlich Kameraanordnung und Aufnahmesystem determiniert. Notwendige Messungen hinsichtlich Synchronizität und Datenspeicherung werden präsentiert. Im Bereich der Algorithmen der Stereoanalyse werden etablierte lokale und globale Algorithmen analysiert und adaptiert. Verschiedene Kostenmaße, konsistenzbasiertes Füllen, zeitliche und örtliche Glättung sowie eine abschließende Segmentierung werden hinsichtlich des konkreten Anwendungsfalls der Blickkorrektur in der privaten Videokommunikation entwickelt. Darauf aufbauend werden die beiden Syntheseverfahren des trifokalen Transfers sowie des 3D-Warpings weiter entwickelt. Ein wichtiger Beitrag der Arbeit ist ein konturbasiertes Füllverfahren sowie Maßnahmen im Bereich der Punktglättung. Zwei umfangreiche Experimente mit zahlreichen Probanden bestätigen die Korrektheit der Annahme, dass Blickkontakt durch das vorgestellte Verfahren hergestellt werden kann. Sie demonstrieren sowohl die sehr gute Wahrnehmung des Augenkontaktes als auch die signifikante Verbesserung der Akzeptanz und subjektiven Qualitätswahrnehmung durch die entwickelten Algorithmen im Vergleich zum Ausgangspunkt der Arbeit. Eine qualitativer Vergleich mit dem Stand der Technik und eine Diskussion der Ergebnisse, gepaart mit einem Ausblick in die Zukunft des behandelten Forschungsgebietes, schließen die Arbeit ab.

Zitieren

Zitierform:
Zitierform konnte nicht geladen werden.