Acoustic Blind Source Separation in Reverberant and Noisy Environments

Language
en
Document Type
Doctoral Thesis
Issue Date
2007-10-25
Issue Year
2007
Authors
Aichner, Robert
Editor
Abstract

In the last few years blind source separation techniques have received a great deal of attention in the signal processing community. One reason is that blind source separation approaches only rely on the assumption of mutual statistical independence of the source signals and do not need additional a-priori information, such as the sensor array geometry or the positions of the desired and interfering sources. Moreover, several separated point sources are retrieved simultaneously instead of extracting one desired source as common in beamforming. In this work we focus on acoustic signals and present several important special cases of a generic blind source separation framework which was termed TRINICON (TRIple-N Independent component analysis for CONvolutive mixtures). This framework is based on an information-theoretic criterion allowing to incorporate also higher-order statistics into the adaptation algorithms, which is in contrast to beamforming methods solely relying on second-order statistics. Moreover, this framework allows a unified view on convolutive blind source separation algorithms leading to novel algorithms and showing also relationships to popular state-of-the-art algorithms. After explaining the framework, we present some approximations which lead to highly efficient algorithms while still preserving the superior properties of the general framework relative to other known algorithms. A second major contribution is that, beyond existing blind source separation literature, we address the application of blind source separation to reverberant and noisy environments by presenting several pre- and post-processing techniques in a coherent treatment. The algorithms allow to maintain a high separation performance of the blind source separation algorithms also in noisy scenarios and additionally, are capable of suppressing the undesired diffuse background noise which cannot be treated by the convolutive blind source separation model. Experimental results demonstrate the applicability of the proposed approaches in real-world environments such as reverberant rooms, which may also exhibit background noise, and in the particularly significant case of noisy passenger compartments.

Abstract

In den letzten Jahren fanden blinde Quellentrennungsansätze große Beachtung in der Signalverarbeitungsgemeinde. Ein Grund dafür ist, dass blinde Quellentrennungsalgorithmen nur auf der Annahme statistischer Unabhängigkeit zwischen den Quellensignalen basieren und deshalb keine zusätzliche Vorinformation über die Geometrie der Sensorgruppe oder die Positionen der gewünschten Quellen und der Störquellen benötigen. Außerdem erhält man gleichzeitig mehrere getrennte Punktquellen anstatt nur eine gewünschte Punktquelle zu extrahieren, wie es bei Beamformern der Fall ist. In dieser Arbeit konzentrieren wir uns auf akustische Signale und präsentieren mehrere wichtige Spezialfälle eines allgemeinen blinden Quellentrennungskonzepts. Dieses Konzept wurde TRINICON (TRIple-N Independent component analysis for CONvolutive mixtures) genannt und basiert auf einem informationstheoretischen Kriterium, welches es erlaubt Statistik höherer Ordnung in die Adaptionsalgorithmen zu integrieren. Dies steht im Gegensatz zu Beamformer-Ansätzen, die lediglich auf Statistik zweiter Ordnung beruhen. Außerdem erlaubt dieses allgemeine Konzept eine vereinheitlichte Betrachtungsweise der blinden Quellentrennungsalgorithmen für Faltungsmixturen, ermöglicht die Herleitung neuer Algorithmen und zeigt außerdem Verbindungen zu bekannten Algorithmen aus der blinden Quellentrennungsliteratur. Nachdem wir dieses allgemeine Konzept erklärt haben, präsentieren wir einige Näherungen, welche zu höchst effizienten Algorithmen führen. Gleichzeitig werden jedoch, im Gegensatz zu anderen bekannten Algorithmen, die überlegenen Eigenschaften des allgemeinen Konzepts beibehalten. Ein zweiter Hauptbeitrag ist die in sich stimmige und über die existierende Literatur hinausgehende Betrachtung der Anwendung von blinder Quellentrennung auf verhallte und störbehaftete Umgebungen. Dies wird durch eine Erweiterung des allgemeinen Konzepts mit einigen Vor- und Nachverarbeitungsmethoden ermöglicht. Damit kann die hohe Trennungsleistung der blinden Quellentrennungsalgorithmen auch in störbehafteten Umgebungen erhalten werden. Zusätzlich erlauben diese Methoden auch eine Unterdrückung des unerwünschten Hintergrundrauschens, welches durch das zugrunde liegende Modell der blinden Quellentrennung für Faltungsmixturen nicht behandelt werden kann. Experimentelle Ergebnisse demonstrieren die Anwendbarkeit der vorgeschlagenen Ansätze in realistischen Umgebungen, wie z.B. in verhallten Räumen, welche zusätzlich Hintergrundgeräusche aufweisen können, und in dem praktisch besonders relevanten Fall von störbehafteten Kfz-Innenräumen.

DOI
Document's Licence
Faculties & Collections
Zugehörige ORCIDs