Advances in blind multichannel Wiener filtering of noisy speech
- In the context of multichannel speech enhancement, the main contribution of this work is a novel two stage estimation technique for the spectral enhancement component of the multichannel Wiener filter, the so-called postfilter. In a first step, a simple statistical model of the microphone signals is presented and maximum-likelihood (ML) estimators for the speech and noise power spectral densities are derived to form an ML-based postfilter. In the second step, the ML-based postfilter itself is considered as a statistical quantity. Modeling its distribution in the form of a postfilter likelihood and proposing an a priori model of an ideal Wiener postfilter allows a Bayesian correction of the estimated postfilter values. This Bayesian refinement is implemented as an extension to the ML-based postfilter in the form of a lightweight pre-calculated look-up table.
- Im Umfeld der mehrkanaligen Sprachsignalverbesserung bildet den Kern der vorliegenden Arbeit ein neuartiges, zweistufiges Schätzverfahren für die Spektralverbesserung im mehrkanaligen Wiener-Filter, das sogenannte Postfilter. Im ersten Schritt wird ein einfaches statistisches Modell der Mikrofonsignale vorgestellt und maximum-likelihood (ML) optimale Schätzer für die Sprach- und Störsignalleistungsdichtespektren werden hergeleitet. Aus diesen ML-optimalen Schätzungen wird anschließend ein ML-basiertes Postfilter gebildet. Im zweiten Schritt wird das ML-basierte Postfilter selbst als statistische Größe aufgefasst. Die Modellierung seiner Verteilung in Form einer Postfilter-Likelihood und das Einführen einer A-priori-Verteilung des idealen Wiener-Postfilters ermöglichen eine Bayes’sche Korrektur der geschätzten Postfilter-Werte. Diese Bayes-Verfeinerung wird als Erweiterung des ML-basierten Postfilters in Form einer vorberechneten Nachschlagetabelle umgesetzt.
Author: | Philipp ThüneORCiDGND |
---|---|
URN: | urn:nbn:de:hbz:294-54999 |
Referee: | Gerald EnznerORCiDGND, Peter JaxGND |
Document Type: | Doctoral Thesis |
Language: | English |
Date of Publication (online): | 2017/12/16 |
Date of first Publication: | 2017/12/16 |
Publishing Institution: | Ruhr-Universität Bochum, Universitätsbibliothek |
Granting Institution: | Ruhr-Universität Bochum, Fakultät für Elektrotechnik und Informationstechnik |
Date of final exam: | 2017/11/07 |
Creating Corporation: | Fakultät für Elektrotechnik und Informationstechnik |
GND-Keyword: | Signalverarbeitung; Sprachverarbeitung; Geräuschminderung; Bayes-Inferenz; Akustische Signalverarbeitung |
Dewey Decimal Classification: | Technik, Medizin, angewandte Wissenschaften / Elektrotechnik, Elektronik |
Licence (German): | Keine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht |