Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-25309
Titel: A category based approach for recognition of out-of-vocabulary words
VerfasserIn: Gallwitz, Florian
Nöth, Elmar
Niemann, Heinrich
Sprache: Englisch
Erscheinungsjahr: 1996
Kontrollierte Schlagwörter: Künstliche Intelligenz
Freie Schlagwörter: artificial intelligence
DDC-Sachgruppe: 004 Informatik
Dokumenttyp: Forschungsbericht (Report zu Forschungsprojekten)
Abstract: In almost all applications of automatic speech recognition, especially in spontaneous speech tasks, the recognizer vocabulary cannot cover all occurring words. There is always a significant amount of out-of-vocabulary words even when the vocabulary size is very large. In this paper we present a new approach for the integration of out-of-vocabulary words into statistical language models. We use category information for all words in the training corpus to define a function that gives an approximation of the out-of-vocabulary word emission probability for each word category. This information is integrated into the language models. Although we use a simple acoustic model for out-of-vocabulary words, we achieve a 6% reduction of word error rate on spontaneous speech data with about 5% out-of-vocabulary rate.
Link zu diesem Datensatz: urn:nbn:de:bsz:291-scidok-53252
hdl:20.500.11880/25365
http://dx.doi.org/10.22028/D291-25309
Schriftenreihe: Vm-Report / Verbmobil, Verbundvorhaben, [Deutsches Forschungszentrum für Künstliche Intelligenz]
Band: 132
Datum des Eintrags: 13-Jun-2013
Fakultät: SE - Sonstige Einrichtungen
Fachrichtung: SE - DFKI Deutsches Forschungszentrum für Künstliche Intelligenz
Sammlung:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:
Datei Beschreibung GrößeFormat 
report_132_96.pdf188,59 kBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.