Zusammenfassung
Bei der ortsungebundenen Spracheingabe in Räumen müssen Nachhall und stationäre Störungen kompensiert werden. Hierfür wird ein derart gestörtes Sprachsignal zunächst mit einer gehörgerechten Spektraltransformation analysiert. Die daraus resultierenden spektralen Teilbänder werden anschließend mit einem Modell der invertierten Modulationsübertragungsfunktion des Raumes gefiltert, der den Nachhall verursacht. Diese Funktion, die nur einmal bestimmt werden muß und für alle Positionen im Raum gilt, kann mit einer Least-Squares-Abschätzung berechnet werden. Durch eine zusätzliche Hochpaßfilterung in den spektralen Teilbändern lassen sich auch stationäre Störungen unterdrücken. Die Wirksamkeit des Verfahrens wird anhand von Erkennungsraten eines automatischen Spracherkenners gezeigt: abhängig von der Störsituation, erhöht sich die Erkennungsrate um bis zu 30%.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Similar content being viewed by others
Literatur
CCITT IXth Plenary Assembly–Document 7, Study Group XII, Report R 25, Document AP IX-7-E, Melbourne, 1988, S. 37–50.
Heinbach, W.: „Aurally Adequate Signal Representation: The Part-Tone-Time-Pattern.“ Acustica 67, 1988, S. 113–121.
Hirsch, H. G.; Finster, H.: „The Reduction of Reverberation to Improve Automatic Speech Recognition in Rooms“, 7th FASE Symposium, Proc. Speech ‘88, Edinburgh, 1988, S. 913–919.
Höge, H.: „ SPICOS II–A Speech Understanding Dialogue System“, Proc. of the Internatinal Conference on Spoken Language Processing, Kobe, 1990, S. 1313–1316.
Houtgast, T.; Steeneken, H. J. M.; Plomp R.: „Predicting Speech Intelligibility in Rooms from the Modulation Transfer Function“ Acustica 46, 1980, S. 60–72.
Littel, B.: „Ein sprachverstehendes Dialogsystem zur Datenbankabfrage“, Informatik Fachberichte 254, Springer-Verlag, Heidelberg, 1990, S. 166–170.
Schröder, M. R.: „Integrated Impulse Method Measuring Sound Decay without Using Impulses“, JASA 66 (2), 1979, S. 497–500.
Schlang, M. F.: „An Auditory Based Approach for Echo Compensation with Modulation Filtering“, European Conference on Speech Communication and Technology, Proc. Eurospeech 2, Paris, 1989, S. 661–664.
Schlang, M. F.:„Ein automatisch gesteuertes Mikrofonarray für Freisprecheinrichtungen“, Informatik Fachberichte 254, Springer-Verlag, Heidelberg, 1990, S. 158–165.
Schlang, M. F.: „Ein gehörbezogenes Verfahren zur Verminderung von Nachhall und stationären Störungen mit Hilfe einer Modulationsfilterung“, Fortschritte der Akustik -DAGA’90, Bad Honnef: DPG-GmbH, 1990, S. 1063–1066.
Schlang, M. F.; Mummert, M.: „Die Bedeutung der Fensterfunktion für die Fourier-t-Transformation als gehörgerechte Spektralanalyse“, Fortschritte der Akustik–DAGA ‘80, Bad Honnef: DPG-GmbH, 1990, S. 1043–1046.
Schlang, M. F.: „Methoden zur Störschallunterdrückung bei ortsungebundener Spracheingabe“, Dissertation, Techn. Univ. München, 1991, in Vorbereitung.
Terhardt, E.: „Fourier Transformation of Time Signals: Conceptual Revision“, Acustica 57, 1985, S. 242–256.
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 1991 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Schlang, M.F. (1991). Nachhall- und Störunterdrückung durch Filterung der spektralen Einhüllenden. In: Radig, B. (eds) Mustererkennung 1991. Informatik-Fachberichte, vol 290. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-08896-8_33
Download citation
DOI: https://doi.org/10.1007/978-3-662-08896-8_33
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-54597-2
Online ISBN: 978-3-662-08896-8
eBook Packages: Springer Book Archive