Electronic Resource
Far-Field Speech Recognition
العنوان: | Far-Field Speech Recognition |
---|---|
المؤلفون: | Černocký, Jan, Malenovský, Vladimír, Žmolíková, Kateřina |
بيانات النشر: | Vysoké učení technické v Brně. Fakulta informačních technologií |
نوع الوثيقة: | Electronic Resource |
مستخلص: | Systémy rozpoznávání řeči v dnešní době dosahují poměrně vysoké úspěšnosti. V případě řeči, která je snímána vzdáleným mikrofonem a je tak narušena množstvím šumu a dozvukem (reverberací), je ale přesnost rozpoznávání značně zhoršena. Tento problém je možné zmírnit využitím mikrofonních polí. Tato práce se zabývá technikami, které umožňují kombinovat signály z více mikrofonů tak, aby byla zlepšena kvalita výsledného signálu a tedy i přesnost rozpoznávání. Práce nejprve shrnuje teorii rozpoznávání řeči a uvádí nejpoužívanější algoritmy pro zpracování mikrofonních polí. Následně jsou demonstrovány a analyzovány výsledky použití dvou metod pro beamforming a metody dereverberace vícekanálových signálů. Na závěr je vyzkoušen alternativní způsob beamformingu za použití neuronových sítí. The accuracy of speech recognition systems today is very high. However, when speech is captured by a far-field microphone, it can be severely distorted by noise and reverberation and the performance of speech recognition degrades significantly. One way to alleviate this problem is to use microphone arrays. This thesis addresses the methods of combining signals from multiple microphones to improve the quality of the signal and final speech recognition accuracy. It summarizes the theory of speech recognition and the most popular techniques for array processing. Afterwards, it demonstrates and analyzes the results obtained by two different methods for beamforming and a method for dereverberation of multichannel signals. Finally, it examines an alternative way of performing beamforming using neural networks. |
مصطلحات الفهرس: | rozpoznávání řeči, mikrofonní pole, beamforming, dereverberace, speech recognition, microphone arrays, dereverberation, Text |
URL: | |
الاتاحة: | Open access content. Open access content Standardní licenční smlouva - přístup k plnému textu bez omezení |
ملاحظة: | English |
Other Numbers: | CZBUT oai:https://dspace.vut.cz:11012/61823 ŽMOLÍKOVÁ, K. Far-Field Speech Recognition [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016. 96580 1426622063 |
المصدر المساهم: | BRNO UNIV OF TECHNOL From OAIster®, provided by the OCLC Cooperative. |
رقم الانضمام: | edsoai.on1426622063 |
قاعدة البيانات: | OAIster |
الوصف غير متاح. |