Clustering analysis of phonetic and text feature vectors ; Shlukování fonetických a textových charakteristik

التفاصيل البيبلوغرافية
العنوان: Clustering analysis of phonetic and text feature vectors ; Shlukování fonetických a textových charakteristik
المؤلفون: Jičínský, Milan, Marek, Jaroslav
بيانات النشر: IEEE (Institute of Electrical and Electronics Engineers)
سنة النشر: 2017
المجموعة: Digitální knihovna Univerzity Pardubice
مصطلحات موضوعية: cluster analysis, New Year’s Day speeches, President, feature vectors, voice analysis, energy, zero crossing rate, speech velocity, linguistics, phonetics, segmentation, frames, audio processing, speaker comparison, principal component analysis, shlukování, novoroční projevy, prezident, příznakový vektor, analýza hlasu, energie, počet průchodů nulou, rychlost řeči, lingvistika, fonetika, segmentace, zpracování zvuku, porovnání řečníků, metoda hlavních komponent
الوصف: Our goal is to show an example of using statistical methods to analyse some attributes of speeches. For this purpose, the New Year’s Day speeches of Czech and Czechoslovak presidents are chosen. The aim of our study is researching similarities among these speeches and their recognizability through the history of Czechoslovak politics. All presidents are compared between each other. The comparison method is based on principal component analysis and cluster analysis. Important part is creating a feature vector. The feature vector doesn't have to be the same for successful clustering. There are many varieties and combinations of features that can be selected and used. Correlated variables must be discarded. The most significant features are chosen to represent and characterize the speaker. Some speakers can have something in common according to the chosen features. Or on the other hand they can differ much more from others. This kind of approach can help us to recognize a speech pattern of each spokesman independently. ; Cílem článku je prezentovat využití statistických metod k analýze vlastností řeči a textu. Jako vhodné testovací soubory byly zvoleny novoroční projevy českých a československých prezidentů. V publikaci jsou hledány podobnosti mezi jednotlivými novoročními projevy. Zkoumá se rozpoznatelnost řečníků na základě několika textových a fonetických charakteristik. Srovnávací metoda je založena na analýze hlavních komponent a shlukování. Nejdůležitější částí celého procesu je ovšem vytvoření vhodného příznakového vektoru. Takový vektor může být vytvořen různými způsoby a jednotlivé kombinace parametrů mohou vést k různým výsledkům. Charakteristiky, které podléhají korelaci, nebudou pro analýzu použity. Celý výzkum tedy staví na tom, že někteří řečníci budou mít společné řečové charakteristiky a jiní se budou naopak velmi lišit. Tento přístup umožňuje rozeznávat společné a opakující se znaky jednotlivých řečníků.
نوع الوثيقة: conference object
وصف الملف: p. 146-151; application/pdf
اللغة: English
ردمك: 978-1-5386-0888-3
1-5386-0888-X
تدمد: 39880001
Relation: Proceeding of 2017 IEEE 14TH International Scientific Conference on Informatics; https://hdl.handle.net/10195/69854; 2-s2.0-85050617515
الاتاحة: https://hdl.handle.net/10195/69854
Rights: open access
رقم الانضمام: edsbas.EB9B2D0B
قاعدة البيانات: BASE
الوصف
ردمك:9781538608883
153860888X
تدمد:39880001