Conference
Clustering analysis of phonetic and text feature vectors ; Shlukování fonetických a textových charakteristik
العنوان: | Clustering analysis of phonetic and text feature vectors ; Shlukování fonetických a textových charakteristik |
---|---|
المؤلفون: | Jičínský, Milan, Marek, Jaroslav |
بيانات النشر: | IEEE (Institute of Electrical and Electronics Engineers) |
سنة النشر: | 2017 |
المجموعة: | Digitální knihovna Univerzity Pardubice |
مصطلحات موضوعية: | cluster analysis, New Year’s Day speeches, President, feature vectors, voice analysis, energy, zero crossing rate, speech velocity, linguistics, phonetics, segmentation, frames, audio processing, speaker comparison, principal component analysis, shlukování, novoroční projevy, prezident, příznakový vektor, analýza hlasu, energie, počet průchodů nulou, rychlost řeči, lingvistika, fonetika, segmentace, zpracování zvuku, porovnání řečníků, metoda hlavních komponent |
الوصف: | Our goal is to show an example of using statistical methods to analyse some attributes of speeches. For this purpose, the New Year’s Day speeches of Czech and Czechoslovak presidents are chosen. The aim of our study is researching similarities among these speeches and their recognizability through the history of Czechoslovak politics. All presidents are compared between each other. The comparison method is based on principal component analysis and cluster analysis. Important part is creating a feature vector. The feature vector doesn't have to be the same for successful clustering. There are many varieties and combinations of features that can be selected and used. Correlated variables must be discarded. The most significant features are chosen to represent and characterize the speaker. Some speakers can have something in common according to the chosen features. Or on the other hand they can differ much more from others. This kind of approach can help us to recognize a speech pattern of each spokesman independently. ; Cílem článku je prezentovat využití statistických metod k analýze vlastností řeči a textu. Jako vhodné testovací soubory byly zvoleny novoroční projevy českých a československých prezidentů. V publikaci jsou hledány podobnosti mezi jednotlivými novoročními projevy. Zkoumá se rozpoznatelnost řečníků na základě několika textových a fonetických charakteristik. Srovnávací metoda je založena na analýze hlavních komponent a shlukování. Nejdůležitější částí celého procesu je ovšem vytvoření vhodného příznakového vektoru. Takový vektor může být vytvořen různými způsoby a jednotlivé kombinace parametrů mohou vést k různým výsledkům. Charakteristiky, které podléhají korelaci, nebudou pro analýzu použity. Celý výzkum tedy staví na tom, že někteří řečníci budou mít společné řečové charakteristiky a jiní se budou naopak velmi lišit. Tento přístup umožňuje rozeznávat společné a opakující se znaky jednotlivých řečníků. |
نوع الوثيقة: | conference object |
وصف الملف: | p. 146-151; application/pdf |
اللغة: | English |
ردمك: | 978-1-5386-0888-3 1-5386-0888-X |
تدمد: | 39880001 |
Relation: | Proceeding of 2017 IEEE 14TH International Scientific Conference on Informatics; https://hdl.handle.net/10195/69854; 2-s2.0-85050617515 |
الاتاحة: | https://hdl.handle.net/10195/69854 |
Rights: | open access |
رقم الانضمام: | edsbas.EB9B2D0B |
قاعدة البيانات: | BASE |
ردمك: | 9781538608883 153860888X |
---|---|
تدمد: | 39880001 |