Electronic Resource

Analýza entit v psychoterapeutických sezeních

التفاصيل البيبلوغرافية
العنوان: Analýza entit v psychoterapeutických sezeních
المؤلفون: Matějka, Pavel, Karafiát, Martin, Polok, Alexander
بيانات النشر: Vysoké učení technické v Brně. Fakulta informačních technologií
نوع الوثيقة: Electronic Resource
مستخلص: Tato práce se zabývá analýzou psychoterapeutických sezení v rámci výzkumného projektu DeePsy. Jejím cílem je navrhnout a vytvořit sadu příznaků modelujících průběh sezení, jež mohou odhalit na první pohled nepatrné nuance. Zmíněné příznaky jsou automaticky extrahovány ze zdrojové nahrávky s využitím hlubokých neuronových sítí. Příznaky jsou zpracovány, porovnány napříč sezeními a graficky zobrazeny, čímž vzniká dokument plnící roli zpětné vazby o sezení pro terapeuta. Tato zpětná vazba může posloužit k profesnímu růstu a kvalitnější psychoterapii v budoucnu. Bylo dosaženo relativního zlepšení detekce řečové aktivity o 37,82 %. Byl zobecněn diarizační systém VBx ke konvergenci ke dvěma mluvčím s minimálním relativním zhoršením chybovosti o 0,66 %. Byl natrénován systém pro automatické rozpoznávání řeči, jehož chybovost je o 17,06 % relativně lepší než nejlepší dostupný hybridní model. Dále byly natrénovány systémy pro klasifikaci sentimentu, typu terapeutických intervencí a detekci překrývající se řeči.
This work focuses on analyzing psychotherapy sessions within the DeePsy research project. This work aims to design and develop features that model the session dynamics, which can reveal seemingly subtle nuances. The mentioned features are automatically extracted from the source recording using neural networks. They are further processed, compared across sessions, and displayed graphically, creating a document that acts as a feedback document about the session for the therapist. Furthermore, this assistive tool can help therapists to professionally grow and to provide better psychotherapy in the future. A relative improvement in voice activity detection of 37.82% was achieved. The VBx diarization system was generalized to converge to two speakers with a minimum relative error rate degradation of 0.66%. An automatic speech recognition system has been trained with a 17.06% relative improvement over the best available hybrid model. Models for sentiment classification, type of therapeutic interventions, and overlapping speech detection were also trained.
مصطلحات الفهرس: strojové učení, analýza psychoterapeutických sezení, zpracování přirozeného jazyka, zpracování řeči, rozpoznávání řeči, detekce sentimentu, detekce klíčových slov, sumarizace, klasifikace terapeutických intervencí, překrývající se řeč, jazykové modely, transformery, neuronové sítě, wav2vec 2.0, whisper, hovorový jazyk, diarizace, učení s vlastním dozorem, kontrastivní učení, machine learning, psychotherapy session analysis, natural language processing, speech processing, speech recognition, sentiment detection, keyword detection, summarization, therapeutic interventions classification, overlapping speech, language models, transformers, neural networks, colloquial language, diarization, self-supervised learning, contrastive learning, Text
URL: http://hdl.handle.net/11012/211922
الاتاحة: Open access content. Open access content
Standardní licenční smlouva - přístup k plnému textu bez omezení
ملاحظة: Czech
Other Numbers: CZBUT oai:https://dspace.vut.cz:11012/211922
POLOK, A. Analýza entit v psychoterapeutických sezeních [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.
144979
1426650266
المصدر المساهم: BRNO UNIV OF TECHNOL
From OAIster®, provided by the OCLC Cooperative.
رقم الانضمام: edsoai.on1426650266
قاعدة البيانات: OAIster