Dissertation/ Thesis

Escansão automática de versos em português

التفاصيل البيبلوغرافية
العنوان: Escansão automática de versos em português
المؤلفون: Mittmann, Adiel
Thesis Advisors: Universidade Federal de Santa Catarina, Wangenheim, Aldo v.
المصدر: Repositório Institucional da UFSCUniversidade Federal de Santa CatarinaUFSC.
Publication Status: publishedVersion
سنة النشر: 2016
المجموعة: IBICT Brazilian ETDs
Original Material: 345441
مصطلحات موضوعية: Computação, Processamento de palavras, Versificação
الوصف: Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2016.
Made available in DSpace on 2017-05-23T04:11:41Z (GMT). No. of bitstreams: 1 345441.pdf: 1702787 bytes, checksum: 51f063c1d010c581cc86f9b07d5993a4 (MD5) Previous issue date: 2016
Esta tese apresenta o Aoidos, um sistema capaz de escandir versos em português. Os versos passíveis de serem analisados pelo sistema são os métricos, aqueles para os quais o número de sílabas constitui uma característica fundamental. A partir de um poema, o sistema processa os versos palavra a palavra, encontrando sua sílaba tônica e realizando a divisão silábica. O sistema concatena então todas as palavras de um verso numa só unidade e obtém uma lista de possíveis pronúncias para o verso através da aplicação de diversas regras, realizando ou não fenômenos como sinéreses e sinalefas. As pronúncias encontradas para todos os versos de um poema são analisadas de forma conjunta para determinar a métrica do poema, ou seja, a quantidade de sílabas que cada um dos versos possui. Agrupando os versos de cada tamanho, o sistema encontra os padrões rítmicos e, dentre as pronúncias de cada verso, escolhe aquela que mais adere ao ritmo. Para validar o sistema, foram processados dez corpora compostos por autores diferentes e produzidos entre os séculos XVI e XX, somando mais de 100.000 versos. Através da conferência manual de 1.080 versos aleatoriamente selecionados (1% do total), averiguou-se que a taxa média de acerto do sistema foi de 99,0%, variando entre os corpora de 97,5 a 100,0%.
This thesis presents a system capable of scanning verses in Portuguese. The system aims to scan metrical verses, those for which the number of syllables is a fundamental feature. Given a poem, the system first processes individual words, finding the position of their stress and dividing them into syllables. Words are then concatenated and the system finds a list of possible pronunciations for each verse, using a set of rules in order to apply phenomena such as synaeresis or synaloepha. The set of pronunciations for all verses in the poem are analyzed together in order to determine the poem?s meter, that is, the number of syllables its verses should contain. By grouping together all verses of a given length, the system finds rhythmical patterns and chooses, for each verse, the pronunciation that most closely matches the pattern. In order to validate the system, it was applied to ten corpora, from different authors and whose production dates range from the 16th to the 20th century, for a total of more than 100,000 verses. By manually assessing the correctness of the scansion produced for 1.080 randomly selected verses (1% of the total), the accuracy rate was ascertained to be 99,0%, ranging from 97,5 to 100,0% among the different corpora.
Original Identifier: oai:repositorio.ufsc.br:123456789/175819
نوع الوثيقة: Doctoral Thesis
وصف الملف: 300 p.| il., grafs., tabs.
اللغة: Portuguese
الاتاحة: https://repositorio.ufsc.br/xmlui/handle/123456789/175819
Rights: info:eu-repo/semantics/openAccess
رقم الانضمام: edsndl.IBICT.oai.repositorio.ufsc.br.123456789.175819
قاعدة البيانات: Networked Digital Library of Theses & Dissertations