Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1416
Title: Análise dinâmica não linear de sinais de voz para detecção de patologias laríngeas.
Other Titles: Dynamic nonlinear analysis of voice signals for the detection of laryngeal pathologies.
???metadata.dc.creator???: COSTA, Washington César de Almeida.
???metadata.dc.contributor.advisor1???: AGUIAR NETO, Benedito Guimarães.
???metadata.dc.contributor.advisor2???: ASSIS, Francisco Marcos de.
???metadata.dc.contributor.referee1???: SILVA, Eduardo Antonio Barros da.
???metadata.dc.contributor.referee2???: ARAÚJO, Joseana Macêdo Fechine Regis de.
???metadata.dc.contributor.referee3???: COELHO, Rosângela Fernandes.
???metadata.dc.contributor.referee4???: BARRETO, Guilherme de Alencar.
???metadata.dc.contributor.referee5???: COSTA, Edson Guedes da.
Keywords: Doenças da voz e fala;Patologias da fala - detecção;Patologias laríngeas;Processamento de sinais de voz;Sinais de voz - análise;Processamento digital de sinais de voz;Speech signals;Análise não linear de sinais de voz;Laringe - doenças;Diagnóstico patologias vocais;Laryngeal pathologies.;Mecanismos de produção da fala;Edema de Reinke;Nódulos nas pregas vocais;Paralisia nas pregas vocais;Caos na voz;Expoentes de Lyapunov;Expoente de Hurst;Entropia de Tsallis;Entropia aproximada;Entropia de Shannon;Entropia de Rényi
Issue Date: 9-Nov-2012
Publisher: Universidade Federal de Campina Grande
Citation: COSTA, Washington César de Almeida. Análise dinâmica não linear de sinais de voz para detecção de patologias laríngeas. 2012. 178f. (Tese de Doutorado em Engenharia Elétrica), Programa de Pós-graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 2012.
???metadata.dc.description.resumo???: Patologias na laringe podem afetar a qualidade vocal, prejudicando a comunicação humana. As técnicas objetivas tradicionais para o diagnóstico dessas patologias fazem uso de exames considerados invasivos, causando certo desconforto ao paciente. Análise acústica, utilizando técnicas de processamento digital de sinais de voz, pode ser utilizada para o desenvolvimento de ferramentas não invasivas de auxílio ao diagnóstico de patologias laríngeas. A precisão do diagnóstico, contudo, depende da escolha das características e parâmetros da fala que melhor representem a desordem vocal provocada por uma determinada patologia. Este trabalho trata da caracterização e da classificação de sinais de vozes saudáveis e vozes afetadas por diferentes patologias laríngeas (edema, paralisia e nódulos nas pregas vocais), por meio da análise dinâmica não linear (e teoria do caos), como também por meio da análise de quantificação de recorrência. No processo de caracterização é investigado, por meio de testes estatísticos, o potencial de cada característica em discriminar os tipos de sinais de voz considerados. Para a classificação é empregada a técnica de análise discriminante com as funções linear ou quadrática, com validação cruzada, sendo considerado um intervalo de confiança de 95% para as médias das taxas de acuraria do classificador. A partir da combinação de características dos conjuntos das medidas de análise não linear (MNL) e das medidas de quantificação de recorrência (MQR), as médias da taxa de acurácia obtidas variaram nos intervalos de confiança: [95,44%; 100%) para a classificação entre vozes saudáveis e patológicas; [94,75%; 100%] entre vozes saudáveis e afetadas por edema, e entre saudáveis e nódulos. Para a classificação entre saudável e paralisia, obteve-se uma acurácia de 100% . Também são avaliados os efeitos do uso de vetores híbridos formados por características MNL, MQR e coeficientes extraídos da análise preditiva linear (LPC). Neste caso. as taxas de acurácia variaram nos intervalos de confiança: [95,02%; 97,62%] na discriminação entre vozes afetadas por paralisia e edema; [98,29%; 99,93%] para paralisia versus nódulos e [97,98%; 99,84%] para edema versus nódulos. Os resultados encontrados indicam que o método utilizado é promissor, podendo ser empregado no desenvolvimento de uma ferramenta computacional para apoio ao diagnóstico de patologias laríngeas.
Abstract: Laryngeal pathologies may affect the voice quality, harniing human communication. The traditional objective techniques for diagnosing these pathologies make use of exams, considered invasive, causing discomfort to the patient. Acoustic analysis, using digital speech signal processing techniques. can be used for the development of non-invasive tools in order to aid laryngeal diseases diagnosis. The accuracy of diagnosis, however. depends on the choice of parameters and the speech characteristics diat better represent the voice disorder caused by a given pathology. This work deals with the characterization and classification of healthy voice signals and voices affecied by different laryngeal diseases (edema, paralysis and vocal fold nodules), by means of nonlinear dynamic analysis (and chãos theory) as well as recurrence quantification analysis. In the characterization process, the potential of each feature is investigated to discriminate the types of voice signals considered, by means of statistical tests. For the classification, the technique of discriminam analysis is employed with linear or quadratic functions, with cross-validation. A 95% confidence levei was considered for the average of accuracy rates of the classifier performance. From the feature combination of the set of nonlinear analysis measures (MNL) and the quantification recurrence measures (MQR). the average of accuracy rates varied in the following confidence intervals: [95.44%; 100%] for healthy and pathologícal classification: [94.75%; 100%] between healdiy and edema voices, and also between healthy and nodules. The accuracy rate was 100% between healthy and paralysis. We also evaluated the effects of using hybrid vectors formed by MNL, MQR and linear predictive coding (LPC) coefficients. In this case, the accuracy rates ranged in the confidence intervals: [95.02%; 97.62%] in the paralysis versus edema voices discrimination; [98.29%; 99.93%] for paralysis versus nodules and [97.98%; 99.84%] for edema versus nodules. Obtained results indicate that the used method is promising and it can even be used to develop a computational tool to support diagnosis of laryngeal diseases.
Keywords: Doenças da voz e fala
Patologias da fala - detecção
Patologias laríngeas
Processamento de sinais de voz
Sinais de voz - análise
Processamento digital de sinais de voz
Speech signals
Análise não linear de sinais de voz
Laringe - doenças
Diagnóstico patologias vocais
Laryngeal pathologies.
Mecanismos de produção da fala
Edema de Reinke
Nódulos nas pregas vocais
Paralisia nas pregas vocais
Caos na voz
Expoentes de Lyapunov
Expoente de Hurst
Entropia de Tsallis
Entropia aproximada
Entropia de Shannon
Entropia de Rényi
???metadata.dc.subject.cnpq???: Ciência da Computação.
Fonoaudiologia.
Engenharia Elétrica.
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1416
Appears in Collections:Doutorado em Engenharia Elétrica.

Files in This Item:
File Description SizeFormat 
WASHINGTON CÉSAR DE ALMEIDA COSTA - TESE PPGEE 2012..pdfWashington César de Almeida Costa - Tese PPGEE 2012.6.31 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.