Redução de ruído sonoro aplicada ao reconhecimento automático de voz.

Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/8156

Full metadata record

DC Field	Value	Language
dc.creator.ID	LIMA, I. A.	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/6865119422219899	pt_BR
dc.contributor.advisor1	ALENCAR, Marcelo Sampaio de.	-
dc.contributor.advisor1ID	ALENCAR, M.S.	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/0946722048975388	pt_BR
dc.contributor.referee1	VELOSO, Luciana Ribeiro.	-
dc.contributor.referee2	LOPES, Waslon Terllizzie Araújo.	-
dc.contributor.referee3	QUEIROZ, Wamberto José Lira de.	-
dc.description.resumo	Um dos principais problemas no desenvolvimento de filtros para sinais de voz é a avaliação do seu desempenho. Não é possível determinar o desempenho de uma técnica de tratamento de ruído sonoro apenas pela análise da SNR obtida, pois a qualidade do sinal filtrado está ligada à sua inteligibilidade. As avaliações subjetivas também não são conclusivas. Esta dissertação apresenta uma avaliação comparativa dos filtros com resposta finita ao impulso de Wiener ótimo e sub-ótimo, que permite a ponderação entre redução de ruído obtida e distorção inserida a partir do ajuste de um parâmetro , por meio da observação da taxa de acertos de um sistema de reconhecimento automático de voz (RAV). Os filtros implementados possuem ordem 20 e janela de análise de 20 ms (intervalo no qual o sinal de voz pode ser considerado estacionário). Para o filtro sub-ótimo foram usados = 0; 5, = 0; 7 e = 0; 8. Para o reconhecedor foi utilizado o decodificador de amplo vocabulário Julius, modelo acústico baseado em cadeias de Markov (Hidden Markov Models – HMMs) e modelo linguístico N-grama para o português brasileiro. Os testes foram realizados com 20 frases de locutores distintos, totalizando 146 palavras. Foram obtidos os percentuais de palavras reconhecidas corretamente para os sinais sem adição de ruído, e para ruído aditivo gaussiano branco com SNR de 20 dB, 15 dB, 10 dB, 5 dB, 3 dB e 0 dB. Para avaliar o efeito de distorção nos filtros implementados, os sinais obtidos pela filtragem dos arquivos de voz sem ruído são processados pelo reconhecedor, observando que a percentagem de acerto aumenta com a diminuição do parâmetro (o filtro de Wiener corresponde a = 1). A partir da análise dos resultados de reconhecimento para os diferentes valores de SNR se conclui que a aplicação do filtro sub-ótimo com = 0; 7 resulta na melhor taxa de acertos para o reconhecedor utilizado dentre os quatro filtros desenvolvidos quando o ruído é aditivo gaussiano branco. A melhoria observada foi de 10% para a menor SNR avaliada e de 14% para a maior SNR avaliada.	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Centro de Engenharia Elétrica e Informática - CEEI	pt_BR
dc.publisher.program	PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA	pt_BR
dc.publisher.initials	UFCG	pt_BR
dc.subject.cnpq	Engenharia Elétrica.	-
dc.title	Redução de ruído sonoro aplicada ao reconhecimento automático de voz.	pt_BR
dc.date.issued	2014-03-28	-
dc.description.abstract	One of the main problems in the development of filters for speech signals is performance evaluation. It is not possible to evaluate the technique only by the obtained SNR analysis, because the quality of the filtered signal is related to its intelligibility. Subjective evaluations are also not conclusive. This dissertation presents a comparative evaluation of finite impulse response Wiener optimal and sub-optimal filters, which allows weighting between noise reduction and distortion insertion by setting a parameter , through the observation of an automatic speech recognition (ASR) system error rate. The 20 order filters were implemented with analysis window of 20 ms (for which the speech signal can be considered stationary). A sub-optimal filter was tested, for = 0:5, alpha = 0:7 and = 0:8. The large vocabulary decoder Julius was chosen for the ASR system. Hidden Markov Models (HMMs) and N-gram language model for Brazilian Portuguese were used for acoustic and linguistic training. The tests were performed with 20 sentences from different speakers, totaling 146 words. The percentage of correctly recognized words for the clean speech signals, additive white Gaussian noise (AWGN) was obtained, for a SNR of 20 dB, 15 dB, 10 dB, 5 dB, 3 dB, 0 dB, and filtered signals. To evaluate the distortion effect caused by filtering, the filtered version of clean speech signals were processed by the recognizer, and it was observed that the error rate decreases with the reduction of the parameter (the Wiener filter corresponds to = 1). Based on the analysis of recognition results for different values of SNR, the application of sub-optimal filter, with = 0:7, produces the best recognition rate for a specified AWGN among the four designed filters. The observed improvement was 10% for the lowest SNR and 14% for the highest SNR evaluated.	pt_BR
dc.identifier.uri	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/8156	-
dc.date.accessioned	2019-10-16T20:01:46Z	-
dc.date.available	2019-10-16	-
dc.date.available	2019-10-16T20:01:46Z	-
dc.type	Dissertação	pt_BR
dc.subject	Processamento Digital de Sinais	-
dc.subject	Redução de Ruído	-
dc.subject	Reconhecimento de Voz	-
dc.subject	Avaliação Comparativa dos Filtros	-
dc.subject	Impulso de Wiener Ótimo e Sub-Ótimo	-
dc.subject	Sistema de Reconhecimento Automático de Voz (RAV)	-
dc.subject	Cadeias de Markov - Modelo Acústico	-
dc.subject	Modelo Linguístico N-Grama	-
dc.subject	Ruído Aditivo Gaussiano Branco	-
dc.subject	Hidden Markov Models (HMMs)	-
dc.subject	Digital Signal Processing	-
dc.subject	Noise Reduction	-
dc.subject	Voice Recognition	-
dc.subject	Comparative Evaluation of Filters	-
dc.subject	Wiener Impulse Great and Sub-Great	-
dc.subject	Automatic Voice Recognition System (RAV)	-
dc.subject	Markov Chains - Acoustic Model	-
dc.subject	Language Model N-Gram	-
dc.subject	White Gaussian Additive Noise	-
dc.rights	Acesso Aberto	pt_BR
dc.creator	LIMA, Ísis de Andrade.	-
dc.publisher	Universidade Federal de Campina Grande	pt_BR
dc.language	por	pt_BR
dc.title.alternative	Noise reduction applied automatic voice recognition.	pt_BR
dc.identifier.citation	LIMA, I.de A. Redução de ruído sonoro aplicada ao reconhecimento automático de voz. 2014. 103 f. (Dissertação de Mestrado em Engenharia Elétrica), Programa de Pós-Graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba Brasil, 2014.	pt_BR
Appears in Collections:	Mestrado em Engenharia Elétrica.

Files in This Item:

File	Description	Size	Format
ISIS DE ANDRADE LIMA - DISSERTAÇÃO PPGEE 2014.pdf	Isis de Andrade Lima - Dissertação PPGEE 2014	1.93 MB	Adobe PDF	View/Open

Show simple item record