Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2500
Title: Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas.
Other Titles: Speech recognition using hidden Markov models (HMM's) of continuous densities.
???metadata.dc.creator???: COSTA, Washington César de Almeida.
???metadata.dc.contributor.advisor1???: AGUIAR NETO, Benedito Guimarães.
???metadata.dc.contributor.advisor2???: BRASILEIRO, Marcos Antônio Gonçalves.
???metadata.dc.contributor.referee1???: PEQUENO, Mauro Cavalcante.
???metadata.dc.contributor.referee2???: ALENCAR, Marcelo Sampaio de.
Keywords: Processamento Digital de Voz;Reconhecimento de Voz;Fala - Reconhecimento;Densidades Contínuas;Fala Contínua - Reconhecimento;Modelos de Markov Escondidos - HMM'S;Sistema de Reconhecimento de Fala;Modelagem da Voz;Modelagem Computacional;HMM's - Cinco Estados e FDP's Contínuas;Coeficientes Cepstrais;Logaritmo da Energia Segmental;Algoritmo de Baum-Welch;Algoritmo de Viterbi;Reconhecimento Independente do Locutor;Reconhecimento Dependente do Locutor;Voice Modeling;Processamento de Sinais de Voz;Voice Recognition;Speech Recognition System;Processing of Voice Signals
Issue Date: 20-Jun-1994
Publisher: Universidade Federal de Campina Grande
Citation: COSTA, W. C. de A. Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas. 103 f. 1994. (Dissertação de Mestrado em Engenharia Elétrica), Programa de Pós-graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 1994.
???metadata.dc.description.resumo???: Nesta dissertação é realizado um estudo teórico e a implementação em software de um sistema de reconhecimento de fala baseado em Modelos de Markov Escondidos (Hidden Markov Models - HMM's). HMM é uma ferramenta matemática que possibilita um modelamento dos sons da fala em termos de uma estrutura probabilística. Para tanto, utiliza-se, neste trabalho, HMM's do tipo left-right de cinco estados e fdp's contínuas, para representar a probabilidade dos vetores de observações em cada estado da cadeia de Markov. Os vetores de observações, de dimensão nove, são formados por oito coeficientes cepstrais e o logaritmo da energia segmentai como o nono parâmetro. O sistema H MM é composto de duas etapas: treinamento e classificação. Na fase de treinamento, o algoritmo de Baum-Welch é utilizado para reestimar os valores finais dos modelos. Por outro lado, na fase de classificação, utiliza-se o algoritmo de Viterbi para fornecer o valor da máxima verossimilhança entre a sentença de teste e os HMM's de referência. A avaliação do sistema proposto é realizada considerando-se dois diferentes modos de reconhecimento: o reconhecimento independente do locutor e o reconhecimento dependente do locutor. Em ambos os casos, especialmente para o modo de reconhecimento dependente do locutor, as avaliações realizadas levam a resultados bastante satisfatórios, considerando-se as condições gerais de experimentação. Além disso, várias conclusões importantes são obtidas para uma posterior otimização do sistema proposto. Finalmente, espera-se que este trabalho contribua de forma positiva para a motivação de novos estudos no campo da comunicação vocal homem-máquina.
Abstract: This dissertation presents a theoretical study and the software implementation of a speech recognition system, based on Hidden Markov Models (HMM's). HMM is a mathematical tool that makes it possible modeling of the speech sounds in terms of a probabilistic structure. In order to do this, use is made in this work of HMM's of the left-right type with five states and continuous fdp's, to represent the observation vectors probability on each state of the Markov chain. The observation vectors, which are nine-dimensional, are formed by eight cepstral coefficients and the logarithm of the segmentai energy as the nineth parameter. The HMM system is divided into two stages: training and classification. In the training stage, the Baum-Welch algorithm is used to reestimate the final values of the models. On the other hand, the classification stage makes use of the Viterbi algorithm to provide the maximum-likelihood value between the test sentence and the reference HMM's. The evaluation of the proposed system is made considering two different types of voice recognition: the independent speaker recognition and the dependent speaker recognition. In both cases, specially on the speaker dependent mode, the avaluation made given results really satisfactory, account to experimenting general conditions. In addition, some important conclusions are obtained in order to provide a posterior optimization on the proposed system. Finally, i t is expected that this work contributes in a positive way for the motivation of new studies on man-machine voice communication.
Keywords: Processamento Digital de Voz
Reconhecimento de Voz
Fala - Reconhecimento
Densidades Contínuas
Fala Contínua - Reconhecimento
Modelos de Markov Escondidos - HMM'S
Sistema de Reconhecimento de Fala
Modelagem da Voz
Modelagem Computacional
HMM's - Cinco Estados e FDP's Contínuas
Coeficientes Cepstrais
Logaritmo da Energia Segmental
Algoritmo de Baum-Welch
Algoritmo de Viterbi
Reconhecimento Independente do Locutor
Reconhecimento Dependente do Locutor
Voice Modeling
Processamento de Sinais de Voz
Voice Recognition
Speech Recognition System
Processing of Voice Signals
???metadata.dc.subject.cnpq???: Ciência da Computação.
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2500
Appears in Collections:Mestrado em Engenharia Elétrica.

Files in This Item:
File Description SizeFormat 
WASHINGTON CÉSAR DE ALMEIDA COSTA - DISSERTAÇÃO PPGEE 1994.pdfWashington César de Almeida Costa - Dissertação PPGEE 199414.32 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.