Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.

Página inicial
→
Campus Campina Grande | Centro de Engenharia Elétrica e Informática - CEEI
→
PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
→
Mestrado em Engenharia Elétrica.
→
Ver item

dc.creator.ID	ROCHA, R. B.	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/0884771058471411	pt_BR
dc.contributor.advisor1	ALENCAR, Marcelo Sampaio de.
dc.contributor.advisor1ID	ALENCAR, M. S.	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/0946722048975388	pt_BR
dc.contributor.referee1	LOPES, Waslon Terlizzie Araújo.
dc.contributor.referee2	BERNARDINO JÚNIOR, Francisco Madeiro.
dc.contributor.referee3	VELOSO, Luciana Ribeiro.
dc.description.resumo	Esta dissertação apresenta o desenvolvimento de um codificador de voz que tem como principal característica a transmissão do sinal de voz com baixas taxas de bits. Desenvolvido principalmente para ser utilizado em sistemas móveis celulares, o codificador proposto é do tipo fonético, que entre as técnicas de codificação de sinais de fala é a que permite obter menor taxa de transmissão. Sua implementação está dividida no desenvolvimento do emissor e receptor. No emissor, os sinais de fala são segmentados por meio de um reconhecedor de fonemas que utiliza Modelos de Markov Escondidos (HMMs) para modelar o sinal de voz. A cada fonema é atribuído um índice préestabelecido e sua duração e energia são estimados. A informação transmitida ao receptor consiste no índice, energia e duração de cada fonema. Deste modo, o codificador consegue uma redução na taxa de transmissão do sinal de voz. O receptor é constituído em duas etapas. Na primeira, cada usuário do codificador tem que construir um banco de unidades acústicas por meio da pronúncia de frases pré-estabelecidas. Na segunda etapa, é realizada a síntese por concatenação de segmentos como sílabas, fonemas e encontros vocálicos. Para avaliar o desempenho do codificador foi realizado um teste subjetivo informal baseado no teste ACR (Absolute Category Rating). Duas avaliações foram feitas. A primeira utiliza segmentação automática no emissor e receptor e o codificador permitiu a transmissão do sinal de voz com uma taxa de, no máximo, 150 bits/s. Os resultados da qualidade dos sinais de voz indicam que os avaliadores classificam a maioria deles como de razoável a boa. Na segunda avaliação, a segmentação utilizada para formar o banco de unidades acústicas foi realizada de forma manual. Sessenta e dois ouvintes-avaliadores foram questionados a respeito da inteligibilidade e qualidade dos sinais de voz. Os sinais de voz foram codificados com 125 bits/s e a maior parte deles apresentaram bons níveis de inteligibilidade e foram considerados sinais de fala de qualidade razoável.	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Centro de Engenharia Elétrica e Informática - CEEI	pt_BR
dc.publisher.program	PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA	pt_BR
dc.publisher.initials	UFCG	pt_BR
dc.subject.cnpq	Engenharia Elétrica
dc.title	Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.	pt_BR
dc.date.issued	2012-07-27
dc.description.abstract	This dissertation presents the development of a voice encoder which has the transmission of voice signals with low bitrates as its main feature. Developed mainly for utilization in mobile cellular systems, the proposed encoder uses the phonetic coding technique, which provides the lowest transmission rate. Its implementation is divided into the development of the emitter and the receiver. In the emitter, the speech signals are segmented by a phoneme recognizer which utilizes Hidden Markov Models (HMMs) to model the voice signal. A pre-established index is assigned to each phoneme and its duration and energy are estimated. The information transmitted to the receiver consists of the index, energy and duration of each phoneme. This way the encoder achieves a reduction in the voice signal transmission rate. The receiver is constituted in two steps. In the first, each encoder user has to build an acoustic unit bank by pronunciation of pre-established phrases. The second step is a synthesis by concatenation of segments as syllables, phonemes and vowel meetings. To evaluate the performance of the encoder, an informal subjective test based on the ACR (Absolute Category Rating) test was used. Two evaluations were done. The first used automatic segmentation in the emitter and receiver, and the encoder allowed transmission of the voice signal with a rate of up to 150 bits/s. The results of the voice signal quality indicate that the evaluators classified most of the samples as average to good. In the second evaluation the segmentation used to form the acoustic unit bank was done manually. Sixty-two listening evaluators were questioned about the intelligibility and quality of the speech signals. The voice signals were coded using 125 bits/s, and most of them presented good levels of intelligibility and reasonable quality.	pt_BR
dc.identifier.uri	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/8165
dc.date.accessioned	2019-10-17T10:08:42Z
dc.date.available	2019-10-17
dc.date.available	2019-10-17T10:08:42Z
dc.type	Dissertação	pt_BR
dc.subject	Codificação de Voz
dc.subject	Codificação Fonética
dc.subject	Taxa de Transmissão
dc.subject	Reconhecimento de Fonemas
dc.subject	Taxa de Bits
dc.subject	Qualidade de Sinal Reconstruído
dc.subject	Complexidade
dc.subject	Retardo de Comunicação
dc.subject	Sensibilidade aos Erros de Canal
dc.subject	Voice Encoding
dc.subject	Phonetic Coding
dc.subject	Transmission Rate
dc.subject	Phoneme Recognition
dc.subject	Bit Rate
dc.subject	Rebuilt Signal Quality
dc.subject	Complexity
dc.subject	Communication Delay
dc.subject	Sensitivity to Channel Error
dc.rights	Acesso Aberto	pt_BR
dc.creator	ROCHA, Raíssa Bezerra.
dc.publisher	Universidade Federal de Campina Grande	pt_BR
dc.language	por	pt_BR
dc.title.alternative	Development of a low rate personal voice coder based on hidden Markov models.	pt_BR
dc.identifier.citation	ROCHA, Raissa Bezerra. Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos. 2012. 129f. (Dissertação) Mestrado em Engenharia Elétrica, Programa de Pós-Graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Campina Grande - Paraíba - Brasil, 2012.	pt_BR