Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352
Title: Sistema semiautomático de reconhecimento de identidade vocal forense.
Other Titles: Semiautomatic forensic vocal identity recognition system.
???metadata.dc.creator???: MOREIRA, Danilo Coura.
???metadata.dc.contributor.advisor1???: ARAÚJO, Joseana Macêdo Fechine Régis de.
Keywords: Fonética Forense;Identificação de Locutor;Características Vocais;Reconhecimento Semiautomático da Identidade Vocal;Ambiente Telefônico;Investigações Criminais;coeficientes mel-cepstrais (MFCC);modelo de misturas gaussianas (GMM);Forensic Phonetics;Speaker Identification;Vocal Characteristics;Semiautomatic Recognition of Vocal Identity;Telephone Environment;Criminal Investigations;Honey-cepstral Coefficients (MFCC);Model of Gaussian Mixtures (GMM)
Issue Date: Sep-2013
Publisher: Universidade Federal de Campina Grande
Citation: MOREIRA, Danilo Coura. Sistema semiautomático de reconhecimento de identidade vocal forense. 2013. 151f. (Dissertação) Mestrado em Ciência da Computação, Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352
???metadata.dc.description.resumo???: Devido ao desenvolvimento das redes de telefonia, o uso deste meio como auxílio para os criminosos cometerem seus delitos é cada vez mais frequente. Baseado, então, na possibilidade de individualizar uma pessoa a partir de suas características vocais, nesta pesquisa propõe-se utilizar técnicas para o reconhecimento semiautomático da identidade vocal de locutores em ambiente telefônico, buscando auxiliar as investigações criminais, direcionando a imputação de autoria de uma voz e, portanto, servindo como meio de prova, na área forense. Para tanto, são utilizada a remoção do nível DC, a detecção de atividade vocal, a subtração spectral, a normalização e a préênfase como técnicas para o pré-processamento do sinal de voz, visando a minimizar os efeitos negativos que o ambiente telefônico oferece às elocuções transmitidas por este meio reduzindo, assim, os erros na extração das características e, posteriormente, na criação dos padrões de cada locutor. Visando à eficiência no processamento e à robustez ao ruído, em relação a outros métodos de extração de características, foram utilizados coeficientes mel-cepstrais (MFCC) para este fim. Para a criação e a classificação dos padrões dos locutores, utilizou-se o modelo de misturas gaussianas (GMM), por proporcionar resultados melhores quando não há dependência de texto, dado que os locutores são não colaborativos. Visando a encontrar a melhor configuração de parâmetros para o sistema semiautomático, foram realizados experimentos considerando um sistema automático de reconhecimento de identidade vocal. Desta forma, foi obtida uma taxa de identificação de até 87,80%, com nível de confiança de 98%. Por fim, o sistema semiautomático de reconhecimento de identidade vocal atingiu a probabilidade de 99,95% de que determinada elocução pertença a um locutor, dentre um conjunto de 30 suspeitos, utilizando um nível de confiança de 98%. Desta forma, a técnica proposta possibilitou fornecer, com uma taxa de acerto próxima a 100%, um subconjunto de locutores suspeitos para posterior análise pericial.
Abstract: Due to the development of telephone networks, the use of this environment to support criminals to commit crimes is increasingly common. Based, then, on the possibility of individualizing one person from their vocal characteristics, this work proposes using techniques for the semiautomatic vocal identity recognition of speakers in telephone environment, aiming help in criminal investigations, directing the attribution of voice authorship and, thus, suiting as evidence in forensic. For that purpose, are used DC offset, vocal detector activity, spectral subtraction, normalization and pre-emphasis such as pre-processing techniques of speech signal, which aim to minimize the negative effects that provides the telephone environment utterances transmitted by these means, reducing the errors in feature extraction and subsequently, in the patterns creation of each speaker. In order to optimize the processing efficiency and robustness to noise compared to other methods for feature extraction, Mel-Frequency Cepstral Coefficients (MFCC) was employed. To create the speakers patterns and classification, it was used the Gaussian Mixture Model (GMM), because provide better results when there is no dependence of text, due to the speakers are non-cooperative. Aiming at finding the best parameter setting for the semi-automatic system, experiments were performed considering an automatic vocal identity recognition system. In this way, it was possible reach to correct identification rate of up to 87.80%, with a confidence level of 98%. Lastly, the semiautomatic speaker identification system reached the probability of 99.95% that a given utterance belongs to a given speaker from a set of 30 suspects, using a confidence level of 98%. Thus, the proposed technique has enabled to provide, with a tax rate close to 100%, a subset of speakers suspects for subsequent forensic analysis.
Keywords: Fonética Forense
Identificação de Locutor
Características Vocais
Reconhecimento Semiautomático da Identidade Vocal
Ambiente Telefônico
Investigações Criminais
coeficientes mel-cepstrais (MFCC)
modelo de misturas gaussianas (GMM)
Forensic Phonetics
Speaker Identification
Vocal Characteristics
Semiautomatic Recognition of Vocal Identity
Telephone Environment
Criminal Investigations
Honey-cepstral Coefficients (MFCC)
Model of Gaussian Mixtures (GMM)
???metadata.dc.subject.cnpq???: Ciência da Computação
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352
Appears in Collections:Mestrado em Ciência da Computação.

Files in This Item:
File Description SizeFormat 
DANILO COURA MOREIRA - DISSERTAÇÃO PPGCC 2013.pdfDanilo Coura Moreira - Dissertação PPGCC 2013. 1.69 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.