Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234
Title: Investigações do uso de deepfake audio com uma técnica de aumento de dados utilizados no treinamento de transcritores automáticos.
Other Titles: Investigations of the use of deepfake audio with a data augmentation technique used in the training of automatic transcribers.
???metadata.dc.creator???: FERREIRA, Alexandre Ribeiro.
???metadata.dc.contributor.advisor1???: CAMPELO, Cláudio Elízio Calazans.
???metadata.dc.contributor.referee1???: PIRES, Carlos Eduardo Santos.
???metadata.dc.contributor.referee2???: BRASILEIRO, Francisco Vilar.
Keywords: Deep fake audio;Transcritores automáticos;Clonagem de voz;Aumento de dados;Clonadores de audio;Deep fake audio;Automatic transcribers;Voice cloning;Data augmentation;Audio cloners
Issue Date: 2-Sep-2022
Publisher: Universidade Federal de Campina Grande
Citation: FERREIRA, Alexandre Ribeiro. Investigações do uso de deepfake audio com uma técnica de aumento de dados utilizados no treinamento de transcritores automáticos. 2022. 14f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234
???metadata.dc.description.resumo???: Para o treinamento de modelos transcritores que produzam resultados robustos, são necessários dados rotulados em grande quantidade e diversificados. Encontrar tais dados com as características necessárias é uma tarefa difícil, principalmente em idiomas menos populares do que o inglês. Além disso, produzir tais dados requer bastante esforço, tempo e, quase sempre, dinheiro. Logo, uma estratégia para mitigar esse problema é a utilização de técnicas de aumento de dados. Nesse trabalho, foi investigada a utilização de deepfake audio para o aumento de dados, utilizando um clonador de voz capaz de gerar novos áudios mantendo características da voz do falante original, como, por exemplo, o sotaque. Para tanto, foi selecionado um pequeno conjunto de dados produzido por indianos no idioma inglês, garantindo a presença de apenas um sotaque no conjunto. Para a realização das investigações, experimentos foram conduzidos utilizando o clonador para o aumento de dados. Em seguida, os dados aumentados foram utilizados no treinamento dos transcritores, em diversos cenários. Surpreendentemente, a estratégia não teve um impacto positivo após a realização dos treinamentos, tendo como possível causa a qualidade dos áudios gerados pelos clonadores atuais.
Keywords: Deep fake audio
Transcritores automáticos
Clonagem de voz
Aumento de dados
Clonadores de audio
Deep fake audio
Automatic transcribers
Voice cloning
Data augmentation
Audio cloners
???metadata.dc.subject.cnpq???: Ciência da Computação.
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234
Appears in Collections:Trabalho de Conclusão de Curso - Artigo - Ciência da Computação

Files in This Item:
File Description SizeFormat 
ALEXANDRE RIBEIRO FERREIRA - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2022.pdfAlexandre Ribeiro Ferreira - TCC Artigo Ciência da Computação CEEI 2022.475.67 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.