DSpace/Manakin Repository

Investigações do uso de deepfake audio com uma técnica de aumento de dados utilizados no treinamento de transcritores automáticos.

Mostrar registro simples

dc.creator.ID FERREIRA, A. R. pt_BR
dc.creator.Lattes http://lattes.cnpq.br/1680458957826582 pt_BR
dc.contributor.advisor1 CAMPELO, Cláudio Elízio Calazans.
dc.contributor.advisor1ID CAMPELO, C. E. C. pt_BR
dc.contributor.advisor1Lattes http://lattes.cnpq.br/2042247762832979 pt_BR
dc.contributor.referee1 PIRES, Carlos Eduardo Santos.
dc.contributor.referee2 BRASILEIRO, Francisco Vilar.
dc.description.resumo Para o treinamento de modelos transcritores que produzam resultados robustos, são necessários dados rotulados em grande quantidade e diversificados. Encontrar tais dados com as características necessárias é uma tarefa difícil, principalmente em idiomas menos populares do que o inglês. Além disso, produzir tais dados requer bastante esforço, tempo e, quase sempre, dinheiro. Logo, uma estratégia para mitigar esse problema é a utilização de técnicas de aumento de dados. Nesse trabalho, foi investigada a utilização de deepfake audio para o aumento de dados, utilizando um clonador de voz capaz de gerar novos áudios mantendo características da voz do falante original, como, por exemplo, o sotaque. Para tanto, foi selecionado um pequeno conjunto de dados produzido por indianos no idioma inglês, garantindo a presença de apenas um sotaque no conjunto. Para a realização das investigações, experimentos foram conduzidos utilizando o clonador para o aumento de dados. Em seguida, os dados aumentados foram utilizados no treinamento dos transcritores, em diversos cenários. Surpreendentemente, a estratégia não teve um impacto positivo após a realização dos treinamentos, tendo como possível causa a qualidade dos áudios gerados pelos clonadores atuais. pt_BR
dc.publisher.country Brasil pt_BR
dc.publisher.department Centro de Engenharia Elétrica e Informática - CEEI pt_BR
dc.publisher.initials UFCG pt_BR
dc.subject.cnpq Ciência da Computação. pt_BR
dc.title Investigações do uso de deepfake audio com uma técnica de aumento de dados utilizados no treinamento de transcritores automáticos. pt_BR
dc.date.issued 2022-09-02
dc.identifier.uri http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234
dc.date.accessioned 2023-04-04T18:43:34Z
dc.date.available 2023-04-04
dc.date.available 2023-04-04T18:43:34Z
dc.type Trabalho de Conclusão de Curso pt_BR
dc.subject Deep fake audio pt_BR
dc.subject Transcritores automáticos pt_BR
dc.subject Clonagem de voz pt_BR
dc.subject Aumento de dados pt_BR
dc.subject Clonadores de audio pt_BR
dc.subject Deep fake audio pt_BR
dc.subject Automatic transcribers pt_BR
dc.subject Voice cloning pt_BR
dc.subject Data augmentation pt_BR
dc.subject Audio cloners pt_BR
dc.rights Acesso Aberto pt_BR
dc.creator FERREIRA, Alexandre Ribeiro.
dc.publisher Universidade Federal de Campina Grande pt_BR
dc.language por pt_BR
dc.title.alternative Investigations of the use of deepfake audio with a data augmentation technique used in the training of automatic transcribers. pt_BR
dc.identifier.citation FERREIRA, Alexandre Ribeiro. Investigações do uso de deepfake audio com uma técnica de aumento de dados utilizados no treinamento de transcritores automáticos. 2022. 14f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234 pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Busca avançada

Navegar

Minha conta