dc.creator.ID |
FERREIRA, A. R. |
pt_BR |
dc.creator.Lattes |
http://lattes.cnpq.br/1680458957826582 |
pt_BR |
dc.contributor.advisor1 |
CAMPELO, Cláudio Elízio Calazans. |
|
dc.contributor.advisor1ID |
CAMPELO, C. E. C. |
pt_BR |
dc.contributor.advisor1Lattes |
http://lattes.cnpq.br/2042247762832979 |
pt_BR |
dc.contributor.referee1 |
PIRES, Carlos Eduardo Santos. |
|
dc.contributor.referee2 |
BRASILEIRO, Francisco Vilar. |
|
dc.description.resumo |
Para o treinamento de modelos transcritores que produzam resultados robustos, são necessários
dados rotulados em grande quantidade e diversificados. Encontrar tais dados com as características
necessárias é uma tarefa difícil, principalmente em idiomas menos populares do que o inglês. Além
disso, produzir tais dados requer bastante esforço, tempo e, quase sempre, dinheiro. Logo, uma
estratégia para mitigar esse problema é a utilização de técnicas de aumento de dados. Nesse
trabalho, foi investigada a utilização de deepfake audio para o aumento de dados, utilizando um
clonador de voz capaz de gerar novos áudios mantendo características da voz do falante original,
como, por exemplo, o sotaque. Para tanto, foi selecionado um pequeno conjunto de dados produzido
por indianos no idioma inglês, garantindo a presença de apenas um sotaque no conjunto. Para a
realização das investigações, experimentos foram conduzidos utilizando o clonador para o aumento
de dados. Em seguida, os dados aumentados foram utilizados no treinamento dos transcritores, em
diversos cenários. Surpreendentemente, a estratégia não teve um impacto positivo após a realização
dos treinamentos, tendo como possível causa a qualidade dos áudios gerados pelos clonadores
atuais. |
pt_BR |
dc.publisher.country |
Brasil |
pt_BR |
dc.publisher.department |
Centro de Engenharia Elétrica e Informática - CEEI |
pt_BR |
dc.publisher.initials |
UFCG |
pt_BR |
dc.subject.cnpq |
Ciência da Computação. |
pt_BR |
dc.title |
Investigações do uso de deepfake audio com uma técnica de aumento de dados utilizados no treinamento de transcritores automáticos. |
pt_BR |
dc.date.issued |
2022-09-02 |
|
dc.identifier.uri |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234 |
|
dc.date.accessioned |
2023-04-04T18:43:34Z |
|
dc.date.available |
2023-04-04 |
|
dc.date.available |
2023-04-04T18:43:34Z |
|
dc.type |
Trabalho de Conclusão de Curso |
pt_BR |
dc.subject |
Deep fake audio |
pt_BR |
dc.subject |
Transcritores automáticos |
pt_BR |
dc.subject |
Clonagem de voz |
pt_BR |
dc.subject |
Aumento de dados |
pt_BR |
dc.subject |
Clonadores de audio |
pt_BR |
dc.subject |
Deep fake audio |
pt_BR |
dc.subject |
Automatic transcribers |
pt_BR |
dc.subject |
Voice cloning |
pt_BR |
dc.subject |
Data augmentation |
pt_BR |
dc.subject |
Audio cloners |
pt_BR |
dc.rights |
Acesso Aberto |
pt_BR |
dc.creator |
FERREIRA, Alexandre Ribeiro. |
|
dc.publisher |
Universidade Federal de Campina Grande |
pt_BR |
dc.language |
por |
pt_BR |
dc.title.alternative |
Investigations of the use of deepfake audio with a data augmentation technique used in the training of automatic transcribers. |
pt_BR |
dc.identifier.citation |
FERREIRA, Alexandre Ribeiro. Investigações do uso de deepfake audio com uma técnica de aumento de dados utilizados no treinamento de transcritores automáticos. 2022. 14f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234 |
pt_BR |