Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234
Full metadata record
DC FieldValueLanguage
dc.creator.IDFERREIRA, A. R.pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/1680458957826582pt_BR
dc.contributor.advisor1CAMPELO, Cláudio Elízio Calazans.
dc.contributor.advisor1IDCAMPELO, C. E. C.pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2042247762832979pt_BR
dc.contributor.referee1PIRES, Carlos Eduardo Santos.
dc.contributor.referee2BRASILEIRO, Francisco Vilar.
dc.description.resumoPara o treinamento de modelos transcritores que produzam resultados robustos, são necessários dados rotulados em grande quantidade e diversificados. Encontrar tais dados com as características necessárias é uma tarefa difícil, principalmente em idiomas menos populares do que o inglês. Além disso, produzir tais dados requer bastante esforço, tempo e, quase sempre, dinheiro. Logo, uma estratégia para mitigar esse problema é a utilização de técnicas de aumento de dados. Nesse trabalho, foi investigada a utilização de deepfake audio para o aumento de dados, utilizando um clonador de voz capaz de gerar novos áudios mantendo características da voz do falante original, como, por exemplo, o sotaque. Para tanto, foi selecionado um pequeno conjunto de dados produzido por indianos no idioma inglês, garantindo a presença de apenas um sotaque no conjunto. Para a realização das investigações, experimentos foram conduzidos utilizando o clonador para o aumento de dados. Em seguida, os dados aumentados foram utilizados no treinamento dos transcritores, em diversos cenários. Surpreendentemente, a estratégia não teve um impacto positivo após a realização dos treinamentos, tendo como possível causa a qualidade dos áudios gerados pelos clonadores atuais.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCentro de Engenharia Elétrica e Informática - CEEIpt_BR
dc.publisher.initialsUFCGpt_BR
dc.subject.cnpqCiência da Computação.pt_BR
dc.titleInvestigações do uso de deepfake audio com uma técnica de aumento de dados utilizados no treinamento de transcritores automáticos.pt_BR
dc.date.issued2022-09-02
dc.identifier.urihttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234
dc.date.accessioned2023-04-04T18:43:34Z
dc.date.available2023-04-04
dc.date.available2023-04-04T18:43:34Z
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.subjectDeep fake audiopt_BR
dc.subjectTranscritores automáticospt_BR
dc.subjectClonagem de vozpt_BR
dc.subjectAumento de dadospt_BR
dc.subjectClonadores de audiopt_BR
dc.subjectDeep fake audiopt_BR
dc.subjectAutomatic transcriberspt_BR
dc.subjectVoice cloningpt_BR
dc.subjectData augmentationpt_BR
dc.subjectAudio clonerspt_BR
dc.rightsAcesso Abertopt_BR
dc.creatorFERREIRA, Alexandre Ribeiro.
dc.publisherUniversidade Federal de Campina Grandept_BR
dc.languageporpt_BR
dc.title.alternativeInvestigations of the use of deepfake audio with a data augmentation technique used in the training of automatic transcribers.pt_BR
dc.identifier.citationFERREIRA, Alexandre Ribeiro. Investigações do uso de deepfake audio com uma técnica de aumento de dados utilizados no treinamento de transcritores automáticos. 2022. 14f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234pt_BR
Appears in Collections:Trabalho de Conclusão de Curso - Artigo - Ciência da Computação

Files in This Item:
File Description SizeFormat 
ALEXANDRE RIBEIRO FERREIRA - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2022.pdfAlexandre Ribeiro Ferreira - TCC Artigo Ciência da Computação CEEI 2022.475.67 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.