DSpace/Manakin Repository

Sistema de recomendação de bug reports similares utilizando o BERT.

Mostrar registro simples

dc.creator.ID CARNEIRO, G. M. pt_BR
dc.creator.Lattes http://lattes.cnpq.br/4271071140769809 pt_BR
dc.contributor.advisor1 RAMALHO, Franklin de Souza.
dc.contributor.advisor1ID RAMALHO, F. S. pt_BR
dc.contributor.advisor1Lattes http://lattes.cnpq.br/2469816352786812 pt_BR
dc.contributor.referee1 OLIVEIRA, Maxwell Guimarães de.
dc.contributor.referee1ID OLIVEIRA, M. G. pt_BR
dc.contributor.referee2 MASSONI, Tiago Lima.
dc.contributor.referee2ID MASSONI, T. L. pt_BR
dc.contributor.referee2Lattes http://lattes.cnpq.br/3563923906851611 pt_BR
dc.description.resumo No contexto de projetos de software de grande porte, há demanda crescente por correções de erros em sua concepção, que ultrapassam os iltros de testes e qualidade da equipe de Quality Assurance e impactam os clientes inais do produto. A im de documentar estes comportamentos para que sejam posteriormente analisados e corrigidos, a engenharia de software faz uso de documentos chamados Bug Reports (BR). Como apontado por Anvik et. al [2], a frequência de novos BRs sendo abertos em grandes projetos é elevada, exempliicado pela ferramenta Eclipse, que, ainda em 2005, já contava com aproximadamente 190 novos BRs sendo abertos diariamente. Motivado por essa problemática, o presente estudo propõe e avalia um sistema de recomendação de BRs baseado em similaridade textual, com o diferencial de utilizar o modelo estadoda- arte de compreensão textual BERT [3] como um dos fatores no cálculo de similaridade. Este tem como objetivo aprimorar as sugestões de BRs de contexto próximo ao fornecido pelo mantenedor, o que supostamente aumentaria sua produtividade, e por consequência, a quantidade de BRs resolvidos. Como resultados obtidos, atestou-se ganhos de aproximadamente 14% na frequência de BRs relevantes para as 20 primeiras recomendações, quando comparado à técnica que utilizou apenas TF-IDF como modelo de vetorização textual. Por im, o modelo BERT agregou melhoras às métricas avaliadas (precisão, feedback e likelihood) quando utilizado de maneira complementar ao TF-IDF, não desempenhando positivamente de maneira isolada. pt_BR
dc.publisher.country Brasil pt_BR
dc.publisher.department Centro de Engenharia Elétrica e Informática - CEEI pt_BR
dc.publisher.initials UFCG pt_BR
dc.subject.cnpq Ciência da Computação. pt_BR
dc.title Sistema de recomendação de bug reports similares utilizando o BERT. pt_BR
dc.date.issued 2023-02-14
dc.description.abstract In the context of large-scale software projects, there is an increasing demand for fixes in their conception process that surpass the tests and quality filters of the Quality Assurance team and impact the end customers of the product. In order to document these behaviors so that they can be later analyzed and corrected, software engineering makes use of documents called Bug Reports (BR). As pointed out by Anvik et al [2], the frequency of new BRs being opened in large projects is high, exemplified by the Eclipse tool, which already had approximately 190 new BRs being opened daily in 2005. Motivated by this problem, this study proposes and evaluates a BR recommendation system based on textual similarity, with the differential use of the state-of-the-art text comprehension model BERT [3] as one of the factors in the similarity calculation. Its objective is to improve suggestions for BRs with a context close to that provided by the maintainer, which would supposedly increase their productivity and consequently the number of resolved BRs. As the results obtained attest, there were gains of approximately 14% in the frequency of relevant BRs for the first 20 recommendations, when compared to the technique that used only TF-IDF as a textual vectorization model. Finally, the BERT model added improvements to the evaluated metrics (precision, feedback, and likelihood) when used in a complementary manner to TF-IDF, but did not perform positively in an isolated manner. pt_BR
dc.identifier.uri http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29319
dc.date.accessioned 2023-04-10T21:24:02Z
dc.date.available 2023-04-10
dc.date.available 2023-04-10T21:24:02Z
dc.type Trabalho de Conclusão de Curso pt_BR
dc.subject Projetos de software pt_BR
dc.subject Quality assurance pt_BR
dc.subject Engenharia de software pt_BR
dc.subject Bug reports pt_BR
dc.subject Sistema de recomendação de bug reports pt_BR
dc.subject Similaridade textual pt_BR
dc.subject Modelo estado-da-arte de compreensão textual pt_BR
dc.subject Cálculo de similaridade pt_BR
dc.subject Vetorização textual - modelo TF-IDF pt_BR
dc.subject Processamento de linguagem natural pt_BR
dc.subject Bidirectional Encoder Representations from Transformers - BERT pt_BR
dc.subject BERT - Bidirectional Encoder Representations from Transformers pt_BR
dc.subject Modelo de vetorização textual - BERT pt_BR
dc.subject Software projects pt_BR
dc.subject Software Engineering pt_BR
dc.subject Bug report recommendation system pt_BR
dc.subject Textual similarity pt_BR
dc.subject State-of-the-art text comprehension model pt_BR
dc.subject Similarity calculation pt_BR
dc.subject Text vectorization - TF-IDF model pt_BR
dc.subject Natural language processing pt_BR
dc.subject Text vectorization model - BERT pt_BR
dc.rights Acesso Aberto pt_BR
dc.creator CARNEIRO, Guilherme de Melo.
dc.publisher Universidade Federal de Campina Grande pt_BR
dc.language por pt_BR
dc.title.alternative Recommendation system for similar bug reports using BERT. pt_BR
dc.identifier.citation CARNEIRO, Guilherme de Melo. Sistema de recomendação de bug reports similares utilizando o BERT. 2023. 14f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29319 pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Busca avançada

Navegar

Minha conta