Sistema de recomendação de bug reports similares utilizando o BERT.

Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29319

Title:	Sistema de recomendação de bug reports similares utilizando o BERT.
Other Titles:	Recommendation system for similar bug reports using BERT.
???metadata.dc.creator???:	CARNEIRO, Guilherme de Melo.
???metadata.dc.contributor.advisor1???:	RAMALHO, Franklin de Souza.
???metadata.dc.contributor.referee1???:	OLIVEIRA, Maxwell Guimarães de.
???metadata.dc.contributor.referee2???:	MASSONI, Tiago Lima.
Keywords:	Projetos de software;Quality assurance;Engenharia de software;Bug reports;Sistema de recomendação de bug reports;Similaridade textual;Modelo estado-da-arte de compreensão textual;Cálculo de similaridade;Vetorização textual - modelo TF-IDF;Processamento de linguagem natural;Bidirectional Encoder Representations from Transformers - BERT;BERT - Bidirectional Encoder Representations from Transformers;Modelo de vetorização textual - BERT;Software projects;Software Engineering;Bug report recommendation system;Textual similarity;State-of-the-art text comprehension model;Similarity calculation;Text vectorization - TF-IDF model;Natural language processing;Text vectorization model - BERT
Issue Date:	14-Feb-2023
Publisher:	Universidade Federal de Campina Grande
Citation:	CARNEIRO, Guilherme de Melo. Sistema de recomendação de bug reports similares utilizando o BERT. 2023. 14f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29319
???metadata.dc.description.resumo???:	No contexto de projetos de software de grande porte, há demanda crescente por correções de erros em sua concepção, que ultrapassam os iltros de testes e qualidade da equipe de Quality Assurance e impactam os clientes inais do produto. A im de documentar estes comportamentos para que sejam posteriormente analisados e corrigidos, a engenharia de software faz uso de documentos chamados Bug Reports (BR). Como apontado por Anvik et. al [2], a frequência de novos BRs sendo abertos em grandes projetos é elevada, exempliicado pela ferramenta Eclipse, que, ainda em 2005, já contava com aproximadamente 190 novos BRs sendo abertos diariamente. Motivado por essa problemática, o presente estudo propõe e avalia um sistema de recomendação de BRs baseado em similaridade textual, com o diferencial de utilizar o modelo estadoda- arte de compreensão textual BERT [3] como um dos fatores no cálculo de similaridade. Este tem como objetivo aprimorar as sugestões de BRs de contexto próximo ao fornecido pelo mantenedor, o que supostamente aumentaria sua produtividade, e por consequência, a quantidade de BRs resolvidos. Como resultados obtidos, atestou-se ganhos de aproximadamente 14% na frequência de BRs relevantes para as 20 primeiras recomendações, quando comparado à técnica que utilizou apenas TF-IDF como modelo de vetorização textual. Por im, o modelo BERT agregou melhoras às métricas avaliadas (precisão, feedback e likelihood) quando utilizado de maneira complementar ao TF-IDF, não desempenhando positivamente de maneira isolada.
Abstract:	In the context of large-scale software projects, there is an increasing demand for fixes in their conception process that surpass the tests and quality filters of the Quality Assurance team and impact the end customers of the product. In order to document these behaviors so that they can be later analyzed and corrected, software engineering makes use of documents called Bug Reports (BR). As pointed out by Anvik et al [2], the frequency of new BRs being opened in large projects is high, exemplified by the Eclipse tool, which already had approximately 190 new BRs being opened daily in 2005. Motivated by this problem, this study proposes and evaluates a BR recommendation system based on textual similarity, with the differential use of the state-of-the-art text comprehension model BERT [3] as one of the factors in the similarity calculation. Its objective is to improve suggestions for BRs with a context close to that provided by the maintainer, which would supposedly increase their productivity and consequently the number of resolved BRs. As the results obtained attest, there were gains of approximately 14% in the frequency of relevant BRs for the first 20 recommendations, when compared to the technique that used only TF-IDF as a textual vectorization model. Finally, the BERT model added improvements to the evaluated metrics (precision, feedback, and likelihood) when used in a complementary manner to TF-IDF, but did not perform positively in an isolated manner.
Keywords:	Projetos de software Quality assurance Engenharia de software Bug reports Sistema de recomendação de bug reports Similaridade textual Modelo estado-da-arte de compreensão textual Cálculo de similaridade Vetorização textual - modelo TF-IDF Processamento de linguagem natural Bidirectional Encoder Representations from Transformers - BERT BERT - Bidirectional Encoder Representations from Transformers Modelo de vetorização textual - BERT Software projects Software Engineering Bug report recommendation system Textual similarity State-of-the-art text comprehension model Similarity calculation Text vectorization - TF-IDF model Natural language processing Text vectorization model - BERT
???metadata.dc.subject.cnpq???:	Ciência da Computação.
URI:	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29319
Appears in Collections:	Trabalho de Conclusão de Curso - Artigo - Ciência da Computação

Files in This Item:

File	Description	Size	Format
GUILHERME DE MELO CARNEIRO - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2023.pdf	Guilherme de Melo Carneiro - TCC Artigo Ciência da Computação CEEI 2023	405.44 kB	Adobe PDF	View/Open

Show full item record