dc.creator.ID |
CARNEIRO, G. M. |
pt_BR |
dc.creator.Lattes |
http://lattes.cnpq.br/4271071140769809 |
pt_BR |
dc.contributor.advisor1 |
RAMALHO, Franklin de Souza. |
|
dc.contributor.advisor1ID |
RAMALHO, F. S. |
pt_BR |
dc.contributor.advisor1Lattes |
http://lattes.cnpq.br/2469816352786812 |
pt_BR |
dc.contributor.referee1 |
OLIVEIRA, Maxwell Guimarães de. |
|
dc.contributor.referee1ID |
OLIVEIRA, M. G. |
pt_BR |
dc.contributor.referee2 |
MASSONI, Tiago Lima. |
|
dc.contributor.referee2ID |
MASSONI, T. L. |
pt_BR |
dc.contributor.referee2Lattes |
http://lattes.cnpq.br/3563923906851611 |
pt_BR |
dc.description.resumo |
No contexto de projetos de software de grande porte, há demanda
crescente por correções de erros em sua concepção, que ultrapassam
os iltros de testes e qualidade da equipe de Quality Assurance
e impactam os clientes inais do produto. A im de documentar
estes comportamentos para que sejam posteriormente analisados e
corrigidos, a engenharia de software faz uso de documentos chamados
Bug Reports (BR). Como apontado por Anvik et. al [2], a
frequência de novos BRs sendo abertos em grandes projetos é elevada,
exempliicado pela ferramenta Eclipse, que, ainda em 2005,
já contava com aproximadamente 190 novos BRs sendo abertos
diariamente. Motivado por essa problemática, o presente estudo
propõe e avalia um sistema de recomendação de BRs baseado em
similaridade textual, com o diferencial de utilizar o modelo estadoda-
arte de compreensão textual BERT [3] como um dos fatores
no cálculo de similaridade. Este tem como objetivo aprimorar as
sugestões de BRs de contexto próximo ao fornecido pelo mantenedor,
o que supostamente aumentaria sua produtividade, e por
consequência, a quantidade de BRs resolvidos. Como resultados
obtidos, atestou-se ganhos de aproximadamente 14% na frequência
de BRs relevantes para as 20 primeiras recomendações, quando
comparado à técnica que utilizou apenas TF-IDF como modelo de
vetorização textual. Por im, o modelo BERT agregou melhoras às
métricas avaliadas (precisão, feedback e likelihood) quando utilizado
de maneira complementar ao TF-IDF, não desempenhando
positivamente de maneira isolada. |
pt_BR |
dc.publisher.country |
Brasil |
pt_BR |
dc.publisher.department |
Centro de Engenharia Elétrica e Informática - CEEI |
pt_BR |
dc.publisher.initials |
UFCG |
pt_BR |
dc.subject.cnpq |
Ciência da Computação. |
pt_BR |
dc.title |
Sistema de recomendação de bug reports similares utilizando o BERT. |
pt_BR |
dc.date.issued |
2023-02-14 |
|
dc.description.abstract |
In the context of large-scale software projects, there is an increasing demand for fixes in their
conception process that surpass the tests and quality filters of the Quality Assurance team and
impact the end customers of the product. In order to document these behaviors so that they can be
later analyzed and corrected, software engineering makes use of documents called Bug Reports (BR).
As pointed out by Anvik et al [2], the frequency of new BRs being opened in large projects is high,
exemplified by the Eclipse tool, which already had approximately 190 new BRs being opened daily in
2005. Motivated by this problem, this study proposes and evaluates a BR recommendation system
based on textual similarity, with the differential use of the state-of-the-art text comprehension model
BERT [3] as one of the factors in the similarity calculation. Its objective is to improve suggestions for
BRs with a context close to that provided by the maintainer, which would supposedly increase their
productivity and consequently the number of resolved BRs. As the results obtained attest, there were
gains of approximately 14% in the frequency of relevant BRs for the first 20 recommendations, when
compared to the technique that used only TF-IDF as a textual vectorization model. Finally, the BERT
model added improvements to the evaluated metrics (precision, feedback, and likelihood) when used
in a complementary manner to TF-IDF, but did not perform positively in an isolated manner. |
pt_BR |
dc.identifier.uri |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29319 |
|
dc.date.accessioned |
2023-04-10T21:24:02Z |
|
dc.date.available |
2023-04-10 |
|
dc.date.available |
2023-04-10T21:24:02Z |
|
dc.type |
Trabalho de Conclusão de Curso |
pt_BR |
dc.subject |
Projetos de software |
pt_BR |
dc.subject |
Quality assurance |
pt_BR |
dc.subject |
Engenharia de software |
pt_BR |
dc.subject |
Bug reports |
pt_BR |
dc.subject |
Sistema de recomendação de bug reports |
pt_BR |
dc.subject |
Similaridade textual |
pt_BR |
dc.subject |
Modelo estado-da-arte de compreensão textual |
pt_BR |
dc.subject |
Cálculo de similaridade |
pt_BR |
dc.subject |
Vetorização textual - modelo TF-IDF |
pt_BR |
dc.subject |
Processamento de linguagem natural |
pt_BR |
dc.subject |
Bidirectional Encoder Representations from Transformers - BERT |
pt_BR |
dc.subject |
BERT - Bidirectional Encoder Representations from Transformers |
pt_BR |
dc.subject |
Modelo de vetorização textual - BERT |
pt_BR |
dc.subject |
Software projects |
pt_BR |
dc.subject |
Software Engineering |
pt_BR |
dc.subject |
Bug report recommendation system |
pt_BR |
dc.subject |
Textual similarity |
pt_BR |
dc.subject |
State-of-the-art text comprehension model |
pt_BR |
dc.subject |
Similarity calculation |
pt_BR |
dc.subject |
Text vectorization - TF-IDF model |
pt_BR |
dc.subject |
Natural language processing |
pt_BR |
dc.subject |
Text vectorization model - BERT |
pt_BR |
dc.rights |
Acesso Aberto |
pt_BR |
dc.creator |
CARNEIRO, Guilherme de Melo. |
|
dc.publisher |
Universidade Federal de Campina Grande |
pt_BR |
dc.language |
por |
pt_BR |
dc.title.alternative |
Recommendation system for similar bug reports using BERT. |
pt_BR |
dc.identifier.citation |
CARNEIRO, Guilherme de Melo. Sistema de recomendação de bug reports similares utilizando o BERT. 2023. 14f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29319 |
pt_BR |