Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7346
Full metadata record
DC FieldValueLanguage
dc.creator.Latteshttp://lattes.cnpq.br/4071050262331837pt_BR
dc.contributor.advisor1RAMALHO, Franklin de Souza.-
dc.contributor.advisor1IDRamalho, F. S.pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2469816352786812pt_BR
dc.contributor.advisor2MASSONI, Tiago Lima.-
dc.contributor.advisor2IDMASSONI, T. L.pt_BR
dc.contributor.advisor2Latteshttp://lattes.cnpq.br/3563923906851611pt_BR
dc.contributor.referee1ALVES , Everton Leandro Galdino.-
dc.contributor.referee2LINO, Natasha Correia Queiroz.-
dc.description.resumoRecuperação de links de rastreabilidade automaticamente entre artefatos de software potencialmente melhora o processo de desenvolvimento de software, ajudando a detectar problemas mais cedo durante o ciclo de vida do software. Abordagens que aplicam técnicas de Recuparação da Informação ou Aprendizam de Máquina em dados textuais têm sido propostas, contudo estas técnicas diferem consideravelmente em termos de parâmetros de entrada e resultados obtidos. É difícil distinguir os benefícios e as falhas das técnicas quando essas são aplicadas isoladamente, usualmente em projetos pequenos ou de tamanho médio. Além disso, um visão mais abrangente poderia ser feita se uma técnica de Aprendizagem Profunda fosse aplicada em comparação com as técnicas tradicionais de Recuperação da Informação. Nós propomos uma abordagem para recuperar links de rastreabilidade entre artefatos textuais de software, especificamente relatórios de falhas e casos de teste, que são relacionados através de técnicas de Recuperação da Informação e Aprendizagem Profunda. Para avaliar a efetivadade de cada técnica, nós usamos um conjunto de dados históricos do Mozilla Firefox usados pelos times de controle de qualidade. As seguintes técnicas de Recuperação da Informação foram estudadas: Latent Semantic Indexing, Latent Dirichlet Allocation e Best Match 25. Adicionalmente, nós também aplicamos uma técnica de Aprendizagem Profunda chamada Word Vector. Uma vez que não possuímos uma matriz de rastreabilidade que ligue diretamente relatórios de falhas e casos de teste, nós usamos system features como artefatos intermediários. No contexto de rastreabilidade entre relatórios de falhas e casos de teste, nós identificamos uma performance pobre de três entre as quatro técnicas estudadas. Apenas a técnica Latent Semantic Indexing apresenta resultados satisfatórios, mesmo que comparando com a técnica estado-da-arte Best Match 25. Ao passo que a técnica Word Vector apresentou a efetividade mais baixa dentre todas as técnicas. Os resultados obtidos mostram que a aplicação da técnica Latent Semantic Indexing – em conjunto com uma combinação de limiares que definem se um link candidato é positivo ou não – é viável para projetos grandes e reais usando um processo de recuperação de links de rastreabilidade semi-automático, onde os analistas humanos são auxiliados por uma ferramenta de software apropriada.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCentro de Engenharia Elétrica e Informática - CEEIpt_BR
dc.publisher.programPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOpt_BR
dc.publisher.initialsUFCGpt_BR
dc.subject.cnpqCiência da Computaçãopt_BR
dc.titleAn approach for traceability recovery between bug reports and test cases.pt_BR
dc.date.issued2019-07-27-
dc.description.abstractAutomatic traceability recovery between software artifacts potentially improves the process of developing software, helping detect issues early during its life-cycle. Approaches applying Information Retrieval (IR) or Machine Learning (ML) techniques in textual data have been proposed, but those techniques differ considerably in terms of input parameters and results. It is difficult to assess their benefits and drawbacks when those techniques are applied in isolation, usually in small and medium-sized software projects. Also, an overview would be more comprehensive if a promising Deep Learning (DL) based technique is applied, in comparison with traditional IR techniques. We propose an approach to recover traceability links between textual software artifacts, in special bug reports and test cases, which can be instantiated with a set of IR and DL techniques. For applying and evaluating our solution, we used historical data from the Mozilla Firefox quality assurance (QA) team, for which we assessed the following IR techniques: Latent Semantic Index (LSI), Latent Dirichlet Allocation (LDA) and Best Match 25 (BM25). We also applied the approach with a DL technique called Word Vector. Since there are no traces matrices that straightly link bug reports and test cases, we used system features as intermediate artifacts. In the context of traceability from bug reports to test cases, we noticed poor performances from three out of the four studied techniques. Only the LSI technique presented satisfactory effectiveness, even standing out over the state-of-the-art BM25 technique. Whereas theWord Vector technique presented the lowest effectiveness in our study. The obtained results show that the application of the LSI technique – set up with an appropriate combination of thresholds to define if a candidate trace is positive or not – is feasible for real-world and large software projects using a semi-automatized traceability recovery process, where the human analysts are aided by an appropriated software tool.pt_BR
dc.identifier.urihttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7346-
dc.date.accessioned2019-09-26T12:02:38Z-
dc.date.available2019-09-26-
dc.date.available2019-09-26T12:02:38Z-
dc.typeDissertaçãopt_BR
dc.subjectSoftware Engineeringpt_BR
dc.subjectBug Reportspt_BR
dc.subjectSystem Featurespt_BR
dc.subjectTest Casespt_BR
dc.subjectRequirements Traceabilitypt_BR
dc.subjectInformation Retrievalpt_BR
dc.subjectEngenharia de softwarept_BR
dc.subjectRelatório de Errospt_BR
dc.subjectRecursos do Sistemapt_BR
dc.subjectCaso de Testept_BR
dc.subjectRastreabilidade de Requisitospt_BR
dc.subjectRecuperação de Informaçãopt_BR
dc.rightsAcesso Abertopt_BR
dc.creatorGADELHA, Guilherme Monteiro.-
dc.publisherUniversidade Federal de Campina Grandept_BR
dc.languageengpt_BR
dc.title.alternativeUma abordagem para recuperação de rastreabilidade entre relatórios de erros e casos de teste.pt_BR
dc.identifier.citationGADELHA, G. M. An approach for traceability recovery between bug reports and test cases. 2019. 119 f. Dissertação (Mestrado em Ciência da Computação) – Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2019. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7346pt_BR
Appears in Collections:Mestrado em Ciência da Computação.

Files in This Item:
File Description SizeFormat 
GUILHERME MONTEIRO GADELHA - DISSERTAÇÃO (PPGCC) 2019.pdfGuilherme Monteiro Gadelha - Dissertação PPGCC 20193.22 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.