DSpace/Manakin Repository

Busca em catálogo de produtos: uma comparação entre banco de dados relacional e motor de busca.

Mostrar registro simples

dc.creator.ID SILVA JÚNIOR, E. F. P. pt_BR
dc.creator.Lattes http://lattes.cnpq.br/1173004346469011 pt_BR
dc.contributor.advisor1 BAPTISTA, Cláudio de Souza.
dc.contributor.advisor1ID BAPTISTA, C. S. pt_BR
dc.contributor.advisor1Lattes http://lattes.cnpq.br/0104124422364023 pt_BR
dc.contributor.referee1 OLIVEIRA, Maxwell Guimarães de.
dc.contributor.referee1ID OLIVEIRA, M. G. de pt_BR
dc.contributor.referee1Lattes http://lattes.cnpq.br/9070169649750195 pt_BR
dc.contributor.referee2 MONGIOVI, Melina Mongiovi.
dc.contributor.referee2ID MONGIOVI, M. pt_BR
dc.contributor.referee2Lattes http://lattes.cnpq.br/7535849756393864 pt_BR
dc.description.resumo O objetivo do TCE-AC é fiscalizar as despesas e receitas dos municípios e do estado do Acre. Para tanto, nos últimos anos tem modernizado a sua forma de trabalho. Em particular, o acesso rápido aos preços praticados é fundamental para a fiscalização e também para a população em geral. Para isso, o Banco de Preços é utilizado, sendo alimentado por uma base de dados em constante crescimento e que, atualmente, conta com dezenas de milhões de registros de notas fiscais. Diante desse cenário, por utilizar de banco de dados relacionais para a realização das consultas e devido a grande massa de dados existente, o sistema em questão acaba demorando para produzir resultados em diversas situações, além de retornar resultados pouco relevantes em algumas situações. Para solucionar o problema, propõe-se a implantação do Elasticsearch como o motor de busca do sistema. O Elasticsearch utiliza técnicas de indexação e possui ferramentas que otimizam a execução e resultados das queries realizadas. Além disso, serão implementadas estratégias para a carga contínua dos dados, além da documentação dos desafios enfrentados durante a implementação. Para avaliar a solução proposta, foram realizadas medições de estatísticas referentes ao tempo de resposta e qualidade das consultas antes e depois da implantação do Elasticsearch. A qualidade dos resultados foi verificada por meio de técnicas como NDCG (Normalized Discounted Cumulative Gain) e f1-score, a partir da definição dos documentos relevantes ou não para cada consulta. Como resultado, foi possível notar uma diminuição em 10 vezes do tempo de respostas das consultas realizadas no Elasticsearch quando comparado com os resultados envolvendo o Sql Server. Além disso, também foi possível observar uma melhora na relevância dos resultados retornados de cerca de 2%, chegando a um NDCG de 95,3% em média, para consultas com 10 resultados, utilizadas por padrão no sistema. pt_BR
dc.publisher.country Brasil pt_BR
dc.publisher.department Centro de Engenharia Elétrica e Informática - CEEI pt_BR
dc.publisher.initials UFCG pt_BR
dc.subject.cnpq Ciência da Computação pt_BR
dc.title Busca em catálogo de produtos: uma comparação entre banco de dados relacional e motor de busca. pt_BR
dc.date.issued 2023-11-17
dc.description.abstract The objective of TCE-AC is to oversee the expenses and revenues of municipalities and the state of Acre. In recent years, it has modernized its working methods. In particular, fast access to the prices being practiced is crucial for both the oversight process and the general population. To achieve this, the Price Database is employed, being continuously updated and currently containing tens of millions of invoice records. Given the scenario, as the system relies on relational databases for conducting queries, it often experiences delays in producing results in various situations and occasionally yields less relevant outcomes. To address this issue, the proposal is to implement Elasticsearch as the search engine for the system. Elasticsearch employs indexing techniques and features tools that optimize query execution and results. Additionally, strategies for continuous data loading will be implemented, along with documenting the challenges encountered during the implementation. To evaluate the proposed solution, statistics related to response times and query quality were measured before and after the implementation of Elasticsearch. Result quality was assessed using techniques such as NDCG (Normalized Discounted Cumulative Gain) and F1-score, based on the determination of relevant and non-relevant documents for each query. As a result, it was observed that Elasticsearch reduced query response times by a factor of 10 when compared to results involving SQL Server. Furthermore, there was an improvement in result relevance of approximately 2%, leading to an average NDCG of 95.3% for queries with 10 results, which are the default in the system. pt_BR
dc.identifier.uri http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/36735
dc.date.accessioned 2024-07-19T14:05:28Z
dc.date.available 2024-07-19
dc.date.available 2024-07-19T14:05:28Z
dc.type Trabalho de Conclusão de Curso pt_BR
dc.subject Sistemas de Informação pt_BR
dc.subject Avaliação de Relevância pt_BR
dc.subject Eficiência e Eficácia de Recuperação pt_BR
dc.subject Filtragem de Documentos pt_BR
dc.subject Information Systems pt_BR
dc.subject Relevance Assessment pt_BR
dc.subject Recovery Efficiency and Effectiveness pt_BR
dc.subject Document Filtering pt_BR
dc.rights Acesso Aberto pt_BR
dc.creator SILVA JÚNIOR, Eniedson Fabiano Pereira da.
dc.publisher Universidade Federal de Campina Grande pt_BR
dc.language por pt_BR
dc.title.alternative On searching product catalog:relational database versus search engine approaches. pt_BR
dc.identifier.citation SILVA JÚNIOR, Eniedson Fabiano Pereira da. Busca em catálogo de produtos: uma comparação entre banco de dados relacional e motor de busca. 2023. 15 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2023. pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Busca avançada

Navegar

Minha conta