Please use this identifier to cite or link to this item:
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/38259
Title: | Busca por produtos: um estudo comparativo de abordagens léxicas e semânticas. |
Other Titles: | Product search: a comparative study of lexical and semantic approaches. |
???metadata.dc.creator???: | SILVA, Melquisedeque Carvalho. |
???metadata.dc.contributor.advisor1???: | BAPTISTA, Cláudio de Souza. |
???metadata.dc.contributor.referee1???: | RAMALHO, Franklin de Souza. |
???metadata.dc.contributor.referee3???: | BRASILEIRO, Francisco Vilar. |
Keywords: | Busca Semântica;Busca Léxica;Busca de Produtos;Recuperação de Informação;Semantic Search;Lexical Search;Product Search;Information Retrieval |
Issue Date: | 15-May-2024 |
Publisher: | Universidade Federal de Campina Grande |
Citation: | SILVA, Melquisedeque Carvalho. Busca por produtos: um estudo comparativo de abordagens léxicas e semânticas. 2024. 17 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2024. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/38259 |
???metadata.dc.description.resumo???: | A busca por produtos é uma funcionalidade fundamental que permite aos usuários localizar e adquirir itens específicos, sendo aplicada em diversos contextos, como e-commerces e sites de comparação de preços. Este estudo compara abordagens léxicas e semânticas para a realização dessa funcionalidade. Embora a busca léxica possua vantagens em termos de tempo de resposta, ela não captura relações semânticas entre palavras além das similaridades léxicas. Por outro lado, a busca semântica destaca-se ao capturar semanticamente a relação entre os termos, porém, além de possuir maior complexidade, ela também pode ser mais lenta. Neste trabalho, analisamos as abordagens léxico-semânticas para dados de produtos, especificamente em dois conjuntos de dados: Catálogo de Materiais do Governo Federal e descrições de produtos presentes em notas fiscais. Comparamos as estratégias de busca considerando a relevância dos resultados e o tempo de resposta. Os conjuntos de dados possuem características distintas, com o catálogo de materiais sendo mais formal e estruturado, enquanto as notas fiscais contêm textos mais curtos e informais, frequentemente com siglas e abreviações. Este estudo comparativo busca identificar os trade-offs entre as abordagens léxicas e semânticas, bem como encontrar as estratégias mais adequadas para cada tipo de dado. Os resultados contribuem para a seleção de mecanismos de busca mais eficazes em catálogos de produtos, considerando diferentes formas de organização dos dados. |
Abstract: | Product search is a fundamental functionality that allows users to locate and purchase specific items, and is applied in various contexts, such as e-commerce and price comparison websites. This study compares lexical and semantic approaches to perform this functionality. Although lexical search has advantages in terms of response time, it does not capture semantic relationships between words beyond lexical similarities. On the other hand, semantic search stands out by semantically capturing the relationship between terms, but in addition to being more complex, it can also be slower. In this work, we analyze lexical-semantic approaches for product data, specifically in two datasets: the Federal Government Materials Catalog and product descriptions present in invoices. We compare the search strategies considering the relevance of the results and the response time. The datasets have distinct characteristics, with the materials catalog being more formal and structured, while the invoices contain shorter and more informal texts, often with acronyms and abbreviations. This comparative study aims to identify trade-offs between lexical and semantic approaches, as well as to find the most appropriate strategies for each type of data. The results contribute to the selection of more effective search engines in product catalogs, considering different forms of data organization. |
Keywords: | Busca Semântica Busca Léxica Busca de Produtos Recuperação de Informação Semantic Search Lexical Search Product Search Information Retrieval |
???metadata.dc.subject.cnpq???: | Ciência da Computação |
URI: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/38259 |
Appears in Collections: | Trabalho de Conclusão de Curso - Artigo - Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
MELQUISEDEQUE CARVALHO SILVA-ARTIGO-CEEI-CIÊNCIA DA COMPUTAÇÃO (2024).pdf | 1.19 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.