Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/37850
Title: Utilizando técnicas de aprendizagem de máquina e NLP para o problema de Product Matching.
Other Titles: Using machine learning and NLP techniques for the Product Matching problem.
???metadata.dc.creator???: SANTANA, Matheus Alcantara de.
???metadata.dc.contributor.advisor1???: BAPTISTA, Cláudio de Souza.
???metadata.dc.contributor.referee1???: FECHINE, Joseana Macêdo.
???metadata.dc.contributor.referee2???: MASSONI, Tiago Lima.
Keywords: Product Matching;Machine Learning;NLP;BERT;Correspondência de Produto;Aprendizado de Máquina
Issue Date: 6-Apr-2022
Publisher: Universidade Federal de Campina Grande
Citation: SANTANA, Matheus Alcantara de. Utilizando técnicas de aprendizagem de máquina e NLP para o problema de Product Matching. 2022. 11 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/37850
???metadata.dc.description.resumo???: O comércio eletrônico é um mercado que aumenta a cada ano, impulsionado pelos avanços tecnológicos que tornam mais cômodo e eficiente o processo de compra. Por consequência, o número de vendas cresce, aumentando também a oferta de produtos sendo comercializados na internet. Devido ao grande volume de ofertas, a dificuldade do consumidor de encontrar determinado produto cresce, bem como a sua capacidade de identificar e agrupar produtos iguais, com a finalidade de encontrar as melhores ofertas. Isso ocorre, pois, dados dois produtos iguais, ou seja, que possuem o mesmo código de barras, são descritos de formas diferentes. Para isso, existe uma técnica cujo objetivo é determinar se dois produtos são equivalentes, ou seja, correspondem à mesma entidade no mundo real, utilizando técnicas de aprendizagem de máquina, chamada product matching. No presente trabalho, foram analisados diversos modelos de aprendizagem de máquina, incluindo o BERT, com a finalidade de escolher o melhor modelo que será utilizado para identificar produtos os quais sua descrição não corresponde ao seu código de barras. A base de dados utilizada será a base de produtos de notas fiscais emitidas no Estado do Acre, disponibilizadas pelo Tribunal de Contas do Acre, TCE-AC. Ao final da implementação, o modelo foi capaz de classificar de maneira satisfatória os produtos inválidos.
Abstract: E-commerce is a market that grows every year, driven by technological advances that make the purchasing process more convenient and efficient. As a result, the number of sales increases, also increasing the supply of products being sold on the internet. Due to the large volume of offers, the consumer's difficulty in finding a certain product increases, as well as their ability to identify and group similar products, in order to find the best deals. This occurs because, given two identical products, that is, that have the same barcode, they are described in different ways. To this end, there is a technique whose objective is to determine whether two products are equivalent, that is, they correspond to the same entity in the real world, using machine learning techniques, called product matching. In this work, several machine learning models were analyzed, including BERT, in order to choose the best model that will be used to identify products whose description does not match their barcode. The database used will be the product database of invoices issued in the State of Acre, made available by the Court of Auditors of Acre, TCE-AC. At the end of the implementation, the model was able to satisfactorily classify invalid products.
Keywords: Product Matching
Machine Learning
NLP
BERT
Correspondência de Produto
Aprendizado de Máquina
???metadata.dc.subject.cnpq???: Ciência da Computação
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/37850
Appears in Collections:Trabalho de Conclusão de Curso - Artigo - Ciência da Computação

Files in This Item:
File Description SizeFormat 
MATHEUS ALCANTARA DE SANTANA-ARTIGO-CEEI-CIÊNCIA DA COM-PUTAÇÃO (2021.pdf335.32 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.