DSpace/Manakin Repository

Eficiência na busca por regiões geográficas similares: comparando diferentes manipulações nos embeddings de POI e feições geográficas.

Mostrar registro simples

dc.creator.ID GOMES, J. I. F. pt_BR
dc.creator.Lattes http://lattes.cnpq.br/8540079502222271 pt_BR
dc.contributor.advisor1 CAMPELO, Claudio Elízio Calazans.
dc.contributor.advisor1ID CAMPELO, Claudio E. C. pt_BR
dc.contributor.advisor1Lattes http://lattes.cnpq.br/2042247762832979 pt_BR
dc.contributor.referee1 PIRES, Carlos Eduardo Santos.
dc.contributor.referee1ID PIRES, C. E. S. pt_BR
dc.contributor.referee1Lattes http://lattes.cnpq.br/4986021622366786 pt_BR
dc.contributor.referee2 BRASILEIRO, Francisco Vilar.
dc.contributor.referee2ID BRASILEIRO, F. pt_BR
dc.contributor.referee2Lattes http://lattes.cnpq.br/5957855817378897 pt_BR
dc.description.resumo A representação de regiões geográficas tem sido alvo de pesquisas nos últimos tempos, pois é a peça chave para a realização de diversas tarefas, como a busca por regiões similares. Tal representação, porém, não é tarefa trivial, uma vez que pode envolver inúmeras variáveis no processo. A tendência atual é que essas representações sejam feitas através de vetores de alta dimensão, conhecidos como embeddings. Porém, operações de busca por estes costumam ser custosas para a máquina em termos de tempo de processamento e consumo de disco. Neste artigo experimentou-se diferentes manipulações nesses vetores a fim de diminuir o consumo de recursos computacionais no momento da busca sem comprometer significativamente a relevância dos resultados produzidos por ela. Técnicas de redução de dimensionalidade dos vetores e quantização de seus elementos foram executadas, além de comparações entre a busca exata por vizinhos mais próximos e a busca aproximada por estes. Observou-se que a busca aproximada por vizinhos mais próximos reduz o tempo de busca em aproximadamente 42,6%, mantendo uma boa aproximação com os resultados do baseline. A técnica de quantização dos embeddings apresentou a segunda maior interseção com o baseline e reduziu consideravelmente o consumo de disco pelos índices. Técnicas como a redução de dimensionalidades não apresentaram grandes alterações no tempo de busca e tiveram interseções baixíssimas com o baseline da pesquisa. pt_BR
dc.publisher.country Brasil pt_BR
dc.publisher.department Centro de Engenharia Elétrica e Informática - CEEI pt_BR
dc.publisher.initials UFCG pt_BR
dc.subject.cnpq Ciência da Computação pt_BR
dc.title Eficiência na busca por regiões geográficas similares: comparando diferentes manipulações nos embeddings de POI e feições geográficas. pt_BR
dc.date.issued 2024-05-15
dc.description.abstract Geographic regions representation has been the main target of several researches in the last years, as it is the key component for performing various tasks, such as searching for similar regions. However, such representation is not a trivial task, as it may involve numerous variables in the process. The current trend is for these representations to be made using high-dimensional vectors, known as embeddings. However, search operations for these tend to be resource-intensive for the machine in terms of processing time and disk usage. In this article we experimented with different kinds of manipulation on these vectors in order to reduce the consumption of computational resources during the search without significantly impacting the relevance of the results produced. Vector dimensionality reduction techniques and the quantization of its elements were performed, in addition to comparing the exact search for nearest neighbors and the approximate search for them. We observed that the approximate search for nearest neighbors reduces the search time by approximately 42,6%, while still maintaining a good approximation with the baseline results. The embeddings quantization technique showed the second-best intersection with the baseline results and significantly reduced disk usage by the indexes. Techniques such as dimensionality reduction did not result in significant changes in the search time and had very low intersection with the research baseline. pt_BR
dc.identifier.uri http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/38189
dc.date.accessioned 2024-10-01T01:59:36Z
dc.date.available 2024-09-30
dc.date.available 2024-10-01T01:59:36Z
dc.type Trabalho de Conclusão de Curso pt_BR
dc.subject Embeddings pt_BR
dc.subject Pontos de Interesse (POI) pt_BR
dc.subject Técnicas de Redução de Dimensionalidade pt_BR
dc.subject Word2Vec pt_BR
dc.subject K-Nearest Neighbors (KNN) pt_BR
dc.subject Aproximate Nearest Neighbors (ANN) pt_BR
dc.subject Points of Interest (POI) pt_BR
dc.subject Dimensionality Reduction Techniques pt_BR
dc.rights Acesso Aberto pt_BR
dc.creator GOMES, José Igor de Farias.
dc.publisher Universidade Federal de Campina Grande pt_BR
dc.language por pt_BR
dc.title.alternative Efficiency in the search for similar geographic regions: comparing different manipulations in POI and geographic features embeddings. pt_BR
dc.identifier.citation GOMES, José Igor de Farias. Eficiência na busca por regiões geográficas similares: comparando diferentes manipulações nos embeddings de POI e feições geográficas. 14 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2024. pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Busca avançada

Navegar

Minha conta