Repositorio Dspace/Manakin

Geração de embeddings de tipos de POI com base em feições geográficas.

Mostrar el registro sencillo del ítem

dc.creator.ID SILVA, S. D. pt_BR
dc.creator.Lattes http://lattes.cnpq.br/2989521169184957 pt_BR
dc.contributor.advisor1 CAMPELO, Cláudio Elízio Calazans.
dc.contributor.advisor1ID CAMPELO, CLAUDIO E. C. pt_BR
dc.contributor.advisor1Lattes http://lattes.cnpq.br/2042247762832979 pt_BR
dc.contributor.referee1 PEREIRA, Eanes Torres.
dc.contributor.referee2 NASCIMENTO FILHO, Dimas Cassimiro do.
dc.contributor.referee3 FILETO, Renato.
dc.contributor.referee4 VIEIRA, Thales Miranda de Almeida.
dc.description.resumo Pontos de Interesse (POIs) são locais específicos, como restaurantes, shoppings e parques, considerados relevantes para os usuários. Representar seus tipos por meio de mecanismos computacionais é crucial para desenvolver soluções que auxiliam em tarefas como planeja mento urbano, clusterização e recomendação de POIs. Abordagens recentes têm utilizado vetores de alta dimensão (vector embeddings) para representar os tipos de POI com base nas relações contextuais de vizinhança ou palavras associadas aos POIs. Tais representações têm deixado de lado as feições geográficas presentes nas imediações como ruas, edifícios, rios e parques. No entanto, essas feições podem contribuir significativamente para uma melhor representação dos tipos de POI. Nesse contexto, esta pesquisa propõe uma abordagem para gerar embeddings de tipos de POI utilizando as feições geográficas presentes no contexto dos POIs. Na abordagem proposta, foi desenvolvido e utilizado o algoritmo GeoContext2Vec, que considera os tipos de POI e as feições geográficas presentes em seu contexto para gerar um conjunto de treinamento, preservando os padrões espaciais de espaço e ocorrência das feições. Tal conjunto é utilizado para treinar os modelos Word2Vec e DistilBert, da área de Processamento de Linguagem Natural (PLN), capazes de gerar os embeddings dos tipos. Como principais resultados obtidos, constatou-se que os embeddings produzidos com o Geo Context2Vec refletem a similaridade dos tipos de POI conforme estruturas hierárquicas e a opinião de pessoas, com valores de matching de aproximadamente 98%, superando estraté gias do estado-da-arte. Além disso, os resultados apontam a superioridade dos embeddings em uma tarefa de classificação de zonas urbanas, alcançando um valor de F-Score de 90%. Tal resultado demonstra que as feições geográficas são informações relevantes na represen tação de tipos de POI. pt_BR
dc.publisher.country Brasil pt_BR
dc.publisher.department Centro de Engenharia Elétrica e Informática - CEEI pt_BR
dc.publisher.program PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO pt_BR
dc.publisher.initials UFCG pt_BR
dc.subject.cnpq Ciência da Computação. pt_BR
dc.title Geração de embeddings de tipos de POI com base em feições geográficas. pt_BR
dc.date.issued 2024-05-20
dc.description.abstract Points of Interest (POIs) are specific locations, such as restaurants, shopping centers, and parks, considered relevant to users. Representing their types through computational mech anisms is crucial for developing solutions that assist in tasks such as urban planning, clus tering, and POI recommendation. Recent approaches have used high-dimensional vectors (vector embeddings) to represent POI types based on contextual neighborhood relationships or words associated with POIs. Such representations have overlooked the geographical fea tures present in the vicinity, such as streets, buildings, rivers, and parks. However, these fea tures can significantly contribute to a better representation of POI types. In this context, this research proposes an approach to generate embeddings of POI types using the geographic features present in the context of POIs. In the proposed approach, the GeoContext2Vec al gorithm has been developed and employed, which considers POI types and the geographical features present in their context to generate a training set, preserving spatial patterns and occurrences of the features. This set is used to train the Word2Vec and DistilBert models, from the Natural Language Processing (NLP) area, capable of generating the embeddings of types. As the main results obtained, it was found that the embeddings produced with GeoContext2Vec reflect the similarity of POI types according to hierarchical structures and people’s opinions, with matching values of approximately 98%, surpassing state-of-the-art strategies. Furthermore, the results indicate the superiority of these embeddings in an urban zone classification task, achieving an F-Score value of 90%. This result demonstrates that geographical features are relevant information in the representation of POI types. pt_BR
dc.identifier.uri http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/37311
dc.date.accessioned 2024-08-14T17:38:24Z
dc.date.available 2024-08-14
dc.date.available 2024-08-14T17:38:24Z
dc.type Tese pt_BR
dc.subject Engenharia de software pt_BR
dc.subject Pontos de interesse (POIs) – embeddings pt_BR
dc.subject Processamento de linguagem natural (PLN) pt_BR
dc.subject Geosemântica pt_BR
dc.subject Software engineering pt_BR
dc.subject Points of interest (POIs) – embeddings pt_BR
dc.subject Natural language processing (NLP) pt_BR
dc.subject Geosemantics pt_BR
dc.rights Acesso Aberto pt_BR
dc.creator SILVA, Salatiel Dantas.
dc.publisher Universidade Federal de Campina Grande pt_BR
dc.language por pt_BR
dc.title.alternative Generation of POI type embeddings based on geographic features. pt_BR
dc.identifier.citation SILVA, Salatiel Dantas. Geração de embeddings de tipos de POI com base em feições geográficas. 2024. 159 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024. pt_BR


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Buscar en DSpace


Búsqueda avanzada

Listar

Mi cuenta