Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1314
Title: Criação de vetores temáticos de domínios para a desambiguação polissêmica de termos.
Other Titles: Creation of thematic vectors of domains for the polysemic disambiguation of terms.
???metadata.dc.creator???: BISPO, Magna Celi Tavares.
???metadata.dc.contributor.advisor1???: SCHIEL, Ulrich.
???metadata.dc.contributor.advisor2???: PIRES, Carlos Eduardo Santos.
???metadata.dc.contributor.referee1???: MARINHO, Leandro Balby.
???metadata.dc.contributor.referee2???: FERNEDA, Edberto.
Keywords: Vetores temáticos de domínios;Desambiguação polissêmica de termos;Indexação de documentos;Ambiguidade de termos - indexação;Vocabulários temáticos;Recuperação da informação;Classificação Decimal Universal - CDU;Vocabulário controlado;Classificação de documentos - método vetorial;Intellexer Categorizer;Processamento da linguagem natural;Postagger;Thematic vocabulaires;Document indexing;Information retrieval
Issue Date: 30-Nov-2012
Publisher: Universidade Federal de Campina Grande
Citation: BISPO, Magna Celi Tavares. Criação de vetores temáticos de domínios para a desambiguação polissêmica de termos. 2012. 100f. (Dissertação de Mestrado em Ciência da Computação) Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraiba - Brasil, 2012.
???metadata.dc.description.resumo???: A ambiguidade de termos é um dos fatores que dificulta o processo de indexação de documentos e recuperação de informação desejada por um usuário. O presente trabalho se baseia na hipótese de que parte deste problema pode ser minimizado sabendo-se de antemão o domínio do documento que contém termos ambíguos. Para determinar este domínio foram construídos vocabulários temáticos por meio da extração de termos de documentos de domínios de conhecimento pré-determinados, com o uso de regras sintáticas. A Wikipédia foi usada como base de consulta, por ser uma enciclopédia digital contendo as categorias definidas semelhantes à Classificação Decimal Universal (CDU), e cada categoria com uma vasta quantidade de documentos específicos, sendo essa característica fundamental para formação de um vocabulário específico do domínio de um conhecimento. A escolha das categorias foi baseada na CDU, composta de 10 domínios e seus respectivos subdomínios. Os vocabulários obtidos, denominados de Vetores Temáticos de Domínio (VTD), serviram de base para a classificação de novos documentos. Para validação dos VTD's, foram realizados três tipos de experimentos diferentes, o primeiro foi classificar novos documentos utilizando o método vetorial, tendo o VTD como base de consulta. O segundo experimento foi uma classificação utilizando outro classificador, o Intellexer Categorizer, e o terceiro experimento, criou-se um vetor de termos através do Weka, o qual foi submetido a servir de base de consulta para classificar novos documentos, utilizando o modelo vetorial. Os resultados foram satisfatórios, pois mostrou que o VTD obteve uma melhor classificação em relação aos outros métodos, dos 14 novos documentos, classificou 10 corretamente e 4 errados, apresentando uma acurácia de 80%, contra a acurácia de 57% do Intellexer Categorizer e de 50% da classificação utilizando o vetor de termos criado pelo Weka.
Keywords: Vetores temáticos de domínios
Desambiguação polissêmica de termos
Indexação de documentos
Ambiguidade de termos - indexação
Vocabulários temáticos
Recuperação da informação
Classificação Decimal Universal - CDU
Vocabulário controlado
Classificação de documentos - método vetorial
Intellexer Categorizer
Processamento da linguagem natural
Postagger
Thematic vocabulaires
Document indexing
Information retrieval
???metadata.dc.subject.cnpq???: Ciência da Computação.
Ciência da Informação.
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1314
Appears in Collections:Mestrado em Ciência da Computação.

Files in This Item:
File Description SizeFormat 
MAGNA CELI TAVARES BISPO - DISSERTAÇÃO PPGCC 2012..pdfMagna Celi Tavares Bispo - Dissertação PPGCC 2012.13.27 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.