DSpace/Manakin Repository

SISMULT- Sistema de indexação semiautomática multilíngue.

Mostrar registro simples

dc.creator.ID SOUSA, Ianna M. S. F. pt_BR
dc.creator.Lattes http://lattes.cnpq.br/8545006395210271 pt_BR
dc.contributor.advisor1 SCHIEL, Ulrich.
dc.contributor.advisor1ID SCHIEL, U. pt_BR
dc.contributor.advisor1Lattes http://lattes.cnpq.br/2971250918247087 pt_BR
dc.contributor.referee1 SUAVÉ, Jacques Philippe.
dc.contributor.referee2 NAKAYAMA, Haruka.
dc.description.resumo Com a difusão das bibliotecas digitais e da Internet, mais e mais textos em meio eletrônico, em diversos idiomas, se tornam acessíveis para um publico amplo e geograficamente disperso. Isto torna necessário o desenvolvimento de ferramentas adequadas para facilitar a indexação, o armazenamento e a recuperação adequada de documentos referentes a informação pesquisada. Este trabalho tem como objetivo apresentar um método para construção semi-automática de um thesaurus retangular multilíngue, a partir de documentos eletrônicos, que auxiliara no processo de recuperação da informação, independente do idioma. O método consiste em extrair termos semi-automaticamente do conjunto de documentos e utilizar a analise da co-ocorrência de termos para selecionar os termos relevantes, apos consultar os dicionários unilíngues para determinar os termos abstratos. Os conceitos relevantes extraídos dos documentos são então representados por uma relação binaria sobre a qual aplica-se o Método de Decomposição Retangular de uma Relação Binaria para a obtenção dos retângulos que geram o thesaurus a partir de um algoritmo incremental. Dicionários especiais e interações com o usuário são utilizados para determinar o contexto adequado para palavras ambíguas, alem de eliminar flexões e associar um conceito abstrato para cada palavra. O protótipo desenvolvido permite uma atualização continua dos thesauri existentes com novos documentos, em diversos idiomas, e a realização de consultas multilíngues, alem de permitir o acréscimo de novos idiomas. pt_BR
dc.publisher.country Brasil pt_BR
dc.publisher.department Centro de Engenharia Elétrica e Informática - CEEI pt_BR
dc.publisher.program PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO pt_BR
dc.publisher.initials UFCG pt_BR
dc.subject.cnpq Ciência da Computação
dc.title SISMULT- Sistema de indexação semiautomática multilíngue. pt_BR
dc.date.issued 1998-08-31
dc.description.abstract With the outsprccd of the digital libraries and the Internet more and more electronic texts, written in several languages, become available for a wide and geographically dispersed public. This turns it's necessary to develop tools that facilitates indexing, representation and retrieval of multilingual documents. This thesis presents a method for semiautomatic construction of a multilingual thesaurus, based on the indexing of electronic documents, in order to support a adequate information retrieval, independent of the language of the documents. The method consists in extracting the terms of a document and to use an analysis of the co-occurrence of terms in order to determine its relevance. Using special unilingual dictionaries, abstract, language-independent terms are determined. Relevant concepts are represented as binary relations and, using the method of rectangular decomposition of Gammoudi, rectangles of pairs concept/document are determined and added to the existing thesaurus incrementally. Special dictionaries and an interaction with the user determines the correct contexts for ambiguous terms, further on eliminating flexions and determining the abstract concepts. A prototype has been developed which allows a continuous update of the existing thesaurus, indexing new documents, in several languages. It also supports multilingual queries and the addition of the new languages. pt_BR
dc.identifier.uri http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7087
dc.date.accessioned 2019-09-18T11:30:53Z
dc.date.available 2019-09-18
dc.date.available 2019-09-18T11:30:53Z
dc.type Dissertação pt_BR
dc.subject Sistema de Banco de Dados
dc.subject Sistema de Indexação Semi-Automática Multilíngue (SISMULT)
dc.subject Sistema de Informação
dc.subject Extração de Termos
dc.subject Decomposição Retangular
dc.subject Relação Binária
dc.subject Algoritmo de Pinto
dc.subject Thesaurus Multilíngue
dc.subject Database System
dc.subject Multilingual Semi-Automatic Indexing System (SISMULT)
dc.subject Information system
dc.subject Extraction of Terms
dc.subject Rectangular Decomposition
dc.subject Binary Ratio
dc.subject Pinto's Algorithm
dc.subject Multilingual Thesaurus
dc.rights Acesso Aberto pt_BR
dc.creator SOUSA, Ianna Maria Sodré Ferreira de.
dc.publisher Universidade Federal de Campina Grande pt_BR
dc.language por pt_BR
dc.title.alternative SISMULT- Multilingual automatic indexing system. pt_BR
dc.identifier.citation SOUSA, Ianna Maria Sodré Ferreira de. SISMULT- Sistema de indexação semiautomática multilíngue. 1998. 89f. (Dissertação) Mestrado em Informática, Pós-Graduação em Informática, Centro de Ciências e Tecnologia, Universidade Federal da Paraíba, Campus II, Campina Grande - Paraíba - Brasil, 1998. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7087 pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Busca avançada

Navegar

Minha conta