dc.creator.ID |
SOUSA, Ianna M. S. F. |
pt_BR |
dc.creator.Lattes |
http://lattes.cnpq.br/8545006395210271 |
pt_BR |
dc.contributor.advisor1 |
SCHIEL, Ulrich. |
|
dc.contributor.advisor1ID |
SCHIEL, U. |
pt_BR |
dc.contributor.advisor1Lattes |
http://lattes.cnpq.br/2971250918247087 |
pt_BR |
dc.contributor.referee1 |
SUAVÉ, Jacques Philippe. |
|
dc.contributor.referee2 |
NAKAYAMA, Haruka. |
|
dc.description.resumo |
Com a difusão das bibliotecas digitais e da Internet, mais e mais textos em meio eletrônico, em diversos idiomas, se tornam acessíveis para um publico amplo e geograficamente disperso. Isto torna necessário o desenvolvimento de ferramentas adequadas para facilitar a indexação, o armazenamento e a recuperação adequada de documentos referentes a informação pesquisada. Este trabalho tem como objetivo apresentar um método para construção semi-automática de um thesaurus retangular multilíngue, a partir de documentos eletrônicos, que auxiliara no processo de recuperação da informação, independente do idioma. O método consiste em extrair termos semi-automaticamente do conjunto de documentos e utilizar a analise da co-ocorrência de termos para selecionar os termos relevantes, apos consultar os dicionários unilíngues para determinar os termos abstratos. Os conceitos relevantes extraídos dos documentos
são então representados por uma relação binaria sobre a qual aplica-se o Método de
Decomposição Retangular de uma Relação Binaria para a obtenção dos retângulos
que geram o thesaurus a partir de um algoritmo incremental. Dicionários especiais e interações com o usuário são utilizados para determinar o contexto adequado para palavras ambíguas, alem de eliminar flexões e associar um conceito abstrato para cada palavra. O protótipo desenvolvido permite uma atualização continua dos
thesauri existentes com novos documentos, em diversos idiomas, e a realização de
consultas multilíngues, alem de permitir o acréscimo de novos idiomas. |
pt_BR |
dc.publisher.country |
Brasil |
pt_BR |
dc.publisher.department |
Centro de Engenharia Elétrica e Informática - CEEI |
pt_BR |
dc.publisher.program |
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO |
pt_BR |
dc.publisher.initials |
UFCG |
pt_BR |
dc.subject.cnpq |
Ciência da Computação |
|
dc.title |
SISMULT- Sistema de indexação semiautomática multilíngue. |
pt_BR |
dc.date.issued |
1998-08-31 |
|
dc.description.abstract |
With the outsprccd of the digital libraries and the Internet more and
more electronic texts, written in several languages, become available for a wide and
geographically dispersed public. This turns it's necessary to develop tools that
facilitates indexing, representation and retrieval of multilingual documents.
This thesis presents a method for semiautomatic construction of a
multilingual thesaurus, based on the indexing of electronic documents, in order to
support a adequate information retrieval, independent of the language of the
documents.
The method consists in extracting the terms of a document and to use
an analysis of the co-occurrence of terms in order to determine its relevance. Using
special unilingual dictionaries, abstract, language-independent terms are determined.
Relevant concepts are represented as binary relations and, using the method of
rectangular decomposition of Gammoudi, rectangles of pairs concept/document are
determined and added to the existing thesaurus incrementally.
Special dictionaries and an interaction with the user determines the
correct contexts for ambiguous terms, further on eliminating flexions and
determining the abstract concepts.
A prototype has been developed which allows a continuous update of
the existing thesaurus, indexing new documents, in several languages. It also
supports multilingual queries and the addition of the new languages. |
pt_BR |
dc.identifier.uri |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7087 |
|
dc.date.accessioned |
2019-09-18T11:30:53Z |
|
dc.date.available |
2019-09-18 |
|
dc.date.available |
2019-09-18T11:30:53Z |
|
dc.type |
Dissertação |
pt_BR |
dc.subject |
Sistema de Banco de Dados |
|
dc.subject |
Sistema de Indexação Semi-Automática Multilíngue (SISMULT) |
|
dc.subject |
Sistema de Informação |
|
dc.subject |
Extração de Termos |
|
dc.subject |
Decomposição Retangular |
|
dc.subject |
Relação Binária |
|
dc.subject |
Algoritmo de Pinto |
|
dc.subject |
Thesaurus Multilíngue |
|
dc.subject |
Database System |
|
dc.subject |
Multilingual Semi-Automatic Indexing System (SISMULT) |
|
dc.subject |
Information system |
|
dc.subject |
Extraction of Terms |
|
dc.subject |
Rectangular Decomposition |
|
dc.subject |
Binary Ratio |
|
dc.subject |
Pinto's Algorithm |
|
dc.subject |
Multilingual Thesaurus |
|
dc.rights |
Acesso Aberto |
pt_BR |
dc.creator |
SOUSA, Ianna Maria Sodré Ferreira de. |
|
dc.publisher |
Universidade Federal de Campina Grande |
pt_BR |
dc.language |
por |
pt_BR |
dc.title.alternative |
SISMULT- Multilingual automatic indexing system. |
pt_BR |
dc.identifier.citation |
SOUSA, Ianna Maria Sodré Ferreira de. SISMULT- Sistema de indexação semiautomática multilíngue. 1998. 89f. (Dissertação) Mestrado em Informática, Pós-Graduação em Informática, Centro de Ciências e Tecnologia, Universidade Federal da Paraíba, Campus II, Campina Grande - Paraíba - Brasil, 1998. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7087 |
pt_BR |