Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903
Title: Seleção de modelos de classificação através de heurísticas.
Other Titles: Selection of classification models through heuristics.
???metadata.dc.creator???: SANTOS, David Moises Barreto dos.
???metadata.dc.contributor.advisor1???: SAMPAIO, Marcus Costa.
???metadata.dc.contributor.referee1???: GOMES, Herman Martins.
???metadata.dc.contributor.referee2???: RUIZ, Duncan Dubugras Alcoba.
Keywords: Bancos de Dados;Mineração de Dados;Processo de Mineração de Dados;Heurísticas;Databases;Data Mining;Data Mining Process;Heuristics
Issue Date: 19-Jul-2005
Publisher: Universidade Federal de Campina Grande
Citation: SANTOS, David Moises Barreto dos. Seleção de modelos de classificação através de heurísticas. 2005. 97 f. Dissertação (Mestrado em Informática)– Programa de Pós-Graduação em Informática, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2005.
???metadata.dc.description.resumo???: O processo de indução automática de modelos de classificação é composto de três etapas principais, pela ordem: amostragem, fragmentação e classificação. Devido à diversidade de técnicas que podem ser utilizadas em cada uma destas etapas, os resultados são muito instáveis — não existe a melhor técnica de amostragem, ou de fragmentação, etc. Para resolver o problema da indução do melhor modelo de classificação dentro de um espaço de busca, uma alternativa é arranjar todas as técnicas de amostragem, fragmentação e classificação disponíveis e buscar exaustivamente o melhor modelo de classificação. Entretanto, isto implicará em um alto custo computacional. Neste trabalho, descrevemos como foi possível descobrir heurísticas que podem ajudar a reduzir substancialmente o espaço de busca do melhor modelo de classificação. Também, discutimos o projeto e a implementação de um "framework" baseado nas heurísticas descobertas, objetivando guiar o minerador a escolher um modelo de classificação que satisfaça seus requisitos de qualidade, traduzidos em acurácia do modelo de classificação induzido, a um custo de processamento aceitável.
Abstract: The automated induction process of classification models is composed of the following steps: sampling, splitting and classification. Due to the diversity of techniques that may be used in each one of these steps, the results are much unstable — there is not the best sampling technique or the best splitting technique and so on. In order to solve the problem of inducing the best classification model within a search space, one way may arrange all available techniques for sampling, splitting and classification to search exhaustively the best classification model. However, this will imply in a high computational cost. In this work, we describe how to discover heuristics that help to reduce this computational cost. Also, we discuss the design and implementation of a framework that was developed based on the heuristics discovered in order to guide the miner in choosing a classification model which satisfies his or her quality requirements translated in the accuracy of the classification model induced with acceptable computational cost.
Keywords: Bancos de Dados
Mineração de Dados
Processo de Mineração de Dados
Heurísticas
Databases
Data Mining
Data Mining Process
Heuristics
???metadata.dc.subject.cnpq???: Ciência da Computação
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903
Appears in Collections:Mestrado em Ciência da Computação.

Files in This Item:
File Description SizeFormat 
DAVID MOISES BARRETO DOS SANTOS-DISSERTAÇÃO-PPGI 2005.pdf9.64 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.