Seleção de modelos de classificação através de heurísticas.

Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903

Title:	Seleção de modelos de classificação através de heurísticas.
Other Titles:	Selection of classification models through heuristics.
???metadata.dc.creator???:	SANTOS, David Moises Barreto dos.
???metadata.dc.contributor.advisor1???:	SAMPAIO, Marcus Costa.
???metadata.dc.contributor.referee1???:	GOMES, Herman Martins.
???metadata.dc.contributor.referee2???:	RUIZ, Duncan Dubugras Alcoba.
Keywords:	Bancos de Dados;Mineração de Dados;Processo de Mineração de Dados;Heurísticas;Databases;Data Mining;Data Mining Process;Heuristics
Issue Date:	19-Jul-2005
Publisher:	Universidade Federal de Campina Grande
Citation:	SANTOS, David Moises Barreto dos. Seleção de modelos de classificação através de heurísticas. 2005. 97 f. Dissertação (Mestrado em Informática)– Programa de Pós-Graduação em Informática, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2005. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903
???metadata.dc.description.resumo???:	O processo de indução automática de modelos de classificação é composto de três etapas principais, pela ordem: amostragem, fragmentação e classificação. Devido à diversidade de técnicas que podem ser utilizadas em cada uma destas etapas, os resultados são muito instáveis — não existe a melhor técnica de amostragem, ou de fragmentação, etc. Para resolver o problema da indução do melhor modelo de classificação dentro de um espaço de busca, uma alternativa é arranjar todas as técnicas de amostragem, fragmentação e classificação disponíveis e buscar exaustivamente o melhor modelo de classificação. Entretanto, isto implicará em um alto custo computacional. Neste trabalho, descrevemos como foi possível descobrir heurísticas que podem ajudar a reduzir substancialmente o espaço de busca do melhor modelo de classificação. Também, discutimos o projeto e a implementação de um "framework" baseado nas heurísticas descobertas, objetivando guiar o minerador a escolher um modelo de classificação que satisfaça seus requisitos de qualidade, traduzidos em acurácia do modelo de classificação induzido, a um custo de processamento aceitável.
Abstract:	The automated induction process of classification models is composed of the following steps: sampling, splitting and classification. Due to the diversity of techniques that may be used in each one of these steps, the results are much unstable — there is not the best sampling technique or the best splitting technique and so on. In order to solve the problem of inducing the best classification model within a search space, one way may arrange all available techniques for sampling, splitting and classification to search exhaustively the best classification model. However, this will imply in a high computational cost. In this work, we describe how to discover heuristics that help to reduce this computational cost. Also, we discuss the design and implementation of a framework that was developed based on the heuristics discovered in order to guide the miner in choosing a classification model which satisfies his or her quality requirements translated in the accuracy of the classification model induced with acceptable computational cost.
Keywords:	Bancos de Dados Mineração de Dados Processo de Mineração de Dados Heurísticas Databases Data Mining Data Mining Process Heuristics
???metadata.dc.subject.cnpq???:	Ciência da Computação
URI:	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903
Appears in Collections:	Mestrado em Ciência da Computação.

Files in This Item:

File	Description	Size	Format
DAVID MOISES BARRETO DOS SANTOS-DISSERTAÇÃO-PPGI 2005.pdf	David Moises Barreto dos Santos - Dissertação (PPGCC) 2005.	1.15 MB	Adobe PDF	View/Open

Show full item record