Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11786
Title: Integração mineração de dados – SGBD não é uma panacéia: estudo da integração do algoritmo Apriori Quantitativo ao Oracle9i.
Other Titles: Data mining integration - SGBD is not a panacea: study of the integration of the a priori algorithm quantitative to Oracle9i.
???metadata.dc.creator???: SANTOS, Maria de Fátima Almeida.
???metadata.dc.contributor.advisor1???: SAMPAIO, Marcus Costa.
???metadata.dc.contributor.referee1???: BAPTISTA, Cláudio de Souza.
???metadata.dc.contributor.referee2???: BEZERRA, Ed Porto.
Keywords: Banco de Dados;Mineração de Dados;Integração com SGBD;Regras de Associação
Issue Date: 29-Aug-2002
Publisher: Universidade Federal de Campina Grande
Citation: SANTOS, M. de F. A. Integração mineração de dados – SGBD não é uma panacéia: estudo da integração do algoritmo Apriori Quantitativo ao Oracle9i. 2002. 150 f. Dissertação (Mestrado em Informática) – Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2002. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11786
???metadata.dc.description.resumo???: Inicialmente os algoritmos de Mineração de Dados eram utilizados em arquivos de dados especialmente preparados com esta finalidade, sem a gerência de SGBD’s. Entretanto, pesquisas recentes começaram a aparecer com o objetivo de integrar esses dois mundos, visando aliar o potencial das técnicas de mineração às conhecidas vantagens dos SGBD’s como, por exemplo, controle e atomicidade de transações, segurança, robustez e otimização de consultas. Este trabalho é principalmente sobre a implementação de um algoritmo de mineração de dados considerado estado-da-arte em modelos de regras de associação, denominado Apriori Quantitativo [4], estreitamente integrado com o SGBDOR Oracle9i. O algoritmo praticamente inexiste além da literatura especializada, isto é, nunca tinha sido testado e usado em outros trabalhos. Os resultados obtidos foram então comparados com o clássico algoritmo de regras de associação Apriori [2], também integrado ao Oracle9i, visando avaliar em que medida o primeiro seria superior ao último. Os resultados, de uma certa forma desconcertantes, permite-nos concluir que integrar algoritmos de mineração de dados a SGBD’s não é uma panacéia. Os problemas que tivemos com a integração do Apriori Quantitativo ao Oracle9i são discutidos em detalhes, as conclusões gerais da experiência sendo inferidas. As bases de dados utilizadas pelos algoritmos foram modeladas de duas formas distintas: a primeira, puramente relacional; a segunda, objeto-relacional, fazendo uso do conceito de tipo coleção de dados. Desta forma, um outro objetivo desta dissertação foi verificar a influência das estruturas de dados relacional e objeto-relacional sobre o desempenho dos algoritmos, à procura de conclusões gerais e úteis sobre a superioridade de uma sobre a outra.
Abstract: Most early data mining algorithms were developed largely on specialized file systems, without the DBMS management. However, modern researches begun appeared fitting to couple the database systems and data mining techniques and summing the mining approaches up DBMS’s known advantages as transactions control and atomicity, security, robustness and query optimization. This work analyzes the Quantitative Apriori [4] algorithm, state of the art in association rules generation completely integrated to Oracle 9i Object-Relational DBMS. The algorithm almost never there is over the specialized literature, so it wasn’t be tested and used. The results (execution time) of it were compared to Apriori [2] classical association rules generation algorithm, either coupled to Oracle 9i,looking at analyses how first one would be higher than the last one. The results, although disturbing, let us conclude that couple the data mining algorithms to DBMS’s isn’t an enough solution. The problems that we had with the Apriori Quantitative integration to Oracle9i are discussed in details and the general tests conclusions are being deduced. The databases used for algorithms were modeled by two distinct forms: first, purely relational; second, with object-relational extensions, wearing, for example, collection types. Then, an other work purpose was analyze the data structures relational and object-relational influence about the algorithms performance, looking for general and useful conclusions about superiority of one then other.
Keywords: Banco de Dados
Mineração de Dados
Integração com SGBD
Regras de Associação
???metadata.dc.subject.cnpq???: Ciência da Computação
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11786
Appears in Collections:Mestrado em Ciência da Computação.

Files in This Item:
File Description SizeFormat 
MARIA DE FÁTIMA ALMEIDA SANTOS – DISSERTAÇÃO (PPGCC) 2002..pdfMaria de Fátima Almeida Santos - Dissertação (PPGCC) 2002.917.29 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.