Logo
Olá visitante Início
A TAREFA DE CLASSIFICAÇÃO E O ALGORITMO ID3 PARA INDUÇÃO DE ÁRVORES DE DECISÃO NA SHELL DE DATA MINING ORION
Autor: DIANA COLOMBO PELEGRIN Enviar e-mailVer Currículo Lattes
Orientador: MERISANDRA CÔRTES DE MATTOS Enviar e-mailVer Currículo Lattes
Co-orientador:PRISCYLA WALESKA SIMÕES Enviar e-mailVer Currículo Lattes
Resumo:
A análise de dados, que compreende a busca de conhecimento, pode tornar-se complexa e exaustiva quando é realizada a partir de um enorme volume de dados. Uma maneira eficaz e inteligente de analisar esses dados pode ser realizada por meio do processo de Knowledge Discovery in Databases (KDD), que reúne vários passos e tarefas para a descoberta de conhecimento relevante em grandes bases de dados, tendo-se como uma de suas etapas a de Data Mining (DM), que é responsável por extrair o conhecimento da base. Na realização desta pesquisa desenvolveu-se o módulo correspondente a tarefa de classificação para a shell de data mining Orion. Essa tarefa é bastante utilizada na análise de dados para definir padrões que descrevem tendências futuras dos mesmos. O método de classificação empregado foi o de árvores de decisão, aplicando-se o algoritmo ID3 para sua indução, este módulo foi desenvolvido no ambiente de programação Java. As funcionalidades do módulo de classificação da Shell Orion consistem em gerar regras, bem como demonstrá-las por meio de uma visualização gráfica no formato de árvore. Nos testes do módulo foi utilizada uma base de dados referente a prevalência de alergia e rinite em escolares de Criciúma, como uma forma de se analisar as regras de classificação geradas. O módulo de classificação da Shell Orion gerou satisfatoriamente as regras referentes aos fatores mais evidentes associados as pessoas que apresentam asma ou rinite. Estas regras obtidas confirmaram conhecimentos já existentes na área, bem como demonstraram novas relações que podem auxiliar na análise do perfil destas doenças em Criciúma.
Início: 2005.1  Término: 2005.2
Palavras-chave: Descoberta De Conhecimento Em Base De Dados , Data Mining , Classificação , ?rvores De Decisão , Algoritmo Id3



Curso de Ciência da Computação (UNESC)