Logo
Olá visitante Início
O TEOREMA DE PROBABILIDADE PELO ALGORITMO NAIVE BAYES PARA A TAREFA DE CLASSIFICAÇÃO NA SHELL ORION DATA MINING ENGINE
Autor: MARCIO NOVASKI Enviar e-mailVer Currículo Lattes
Orientador: MERISANDRA CÔRTES DE MATTOS Enviar e-mailVer Currículo Lattes
Resumo:
As constantes inovações tecnológicas na atualidade proporcionam um aumento gradativo da quantidade de informação que é armazenada gerando grandes bases de dados, tornando necessário o uso de tecnologias que auxiliem na análise e entendimento dessas informações. O data mining destaca-se dentre essas tecnologias, possibilitando a obtenção do conhecimento por meio de algoritmos com finalidades específicas para cada problema proposto. Para isso é necessário o uso de ferramentas computacionais, as Shells, que na sua maioria são proprietárias. Por esse motivo, o Grupo de Pesquisa em Inteligência Computacional Aplicada do Curso de Ciência da Computação da UNESC, mantém em desenvolvimento o projeto de uma ferramenta que implementa diversos métodos e tarefas do data mining denominada Shell Orion Data Mining Engine. O objetivo dessa pesquisa consiste em ampliar as funcionalidades da Shell Orion, implementando e demonstrando o funcionamento do algoritmo Naive Bayes para a tarefa de classificação. O algoritmo utiliza os conceitos estatístico e probabilístico da teoria de Thomas Bayes para determinar a classe a qual um determinado registro pertence. Para isso, baseia-se nas informações das probabilidades a priori e a posteriori, onde o resultado prevalece de acordo com a classe que apresentar a probabilidade máxima. Ao final da pesquisa foram realizados testes em uma base de dados e o desempenho do algoritmo foi avaliado usando algumas medidas de validação como sensibilidade, especificidade, acurácia, confiabilidade positiva e índice kappa. Os resultados apresentados mostraram que, para a base de dados escolhida durante os testes, o algoritmo apresentou uma taxa de acerto de 99,14% de acerto, o que comprovou o correto funcionamento do Naive Bayes na Shell Orion Data Mining Engine.
Início: 2011.2  Término: 2012.2
Palavras-chave: Data Mining
Área de concentração: Inteligência Artificial



Curso de Ciência da Computação (UNESC)