Orientador: |
MERISANDRA CÔRTES DE MATTOS  |
Resumo: |
A grande quantidade de dados que é gerada e armazenada nas mais diversas áreas de conhecimento, torna necessário o desenvolvimento de tecnologias destinadas à análise de informações, possibilitando a obtenção de novos conhecimentos. Dentre essas tecnologias, destaca-se o data mining, que por meio da aplicação de algoritmos com finalidades específicas, tenta extrair um conjunto de padrões possivelmente existentes no conjunto de dados, sendo que para isso são utilizadas ferramentas computacionais que em sua maioria são proprietárias. Considerando isso, o Grupo de Pesquisa em Inteligência Computacional Aplicada do Curso de Ciência da Computação da UNESC, mantém em desenvolvimento o projeto da Shell Orion Data Mining Engine que implementa diversos métodos e tarefas de data mining. Objetivando ampliar as funcionalidades da Shell Orion, essa pesquisa consiste na implementação e na demonstração de funcionamento do algoritmo Density-Based Spatial Clustering of Applications With Noise (DBSCAN) que utiliza o conceito de cluster baseado em densidade para a tarefa de clusterização, que tem como objetivo particionar um conjunto de dados em grupos distintos. Considerando a utilização do método de densidade, o algoritmo DBSCAN realiza a clusterização procurando por regiões densas no espaço dos dados, permitindo que sejam encontrados grupos com formatos arbitrários e sejam detectados outliers. Ao final da pesquisa, diversos testes foram efetuados, e o desempenho do algoritmo desenvolvido foi avaliado por meio de medidas estatísticas que comprovaram o correto funcionamento do DBSCAN na Shell Orion Data Mining Engine. |