Orientador: |
MERISANDRA CÔRTES DE MATTOS  |
Resumo: |
A evolução dos modelos de armazenamento de dados possibilitou, às mais diversas organizações, a criação de grandes bases de dados. A fim de extrair conhecimento novo e útil destas bases de dados, com o objetivo de auxiliar estas empresas na tomada de decisão, surgiu o conceito de data mining, etapa principal do processo de descoberta de conhecimento, onde as ferramentas responsáveis por auxiliar neste processo são denominadas shells. Considerando isto, encontra-se em desenvolvimento, pelo Grupo de Inteligência Computacional Aplicada da UNESC, o projeto da Shell Orion Data Mining Engine, que consiste na criação de uma ferramenta gratuita que implemente, por meio de diferentes métodos, o processo de descoberta de conhecimento. Desta forma, esta pesquisa fundamentou-se, inicialmente, na demonstração matemática e implementação dos algoritmos de lógica fuzzy Robust CPrototypes e Unsupervised Robust C-Prototypes, sendo que posteriormente, devido a sua importância, foi implementado o Fuzzy C-Means, para a tarefa de clusterização. A tarefa de clusterização tem como objetivo procurar padrões e relações nos dados, formando grupos de objetos similares, sendo que o método de lógica fuzzy auxilia neste processo, por possibilitar aos elementos pertencerem a diversos grupos simultaneamente. Além disto, os algoritmos Robust C-Prototypes e Unsupervised Robust C-Prototypes utilizam funções, que aplicadas ao método de lógica fuzzy, melhoram os resultados gerados por estes algoritmos, quando aplicados em bases contaminadas por ruídos. Ao final da pesquisa foram efetuados vários testes que comprovaram, junto com os métodos de validação aplicados aos resultados, o correto funcionamento dos modelos implementados. |