A importância do data mining na descoberta de padrões e tendências nos dados

Hoje em dia, a quantidade de dados gerados e armazenados no decurso de uma qualquer actividade excede a capacidade de análise desses mesmos dados sem o uso de técnicas de análise automatizadas. Como consequência deste aumento efetivo de informação, o processamento através de métodos tradicionais tor...

Full description

Bibliographic Details
Main Author: Bastos, Pedro (author)
Format: conferenceObject
Language:por
Published: 2011
Subjects:
Online Access:http://hdl.handle.net/10198/4315
Country:Portugal
Oai:oai:bibliotecadigital.ipb.pt:10198/4315
Description
Summary:Hoje em dia, a quantidade de dados gerados e armazenados no decurso de uma qualquer actividade excede a capacidade de análise desses mesmos dados sem o uso de técnicas de análise automatizadas. Como consequência deste aumento efetivo de informação, o processamento através de métodos tradicionais tornou-se mais difícil e complexo. As ferramentas convencionais de análises de dados têm capacidades limitadas em detetar padrões e descobrir o conhecimento inserido nos dados, pois só utilizam métodos estatísticos. Surgiu então a urgente necessidade de uma nova geração de técnicas e ferramentas computacionais de forma a assistir o ser humano na extração de informação útil, isto é, conhecimento. Assim, no final dos anos 80 emergiu a área da descoberta de conhecimento em bases de dados (Knowledge Discovery in Databases – KDD), recorrendo a modelos e técnicas de Data Mining para extrair conhecimento útil, padrões e tendências, previamente desconhecidas, de forma autónoma e semi-automática. O Data Mining e a descoberta de conhecimento em bases de dados tornaram-se proeminentes campos de pesquisa em constante e rápido crescimento. Atualmente muitas técnicas e algoritmos têm sido desenvolvidos e utilizados em Data Mining. O Data Mining, por outro lado, através do uso de algoritmos específicos ou de mecanismos de pesquisa, tenta descobrir padrões discerníveis e tendências nos dados, inferindo regras para os mesmos. O processo de Data Mining torna-se mais fácil de compreender, implementar e desenvolver se for enquadrado no contexto de uma metodologia. A ferramenta de Data Mining IBM SPSS Modeler consiste numa ferramenta de Data Mining capaz de desenvolver rapidamente modelos preditivos especializados em vários ramos de negócio e implementá-los em operações de forma a melhorar o processo de toma de decisão. Concebido em torno da metodologia CRISP-DM (Cross-Industry Standard Process for Data Mining), o Modeler suporta todo o processo de Data Mining, partindo dos dados e atingindo os melhores resultados para o negócio. A ferramenta integra um conjunto de algoritmos de modelação e aprendizagem, com uma interface de programação visual que torna compreensível todo o processo de extração de conhecimento a partir de diversas fontes de dados. O utilizador elabora projetos ou streams, onde define as sequências de operações que deseja realizar sobre os dados (processo de extração de conhecimento). Estas operações são representadas por ícones que estão agrupados de acordo com o seu tipo de funcionalidade.