Data mining

Disponível somente no TrabalhosFeitos
  • Páginas : 4 (753 palavras )
  • Download(s) : 0
  • Publicado : 3 de março de 2013
Ler documento completo
Amostra do texto
1. Introdução


Mineração de dados, ou Data Mining, é o processo de análise de conjuntos de dados que tem por objetivo a descoberta de padrões interessantes e que possam representarinformações úteis. Um padrão pode ser definido como sendo uma afirmação sobre uma distribuição probabilística. Estes padrões podem ser expressos principalmente na forma de regras, fórmulas, funções, entreoutras.

O interesse por este tipo de informação se deve principalmente ao fato de que as empresas e organizações estão coletando e armazenando grandes quantidades de dados como conseqüência da queda dospreços de meios de armazenamento e computadores e do aumento da capacidade de ambos. A popularização na utilização dos Data Warehousing, que são grandes bancos de dados criados para análise e suporteà decisão, tende a aumentar ainda mais a quantidade de informações disponível. Os métodos tradicionais de análise de dados, como planilhas e consultas, não são apropriados para tais volumes de dados,pois podem criar relatórios informativos sobre os dados, mas não conseguem analisar o conteúdo destes relatórios a fim de obter conhecimentos importantes.










2. Data MiningCom a geração de um volume cada vez maior de informação, é essencial tentar aproveitar o máximo possível desse investimento. Grandes corporações possuem seus sistemas de gestão, esses, armazenamem seus bancos de dados os acontecimentos do dia-a-dia: estoques, pedidos, compras, orçamentos, contábil, financeiro, jurídico, pós-venda, relacionamento com cliente, vendas entre outros. Talvez aforma mais prática de se utilizar desses repositórios seja tentar descobrir se há algum conhecimento escondido neles.
O processo de Data Mining, ocorre por diversos algoritmos, que processa osdados e retira deles outros dados válidos, novos e valiosos. É importante ressaltar que embora os algoritmos sejam capazes de descobrir dados validos e novos, ainda precisamos de uma interação forte...
tracking img