Data mining

Disponível somente no TrabalhosFeitos
  • Páginas : 5 (1023 palavras )
  • Download(s) : 0
  • Publicado : 28 de outubro de 2012
Ler documento completo
Amostra do texto
Sumário
1. INTRODUÇÃO 3
2. Data Mining 4
3. Knowledge Discovery in Databases (KDD) 5
3.1. O PROCESSO DE KDD 5
3.2. ETAPAS DO KDD 5
4. regras 6
5. conclusão 7
6. bibliografia 8


1. INTRODUÇÃO

Atualmente, as empresas tem bases de dados cheias de informação obtidas diariamente, porém muitas não tem o verdadeiro conhecimento das informações. Este conhecimento dos dados pode ser odiferencial para o sucesso, pois como dizia Francis Bacon “Conhecimento é Poder.”.


2. Data Mining

O conceito de Mineração de dados está se tornando cada vez mais popular como uma ferramenta de descoberta de informações, que podem revelar estruturas de conhecimento, que nos guiam a decisões de incertezas.

“Mineração de dados é a busca de informações valiosas em grandes bancos de dados. É umesforço de cooperação entre homens e computadores. Os homens projetam banco de dados, descrevem problemas e definem seus objetivos. Os computadores verificam dados e procuram padrões que casem com as metas estabelecidas pelos homens.”
Pode-se tirar como exemplo a mineração do banco de dados de uma grande loja de departamentos dos EUA, revelou que grande parte dos consumidores que fazem comprasnas noites de quinta-feira, costuma adquirir os dois produtos: fraldas e cerveja, com isso eles colocaram os dois produtos próximos e tiveram um aumento significativo nas vendas.


3. Knowledge Discovery in Databases (KDD)
3.1. O PROCESSO DE KDD
O processo de descoberta de conhecimento em bancos de dados - Knowledge Discovery in Databases - KDD refere-se ao processo não trivial deidentificação de novos padrões válidos, potencialmente úteis e compreensíveis em conjuntos de dados.
A descoberta de conhecimento em banco de dados tem ampla aplicação prática em diversos domínios da ciência, principalmente aplicações que envolvem a tecnologia da informação.
Assim, os bancos de dados representam depósitos de conhecimento em potencial, que podem ser explorados para se descobrir relações,padrões e regras.
O termo KDD refere-se ao processo completo de descoberta de conhecimento em dados e envolve diversas Fases e Tarefas. A figura a seguir apresenta uma visão hierárquica do processo de KDD.


3.2. ETAPAS DO KDD
O KDD passa pelas etapas de Seleção, Pré-processamento, Transformação, Data Mining, Interpretação e Avaliação.
3.2.1. SELEÇÃO


3.2.2. PRÉ-PROCESSAMENTO
Para iniciara etapa de pré-processamento é necessário efetuar a seleção de dados considerada importante para a organização, ou seja, selecionar um conjunto de dados, pertencentes a um domínio, para que, a partir de um critério definido pelo especialista do domínio, possa ser analisado. Após seleção de dados, é necessário aplicar métodos de tratamento, pois na maioria das vezes os dados disponíveis paraanálise encontram-se em um formato inadequado para realização do processo de KDD, denominado de limpeza dos dados.
Após o processo de limpeza dos dados é necessário realizar a codificação dos dados, com o intuito de que estejam na forma correta para serem usados como entrada dos algoritmos de mineração de dados, para posteriormente enriquecê-los de forma a agregar de alguma forma mais informação parao processo de extração de conhecimento.
Outro ponto importante a ser considerado na etapa de pré-processamento é que em virtude das restrições de espaço em memória ou tempo de processamento com relação ao número de exemplos e de atributos disponíveis para a análise, pode inviabilizar a utilização de algoritmos de extração de padrões, sendo necessária a aplicação de métodos de redução de dadosantes de iniciar a busca pelos padrões (REZENDE, 2003).

3.3.3 TRANSFORMAÇÃO
Nesta etapa é feita a transformação dos dados em formatos utilizáveis,
4. regras
Para criação das regras, foi utilizado uma base de dados voltada a área da saúde, para identificar os maiores causadores de doenças e para se antecipar a outras doenças.

Resultado no Weka:
1. colesterol=SIM diabetes=SIM 24 ==>...
tracking img