Mineração de dados

Páginas: 6 (1262 palavras) Publicado: 21 de maio de 2012
UNIVERSIDADE DO SUL DE SANTA CATARINA
RAFAEL NUNES DE SOUSA

Mineração de Dados

Tubarão
2011
Sumário
1.Introdução 5
2. Fases do KDD 6
2.1Seleção 6
2.2 Pré-processamento 6
2.3 Transformação 7
2.4 Data mining 7
2.5 Interpretação e Avaliação 7
3.Descrição da Base de Dados 8
4.Regras Weka 9
5.Conclusão 11
6.Referencias 12

1.Introdução

As empresas nos dias de hojetem um grande problema com o armazenamento de dados. E o que antes se acreditava ser informações inúteis hoje é uma grande forma de conhecer o seu mercado, clientes entre outros.
Neste contexto está situado o KDD (Knowledge Discovery in Databases) [FAYY96], que busca extrair de grandes bases de dados as informações que não podem ser encontradas a olho nu. Inserido neste processo de descoberta,temos uma etapa que denominamos Datamining (Mineração) onde são aplicadas as técnicas para buscar as informações.

2. Fases do KDD

O Significado de KDD é “Knowledge Discovery in Database”, e isso refere-se a um trabalho de extração de informações de uma determinada base de dados. Esta extração pode resultar em algumas regras ou associação de dados que possam ser usadas em uma tomada dedecisão ou também em uma forma de analisar o comportamento de em algumas situações corriqueiras como a simples tarefa de ir ao mercado e comprar alguma coisa. Essa técnica foi criada pois o volume de informações estava aumentando muito e o trabalho de analise de tais situação levava muito tempo. A automatização então foi uma forma de facilitar o trabalho e deixa lo mais rápido.
Esse tipo deextração segue etapas, cada etapa gera um conjunto de conhecimentos , de informação de difícil detecção em métodos mais lentos ou tradicionais de leitura e análise. Refere-se às informações de grande valor para uma tomada de decisão. Esse tipo de extração permite que as organizações consigam detectar informações mais profundas que estão escondidas no banco de dados.
O KDD é uma extração de descobertade conhecimento que em seu processo segue as seguintes fases específicas:

2.1Seleção
Selecionar um conjunto de dados ou dar ênfase para um subconjunto de variáveis ou exemplo de dados nos quais o "descobrimento" será realizado. Nessa etapa será realizada a identificação, a partir do banco de dados, da amostra de dados onde será aplicado o processo de descobrimento de conhecimento. É importanteque fique claro como se deu o tratamento desses dados, sua homogeneidade, alterações sofridas ao longo do tempo e as estratégias para a amostragem.

2.2 Pré-processamento
Neste estágio acontece a limpeza dos dados. Limpeza dos dados: A limpeza dos dados envolve uma verificação da consistência das informações, a correção de possíveis erros e o preenchimento ou a eliminação de valores nulos eredundantes. Nessa fase são identificados e removidos os dados duplicados ou corrompidos. A execução dessa fase corrige a base de dados eliminando consultas desnecessárias que seriam executadas pelo algoritmo minerador e que afetariam o seu processamento.

2.3 Transformação
A transformação codificação divide os valores contínuos dos atributos (inteiros ou reais) numa lista de intervalosrepresentados por um código. Ele efetivamente converte valores quantitativos em valores categóricos. A codificação de dados é potencialmente a tarefa onde há a necessidade de grande habilidade no processo de KDD. Tipicamente essa etapa exige a experiência do analista de dados e do seu conhecimento nos dados em questão. Embora o processo de KDD possa ser executado sem essa fase, nota-se que quandoefetivada os resultados obtidos são mais intuitivos e valiosos, além de que, na maioria das vezes, facilita a construção do modelo.

2.4 Data mining
Na fase de Mineração de dados é que se buscam os relacionamentos e padrões globais existentes nas bases de dados. Considerando que o número dos possíveis relacionamentos existentes em um banco de dados é muito grande não é adequado buscar esses...
Ler documento completo

Por favor, assinar para o acesso.

Estes textos também podem ser interessantes

  • Mineração de dados
  • Mineração de dados
  • Mineração de dados
  • Mineração de dados
  • Mineração de dados
  • Mineração de dados
  • Mineração de dados
  • Mineração de dados

Seja um membro do Trabalhos Feitos

CADASTRE-SE AGORA!