Kdd e dm

Disponível somente no TrabalhosFeitos
  • Páginas : 18 (4369 palavras )
  • Download(s) : 0
  • Publicado : 3 de dezembro de 2012
Ler documento completo
Amostra do texto
Data Mining
HISTÓRICO
Década de 60: Coleções de dados, criação de BD
Década de 70: Modelos de dados relacionais, implementação de DBMS relacionais
Década de 80: RDBMS, modelos avançados de dados (relacional estendido, OO, dedutivo etc.) e DBMS orientados à aplicação (espaciais, científicos, de engenharia etc.).
Década de 90: Data mining e data warehousing, bases de dados multimídia,e tecnologia Web

KDD E MINERAÇÃO DE DADOS
Data Mining – Parte de um processo maior (KDD) interessado em:
Melhoria no desempenho
Representação inteligível
Conhecimento obtido interessante, inovador
MOTIVAÇÕES PARA DM
Abundância de dados industriais e comerciais
Foco competitivo – Gerenciamento do conhecimento
Computadores poderosos e baratos
Fundamentos avançados emAprendizagem de máquina & lógica
Estatística
Sistemas de gerenciamento de BD

CARACTERÍSTICAS DESEJÁVEIS DO CONHECIMENTO A SER DESCOBERTO Correto (tanto quanto possível)
Compreensível por usuários humanos
Interessante/útil/novo (surpreendente)

Cadeia de valores
1.Dados: cliente, demográfico, geográfico
2.Informação: x vive com z, x e s mudaram de local
3. Conhecimento:quantidade y de produto
4.Decisão: evitar propagandas para família de perfil p, vender serviço b

KDD X DM

KDD (“Knowledge Discovery in Databases”) é a seleção e o processamento de dados para:
Identificar conhecimento novo, preciso e útil, & Modelar fenômenos do mundo real Mineração de Dados (“Data Mining”) é o principal componente do processo KDD – descoberta de conhecimento em BDProcesso KKD:
1.Estados
Dados originais ->dados consolidados->dados preparados-> padrões modelo->conhecimento
2.processo
consolidação de dados, seleção e pre processamento, data mining, interpretação e avaliação

PASSOS EM DM
Seleção e Pré-Processamento
Limpeza dos dados: (pode exigir 60% do tempo total)
Redução de dados:
Encontrar características úteis, redução dedimensionalidade e ou de variáveis
Determinar a tarefa de DM
Classificação (ou regressão), associação, agrupamento
Escolha do algoritmo
Data Mining: busca pelos padrões interessantes
Interpretação e avaliação: análise dos resultados
Visualização, transformação, remoção de padrões redundantes
Uso do conhecimento descoberto

PRINCIPAIS TAREFAS EM “DATA MINING”
Associação :MARKET BASKET ANALYSIS
Extrair informação sobre comportamento de compra
Informação obtida pode sugerir
Novos leiautes de lojas
Novo conjunto de produtos
Quais produtos colocar em promoção
MBA é aplicável onde um cliente compra vários itens em proximidade
Cartões de crédito
Serviços de companhias de telecomunicações
Serviços bancários
Tratamentos médicos
REGRAS DEASSOCIAÇÃO
Expressa como produtos e serviços se relacionam uns com os outros e tende a agrupá-los em conjuntos
“se um conjunto compra fraldas na sexta-feira, então ele também compra cerveja”
Fácil de entender
Ação possível: colocar cerveja próxima de fraldas quando o fim de semana se aproxima

Agrupamento :
USO DO AGRUPAMENTO
Sem classes pré-definidas
Usado como técnicaindividual para determinar distribuição de dados ou como etapa de pré-processamento para outros algoritmos
Auxilia a compreender como objetos pertencentes a um conjunto de dados tendem a se agrupar naturalmente
Previsão: Classificação / Regressão
Dado um conjunto de registros (conjunto de treinamento )
Cada registro contém um conjunto de atributos, um dos atributos é a classe.
Encontrar ummodelo para o atributo classe como uma função dos valores dos outros atributos.
Objetivo: a registros previamente não-usados deve ser assinalada uma classe tão precisamente quanto possível.
MINERAÇÃO DE DADOS BASEADA EM ÁRVORE DE DECISÃO
Método para aproximar funções-objetivo com valor discreto, no qual a função aprendida é representada por uma árvore de decisão
As árvores aprendidas...
tracking img