Data mining

Disponível somente no TrabalhosFeitos
  • Páginas : 7 (1727 palavras )
  • Download(s) : 0
  • Publicado : 26 de setembro de 2012
Ler documento completo
Amostra do texto
Data Mining
Investigação

18/09/2012 - 20/09/2012

Conceitos estudados
Data Mining:
Gordon (1998, p. 196):
"um processo que emprega tecnologia de informação, software e hardware,
para revelar padrões de comportamento, tendências e correlações
anteriormente desconhecidas que surgem do tributo da informação
warehoused”
Thearling (1998):
“os utilizadores deste sistema constroemmodelos para prever comportamento
de compra, clientes com maior probabilidade de cessar laços com a empresa,
etc”.
(...) possibilita a distinção de clientes de elevado potencial entre milhares que
se encontram na base de dados da empresa.
Usama Fayyad (Fayyad et al. 1996):
"...o processo não-trivial de identificar, em dados, padrões válidos, novos,
potencialmente úteis e ultimamentecompreensíveis"


Conceitos estudados
Data Mining é o processo de explorar grandes quantidades de dados à procura
de padrões consistentes, como regras de associação ou sequências temporais, para
descobrir relacionamentos sistemáticos entre variáveis, detectando assim novos
subconjuntos de dados. A informação extraída pode ser vista como um resumo dos
dados recolhidos e pode ser utilizada para umaanálise posterior e facilitar a toma de
decisões.


Conceitos estudados
Data Mining:
Técnicas utilizadas:
o Redes neuronais;
o Árvores de decisão;
o Indução por regra;
o Software de visualização de informação.

Footer

O que se procura:
Associações - elementos que surjam em conjunto;
Sequências - padrões sequenciais em consumos, transacções,
comportamentos, etc;
Classificações -são encontradas com base no historial do cliente, que
permitirá construir um padrão de comportamento;
Clusters - agrupamento de elementos com características comuns;
Previsões - é possível aplicar modelos matemáticos de previsão aos
dados do DW, que estão por ordem cronológica.

Conceitos estudados
O processo Data Mining tem como principais objectivos os de descrever e prever ocomportamento de fenómenos.
Descrever - encontrar o que faça sentido e que consiga explicar os resultados obtidos;
Prever - antecipar o comportamento ou o valor futuro de alguma variável de interesse
com base em conhecimento de valores do passado.
Genericamente, as principais estratégias para para atingir estes objectivos são:
Estratégia

Algoritmos

Descrição

Classificação

Árvores de decisãoe redes
neuronais

Busca de uma função que consiga mapear uma
determinada ocorrência

Agregação

Métodos estatísticos e redes
neuronais

Também chamado de clustering consiste na
busca de similaridades entre os dados

Associação

Métodos estatístico e teoria de
conjuntos

Consiste em identificar factos que possam ser
associados

Regressão

Métodos de regressão e redesneuronais

Consiste na busca por uma função que
represente o comportamento apresentado por um
fenómeno.

Métodos estatísticos e redes
neuronais

Representa aquela classe de problemas nos
quais estamos interessados em prever o
comportamento futuro com base em problemas
anteriores.

Predição

Conceitos estudados
Modelos:
Existem vários modelos que tem servem de referencia de comoorganizar o
processo de recolha, analise, disseminação de dados, implementação dos
resultados e melhorias de monitorização.
o

CRISP -

o

DMAIC -

o

SEMMA -


Conceitos estudados
Data Mining - Modelos
o

CRISP
Processo que descreve abordagens usadas por especialistas data mining para
resolver problemas.
Este modelo apresenta 6 fases:
Business Understanding - Descrição docontexto, definição dos objectivos e
criterios de sucesso e inventario de recursos disponiveis;

Data Understanding - Recolha de dados, descrição, exploração e controlo de
qualidade;
Data Preparation - Seleção e limpeza de dados, construção e consolidação;
Modeling - Escolher as melhores tecnicas que podem resolver o problema;
Evaluation - Aplicação do modelo na amostra
Deployment -...
tracking img