Data mining

Disponível somente no TrabalhosFeitos
  • Páginas : 11 (2585 palavras )
  • Download(s) : 0
  • Publicado : 11 de março de 2011
Ler documento completo
Amostra do texto
Data Mining

Háddamus Vinícius de S.R.1

Ciência da Computação – Centro de Ensino Unificado de Teresina (CEUT)
Av.dos Expedicionários, 790 - B. São João– 64.046-700 – Teresina – PI – Brazil

haddamusvinicius@gmail.com

Abstract. The discovery of knowledge is a very important activity, where most of the data mining methods are based on concepts of machine learning, statistics, patternrecognition, clustering, classification and models graphs.The results of the process of knowledge discovery can be shown in several ways that should enable a thorough analysis in identifying the need to return any of the earlier stages of the KDD process.

Resumo. A descoberta do conhecimento é uma atividade muito importante, onde a maioria dos métodos de data mining são baseados emconceitos de aprendizado de máquina, estatística, reconhecimento de padrões, agrupamento, classificação e modelos gráficos.Os resultados do processo de descoberta do conhecimento podem ser mostrados de diversas formas que devem possibilitar uma análise criteriosa na identificação da necessidade de retorno a qualquer um dos estágios anteriores do processo de KDD.

1. Introdução

A rápidaevolução dos recursos computacionais ocorrida nos últimos anos permitiu que, simultaneamente, fossem gerados grandes volumes de dados. Estima-se que a quantidade de informação no mundo dobra a cada 20 meses e que o tamanho e a quantidade dos bancos de dados crescem com velocidade ainda maior. O explosivo crescimento do volume de dados tem gerado uma urgente necessidade de novas técnicas e ferramentascapazes de transformar, de forma inteligente e automática, terabytes de dados em informações significativas e em conhecimento. Essas informações, de grande valia para o planejamento, gestão e tomadas de decisão, estão, na verdade, implícitas e/ou escondidas sob uma montanha de dados, e não podem ser descobertas ou, no mínimo, facilmente identificadas utilizando-se sistemas convencionais degerenciamento de banco de dados. Em resposta a essa necessidade, surgiu o Data Mining (DM), também chamado de Mineração de Dados. Data Mining é uma tecnologia que emergiu da intersecção de três áreas: estatística clássica, inteligência artificial e aprendizado de máquina, sendo a primeira a mais antiga delas. Observa-se que o Data Mining é parte de um processo maior conhecido como KDD (Knowledge Discoveryin Databases).

2. Mineração de dados

A mineração de dados pode ser considerada como uma parte do processo de descoberta de Conhecimento em Banco de Dados (KDD – Knowledge Discovery in Databases).
O termo KDD é usado para representar o processo de tornar dados de baixo nível em conhecimento de alto nível, enquanto mineração de dados pode ser definida como a extraçãode padrões ou modelos de dados observados. A mineração de dados combina métodos e ferramentas das seguintes áreas: aprendizagem de máquina, estatística, banco de dados, sistemas especialistas e visualização de dados, conforme Figura.

[pic]

Os principais objetivos da mineração de dados são descobrir relacionamentos entre dados e fornecer subsídiospara que possa ser feita uma previsão de tendências futuras baseada no passado.
Os resultados obtidos com a mineração de dados podem ser usados no gerenciamento de informação, processamento de pedidos de informação, tomada de decisão, controle de processo e muitas outras aplicações.
A mineração de dados pode ser aplicada de duas formas: como um processo de verificação e como umprocesso de descoberta. No processo de verificação, o usuário sugere uma hipótese acerca da relação entre os dados e tenta prová-la aplicando técnicas como análises estatística e multidimensional sobre um banco de dados contendo informações passadas. No processo de descoberta não é feita nenhuma suposição antecipada. Esse processo usa técnicas, tais como descoberta de regras de associação,...
tracking img