Datamining

Disponível somente no TrabalhosFeitos
  • Páginas : 24 (5968 palavras )
  • Download(s) : 0
  • Publicado : 15 de outubro de 2012
Ler documento completo
Amostra do texto
Conceitos e Aplicações de Data Mining
Data Mining Concepts and Applications
HELOISA HELENA SFERRA
Universidade Metodista de Piracicaba (Piracicaba, Brasil) hhsferra@uol.com.br

ÂNGELA M. C. JORGE CORRÊA
Universidade Metodista de Piracicaba (Piracicaba, Brasil) ajcorrea@unimep

RESUMO Atualmente, muito se fala em Data Mining, encontrando-se na literatura significativa variedade de estudossobre o tema. Este artigo tem como objetivo introduzir conceitos básicos dessa tecnologia a interessados que ainda estão iniciando o estudo de Data Mining. Nesse contexto, o presente texto pretende apresentar alguns desses conceitos sobre as técnicas que envolvem a descoberta de conhecimento em grandes conjuntos de dados, além de registrar algumas características de um software específico paramineração de dados, o Clementine, da SPSS, bem como algumas aplicações realizadas nessa ferramenta. Palavras-chave MINERAÇÃO DE DADOS – DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS – ANÁLISE EXPLORATÓRIA DE DADOS – MODELOS ESTATÍSTICOS DE RELACIONAMENTO ENTRE VARIÁVEIS – CLEMENTINE/SPSS. ABSTRACT Much is said about Data Mining nowadays and there is a significant variety of studies on the subject. Thispaper’s aim is to introduce some of the technology’s basic concepts to those who are beginning their studies on Data Mining. In such context, the present article presents some of the concepts related to the techniques involved in knowledge discovery within large databases. Moreover, it presents some features of a specific software for Data Mining: Clementine, from SPSS. The paper also indicates someapplications for this tool’s use. Keywords DATA MINING – KNOWLEDGE DISCOVERY IN DATABASES – EXPLORATORY ANALYSIS – STATISTICAL MODELS OF RELATIONSHIP BETWEEN VARIABLES – CLEMENTINE/SPSS.
REVISTA DE CIÊNCIA & TECNOLOGIA • V. 11, Nº 22 – pp. 19-34

19

INTRODUÇÃO
rápida evolução dos recursos computacionais ocorrida nos últimos anos permitiu que, simultaneamente, fossem gerados grandes volumesde dados. Estima-se que a quantidade de informação no mundo dobra a cada 20 meses e que o tamanho e a quantidade dos bancos de dados crescem com velocidade ainda maior (Dilly, 1999). O explosivo crescimento do volume de dados tem gerado uma urgente necessidade de novas técnicas e ferramentas capazes de transformar, de forma inteligente e automática, terabytes de dados em informações significativase em conhecimento. Essas informações, de grande valia para o planejamento, gestão e tomadas de decisão, estão, na verdade, implícitas e/ou escondidas sob uma montanha de dados, e não podem ser descobertas ou, no mínimo, facilmente identificadas utilizando-se sistemas convencionais de gerenciamento de banco de dados. Em resposta a essa necessidade, surgiu o Data Mining (DM), também chamado deMineração de Dados. Data Mining é uma tecnologia que emergiu da intersecção de três áreas: estatística clássica, inteligência artificial e aprendizado de máquina, sendo a primeira a mais antiga delas. Observa-se que o Data Mining é parte de um processo maior conhecido como KDD (Knowledge Discovery in Databases) – em português, Descoberta de Conhecimento em Bases de Dados –, que, segundo Addrians &Zantinge (1996), permite a extração não trivial de conhecimento previamente desconhecido e potencialmente útil de um banco de dados. Esse conceito é enfatizado por Fayyad et al. (1996b), ao afirmar que é “o processo não trivial de identificação de padrões válidos, desconhecidos, potencialmente úteis e, no final das contas, compreensíveis em dados”. Nesse contexto, o presente artigo tem como finalidadeapresentar conceitos sobre as principais técnicas que envolvem a descoberta de conhecimento em grandes conjuntos de dados e relatar algumas características de um software específico para mineração de dados, o Clementine, da SPSS, bem como aplicações realizadas nesta ferramenta. Assim, são mostrados o processo de descoberta de conhecimento (KDD) e o Data Mining (DM), como parte desse processo, bem...
tracking img