Ddddd

Disponível somente no TrabalhosFeitos
  • Páginas : 10 (2395 palavras )
  • Download(s) : 0
  • Publicado : 23 de março de 2011
Ler documento completo
Amostra do texto
Um data warehouse de publicações científicas: indexação automática da dimensão tópicos de pesquisa dos data mar ts
Augusto Kanashiro

Um data warehouse de publicações científicas: indexação automática da dimensão tópicos de pesquisa dos data mar ts

Augusto Kanashiro

Orientador: Prof. Dr. Alneu de Andrade Lopes

Dissertação apresentada ao Instituto de Ciências Matemá- ticas e deComputação — ICMC/USP como parte dos re- quisitos para obtenção do título de Mestre em Ciência de Computação e Matemática Computacional.

―VERSÃO REVISADA APÓS A DEFESA‖

Data da defesa: 04 / 05 /

2007 Visto do Orientador:

USP - São Carlos Julho/2007

Agradecimentos

Agradeço a minha família pelo apoio e suporte em todos os momentos. Meus pais, Roberto e Rosa, pela educação, amor e por meensinarem os verdadeiros valores da vida, e meu irmão Alexandre. Ao Professor Alneu pela orientação e principalmente por sua compreensão e apoio nos mo- mentos mais difíceis. Agradeço aos professores Mauro Biajiz e Caetano Traina pelas sugestões e correções no exame de qualificação que foram fundamentais ao rumo deste projeto. Aos professores Gustavo Nonato e Odemir Bruno pelas sugestões e ajudanos experimentos com wavelets. Agradeço ao meu amigo Valmir, que desde o início se prontificou a me ajudar, me orientando em todo projeto e implementação de banco de dados. Sua ajuda foi essencial para este trabalho. Aos co legas do Labic, incluindo os keepers Ronaldo, Edson e Richardson, que sempre esti- veram prontamente dispostos a me ajudar e aos colegas de projeto Chris, Beto e, em especial, aoVinicius que me ajudou em diversos momentos. Também tenho que agradecer colegas de outras áreas como Mário, Joselene e Bruno. Aos amigos e companheiros com quem convivi grande parte do tempo nesse período de mes- trado, Jean, Maikon e Luis Henrique, e outros amigos muito próximos a mim no dia a dia, Valter e Guilherme. Agradeço a todos amigos da turma PgCompUSP04. Às secretárias da pós-graduaçao,sempre muito prestativas, e todos os funcionários do ICMC. Agradeço aos meus familiares, amigos e todas as pessoas que me ajudaram a chegar até aqui. Por fim, agradeço ao CNPq pelo auxílio financeiro imprescindível para a realização deste trabalho.

Resumo

Este trabalho d e mestrado insere-se no co ntexto do projeto de uma Fer- ramenta Inteligente de Apoio à Pesquisa (FIP), sendo desenvolvidano La- boratório de Inteligência Computacional do ICMC-USP. A ferramenta foi proposta para recuperar, organizar e minerar grandes conjuntos de docu- mentos científicos (na área de computação). Nesse contexto, faz-se neces- sário um repositório de artigos para a FIP. Ou seja, um Data Warehouse que armazene e integre todas as informações extraídas dos documentos recuperados de diferentes páginaspessoais, institucionais e de repositórios de artigos da Web. Para suportar o processamento analítico on-line (OLAP) das informações e facilitar a ―mineração‖ desses dados é importante que os dados estejam armazenados apropriadamente. Dessa forma, o trabalho de mestrado teve como objetivo principal projetar um Data Warehouse (DW) para a ferramenta FIP e, adicionalmente, realizar experimentos comtécnicas de mineração e Aprendizado de Máquina para automatizar o processo de indexação das informações e documentos armazenados no data warehouse (descoberta de tópicos). Para as consultas multidimensionais foram cons- truídos data marts de forma a permitir aos pesquisadores avaliar tendências e a evolução de tópicos de pesquisa.

i

Abstract

This dissertation is related to the project of anIntelligent Tool for Rese- arch Su pporting (FIP), being developed at the Laboratory of Computational Intelligence at ICMC-USP. The tool was proposed to retrieve, organize, and mining large sets of scientific documents in the field of computer science. In this context, a repository of articles becomes necessary, i.e., a Data Wa- rehouse that integrates and stores all extracted information from...
tracking img