Dw - processo de etl aplicado à área da saúde

Disponível somente no TrabalhosFeitos
  • Páginas : 14 (3371 palavras )
  • Download(s) : 0
  • Publicado : 18 de outubro de 2012
Ler documento completo
Amostra do texto
Processo de ETL Aplicado à área da Saúde
Alexandre Nunes Barbosa1, Silvia de Castro Bertagnolli2
1

Hospital Materno Infantil Presidente Vargas (HMIPV) Porto Alegre – RS – Brasil
2

Centro Universitário Ritter dos Reis (UniRitter) Porto Alegre – RS – Brasil

anunes@himpv.prefpoa.com.br, silviacb@uniritter.edu.br

Abstract. The Hospital Materno Infantil Presidente Vargas has on itsservers, various computer systems in which every day is added a significant amount of information. However, the databases serve only as a repository of information. The focus of this study is to identify patterns in these systems by techniques of Data Mining and the consequent production of knowledge, so that they can be used to support the decision of the Hospital. So, the article reports ETLtechniques used and difficulties encountered during the data mining process. Resumo. O Hospital Materno Infantil Presidente Vargas possui em seus servidores, diversos sistemas informatizados nos quais, diariamente, é inserido um volume expressivo de informações. Porém, os bancos de dados atuam somente como um repositório de informações. O foco deste trabalho consiste na identificação de padrões nestessistemas através de técnicas de Mineração de Dados, e a conseqüente produção de conhecimento, de modo que possam ser utilizados no apoio a decisão do Hospital. Para tanto, o artigo relata as técnicas de ETL utilizadas e as dificuldades encontradas durante o processo de mineração.

1. Introdução
O aumento do poder de processamento de informações, aliado à capacidade de armazenamento de grandesvolumes de dados, fez com que a área de Bancos de Dados (BD) associada a técnicas de Inteligência Artificial (IA) entre outras, se tornasse alvo de pesquisa para empresas e Instituições de Ensino. É nesse contexto, que surgiram as técnicas de mineração de dados, parte de um processo conhecido como KDD (Knowledge Discovery in Databases) ou Descoberta de Conhecimento em Bancos de Dados. A mineração dedados (MD), ou Data Mining, consiste em destacar padrões em uma grande quantidade de registros armazenados em um banco de dados (BD) (normalmente, contendo mais de um milhão de registros) utilizando recursos computacionais, visto que esta tarefa para um ser humano é impossível de ser realizada. Estes padrões, quando avaliados da maneira correta, podem fornecer valiosas informações sobre o negócio,comportamento dos clientes, etc., auxiliando a direção de cada Instituição na tomada de decisões, e é por este motivo, que tais ferramentas são conhecidas também como ferramentas de apoio à decisão.

Analisando-se as bases de dados do Hospital Materno Infantil Presidente Vargas (HMIPV) percebeu-se que a base de dados laboratorial apresentava um conjunto de informações que possibilitouidentificar aspectos até então não observados. Assim, o foco do presente artigo é a descrição de Extract, Transform, Load (ETL) e a descrição dos padrões “garimpados”. Convém destacar que, para que a base de dados laboratorial fosse utilizada, um projeto foi elaborado e submetido aos Comitês de Éticas do HMIPV e do Centro Universitário Ritter do Reis (UniRitter), para aprovação, porque alguns dadoscontidos na base possuíam restrição de publicação. Desse modo, com base no sigilo que deveria ser mantido sobre as informações contidas no BD, é importante ressaltar que, para a aplicação das técnicas de MD, não foi necessário identificar os pacientes. Portanto, sem a necessidade de divulgação e/ou publicação de qualquer informação que conduzisse à identificação dos mesmos. O artigo prossegueapresentando um breve referencial teórico utilizado, alguns aspectos da solução elaborada, os resultados obtidos com o trabalho e, finalmente, algumas conclusões.

2 Mineração de Dados (Data Mining)
A Mineração de Dados (MD) é um termo genérico relacionado ao conjunto de técnicas para extração de conhecimento em grandes massas de dados (SANTOS, 2007). Ela busca encontrar padrões implícitos (pois ao...
tracking img