Data warehouse

Disponível somente no TrabalhosFeitos
  • Páginas : 17 (4098 palavras )
  • Download(s) : 0
  • Publicado : 28 de abril de 2011
Ler documento completo
Amostra do texto
DATAWAREHOUSE

O potencial do Datamining pode ser aumentado se os dados apropriados forem coleccionados e armazenados num Datawarehouse. Um Datawarehouse é um sistema de administração de bases de dados relacional (RDMS) especificamente projectado para satisfazer as necessidades de sistemas de processamento de transacções. Pode ser definido como depósito de dados centralizado que pode serexaminado para o benefício do negócio mas isto será definido mais claramente depois ao explicar as suas características. Datawarehousing é uma nova técnica poderosa que torna possível extrair dados operacionais arquivados e inconsistências superadas entre formatos de dados de proveniências diferentes. Como também integram dados ao longo de um empreendimento, indiferentemente da localização, formato, ouexigências de comunicação é possível incorporar informação adicional ou especialista. É, o vínculo lógico entre o que os gerentes vêem no apoio das suas decisões de aplicações de EIS e as actividades operacionais da companhia, noutras palavras o Datawarehouse testa dados que já são transformados e resumidos e por esta razão fazem isto num ambiente apropriado para maior eficiência de aplicações deDSS e de EIS.


Características de um Datawarehouse:
Geralmente há quatro características que descrevem um Datawarehouse:

1. Organização por assunto: Os dados são organizados por assunto em vez de aplicação, como por exemplo uma companhia de seguros que usa um Datawarehouse que organiza os seus dados por cliente, prémios, e

reivindicação, em vez de, através de produtosdiferentes (automóvel, seguros de vida, etc.). Os dados organizados por assunto contêm só a informação necessária para processo de apoio de decisão;

2. Integrado: Quando os dados residem em muitas aplicações separadas no ambiente operacional, a codificação dos dados é frequentemente inconsistente. Por exemplo, numa aplicação, o sexo poderia ser codificado como " m " e " f " e noutro por 0 e 1.Quando os dados são movidos do ambiente operacional para o Datawarehouse, eles assumem uma convenção de codificação consistente. Por exemplo dados de sexo são transformados em " m " e " f ";

3. Espaço de tempo: O Datawarehouse contém um lugar para armazenar dados que possuem de cinco a dez anos de utilização, ou mais, sendo usado para comparações, tendências e prevenções. Estes dados nãosão actualizados;

4. Não-volátil: Uma vez que entram no Datawarehouse, os dados não são actualizados ou mudados de alguma forma, mas somente são carregados e acedidos.

Processos de um Datawarehouse:
A primeira fase em Datawarehousing é "separar" a informação operacional actual, para preservar a segurança e a integridade das aplicações OLTP, enquanto permite o acesso à maior basede dados possível.

A base de dados resultante ou Datawarehouse pode consumir centenas de gigabytes ou até terabytes de espaço de disco, o que se requer então são técnicas eficientes para armazenar e recuperar quantias volumosas de informação. Crescentemente, grandes organizações acham que somente sistemas de processamento paralelo oferecem largura de banda suficiente.
O Datawarehouse assimrecupera dados de uma variedade de bases de dados operacionais heterogéneas. Os dados são transformados então e são entregues ao “warehouse/store” de dados baseado num modelo seleccionado ou previamente definido. A transformação dos dados e a movimentação dos processos são executados sempre que uma actualização para os dados de warehouse é requerida, assim aí deve existir alguma forma deautomatização para a administração e execução das tarefas em questão.
A informação que descreve o modelo e a definição dos elementos de fonte de dados são chamados "elementos metadata". O metadata é o meio pelo qual o utilizador final encontra e entende os dados no warehouse e é uma importante parte do warehouse.
O metadata deve conter:
 A estrutura dos dados;
 O algoritmo usado para...
tracking img