Processo de qualidade de dados compartilhados

Disponível somente no TrabalhosFeitos
  • Páginas : 10 (2344 palavras )
  • Download(s) : 0
  • Publicado : 14 de agosto de 2011
Ler documento completo
Amostra do texto
Disciplina: Metodologia da Pesquisa e da Produção Científica

Título: Processo de Qualidade de Dados Compartilhados

INTRODUÇÃO

A partir de uma perspectiva de pesquisa, a qualidade dos dados tem sido abordada em diferentes áreas, incluindo as áreas de estatísticas, de gestão e ciência da computação. Estatísticos foram os primeiros a investigar alguns dos problemas relacionados à qualidadedos dados, ao propor uma teoria matemática para considerar duplicatas em conjuntos de dados estatísticos, no final dos anos 1960. Eles foram seguidos por pesquisadores em gestão, que no início da década de 1980 centraram-se sobre a forma de controle de dados dos sistemas de produção a fim de detectar e eliminar os problemas de qualidade de dados. Somente no início da década de 1990 cientistas decomputação começaram a estudar o problema da definição, medição e melhoria da qualidade de dados eletrônicos armazenados em bases de dados, data warehouse e sistemas legados. [1]
Os dados representam objetos do mundo real, em um formato que pode ser armazenado, recuperado e elaborados por procedimentos de software, e comunicado através de uma rede. O processo de representar o mundo real por meiode dados pode ser aplicado a um grande número de fenômenos, tais como medições, eventos, características das pessoas, os ambientes, sons e cheiros. Os dados são extremamente versátil na representação.
Uma vez que os pesquisadores da área da qualidade dos dados tem que lidar com um amplo espectro de representações de dados possíveis, eles têm proposto diversas classificações para os dados.Primeiro, os autores distinguem implícita ou explicitamente, três tipos de dados: estruturados, semi-estruturados e não estruturados.
A informação tem se tornado um dos mais importantes ativos de uma empresa. Sem informações de qualidade, não se consegue atender clientes de forma correta, tomar decisões adequadas ou obter vantagens de novas tecnologias. O mundo requer informações globais e, cada vezmais, busca a colaboração e a troca de informações entre diferentes órgãos de uma empresa e também entre empresas. O diferencial competitivo de uma empresa é o conhecimento que ela tem para oferecer ao cliente.
Algumas empresas estão necessitando buscar a melhoria na qualidade de seus dados por diversos fatores, fatores estes que acabam sendo sintomáticos na operacionalização das aplicaçõesutilizadas na instituição.
Alguns destes fatores podem ser vistos abaixo:
• Projetos de Conversão / Migração / Sincronização de Dados;
• Projetos de Visão Única;
• Implantações de soluções de CRM e ERP;
• Normas Regulatórias;
• Data Warehouses, Data Marts, ODS, ...;
• Monitoramento de Incidentes/Problemas nos ambientes de Produção.
Com a utilização de aplicações cada vez mais analíticas e decunho gerencial na maioria das vezes, as empresas vêem-se obrigadas a utilizar mecanismos de controle de qualidade em seus dados. Estes mecanismos são dos mais diversos possíveis, pois cada instituição acaba necessitando garantir, à medida que os problemas vão aparecendo, a qualidade de seus dados para que sejam possíveis as análises de seus dados.
Podemos destacar alguns sintomas mais comuns arespeito da baixa qualidade de dados:
• Programa cancela com “data exception”;
• Dificuldade de Compartilhamento;
• Relatórios inconsistentes;
• “Merge” de dados causa falha nos sistemas;
• Rotinas de ETL demandam tempo exagerado para elaboração e testes;
• Usuários descontentes.
Em decorrência da baixa qualidade dos dados nas bases as instituições podem enfrentar uma série deproblemas. Estes problemas podem ser avaliados através dos impactos que se consideram importantes no contexto das instituições:
• Esforços de acertos contínuos dos dados;
• Multas e penalidade relacionadas a problemas de qualidade de dados;
• Ajustes, créditos de diferenças, re-processamento;
• Proliferação de banco de dados departamentais, não padronizados, pela falta de confiança nos dados...
tracking img