Teste

Disponível somente no TrabalhosFeitos
  • Páginas : 5 (1043 palavras )
  • Download(s) : 0
  • Publicado : 9 de novembro de 2012
Ler documento completo
Amostra do texto
Diferencial estratégico para empresas que utilizam Big Data

Rede de supermercados americana Target
A rede americana de supermercados Target conseguiu identificar quais de suas clientes estão grávidas, e até quando darão à luz, sem que elas tenham divulgado nenhuma informação a respeito. A equipe envolvida, que inclui estatísticos além de outros profissionais, identificou 25 itens queindicam a gravidez e um alerta aparece no sistema sempre que uma cliente passa a comprar os produtos da lista.
 
Este tipo de análise, que pode alavancar as vendas, envolve o processamento e a análise de uma massa gigante de dados. O Big Data é parte importante da solução, pois é a base do processo.
 
A capacidade analítica envolvida é quesito chave. Para tanto, a equipe e oferramental empregado devem ser capazes de processar a mina de ouro armazenada e lapidar o material. Tendo afinado os dados, a solução de Big Data, a equipe e o ferramental estatístico, a organização pode se diferenciar dos outros players, pelo simples fato de saber usar o que tem.
 
Como se trata de uma nova fronteira de mercado, ainda há espaço para grandes avanços, o que apresenta um futuropromissor para os players que largarem na frente.


Nasa utiliza Hadoop


A NASA conta com a Hadoop para lidar com grandes volumes de dados em projetos como o Square Kilometer Array, para visualização dos céus: prevê-se que este produza 700 TB quando for construído na próxima década. Os sistemas de dados vão incluir a Hadoop, assim como tecnologias  Apache OODT (Object Oriented DataTechnology), para lidar com maciços volumes de trabalho, diz Chris Mattmann, cientista de computação da NASA.

Twitter utiliza Hadoop
O Twitter é um outro grande utilizador da Hadoop. “Todos os produtos de relevância [a  partir dos quais oferece recomendações personalizadas aos utilizadores] têm alguma interação com a Hadoop”, diz Oscar Boykin, um cientista de dados da empresa.
Esta tem vindo a utilizara Hadoop há já  cerca de quatro anos e até desenvolveu o Scalding, um repositório Scala destinado a tornar mais fácil escrever tarefas Hadoop MapReduce: foi desenvolvida sobre o repositório cascading Java, projetado para abstrair a complexidade da Hadoop.
Os subprojetos da Hadoop incluem a MapReduce, uma matriz de software para o processamento de grandes conjuntos de processamento em clusters; aHDFS (Hadoop Distributed File System), que oferece alto rendimento no acesso a dados de  aplicações, e a Common, a qual oferece utilitários para apoiar outros subprojetos Hadoop.
Netflix utliza Hadoop

A empresa de aluguel de filmes Netflix começou a usar o Apache Zookeeper, tecnologia relacionada com Hadoop para gestão de configurações. “Vamos utilizá-lo para todo o tipo de coisas: segurançadistribuída, gestão de pedidos e tráfego” para organizar as prioridades do serviço, diz Jordan Zimmerman, engenheiro sénior da  Netflix. “Nós abrimos o código de um software cliente para o Zookeeper, que eu escrevi chamado Curador”, o cliente serve como um repositório para os programadores ligarem ao tratador.
Tagged utiliza Hadoop
A rede social Tagged utiliza a tecnologia Hadoop para análise dedados, e processa de cerca de meio terabyte de novos dados diários, diz Rich McKinley, engenheiro de dados da Tagged.
A Hadoop está a ser aplicada em tarefas além da capacidade da base de dados Greenplum, ainda a ser usada  no Tagged: “nós estamos a olhar para fazer mais com Hadoop apenas para incrementar a escala”. Apesar de elogiarem a Hadoop, os utilizadores apontam deficiências como afiabilidade e na monitorização de tarefas.
McKinley refere um problema com a latência. “O tempo para obter dados é bastante rápido mas todos reclamam da grande latência na execução de consultas”. A Tagged utiliza a  Apache Hive, outro projeto derivado da Hadoop, para consultas “ad hoc”.
“Isso pode implicar vários minutas para se obterem resultados que, na Greenplum, se obteria num par de segundos”....
tracking img