Resumo Artigo

Páginas: 5 (1073 palavras) Publicado: 3 de maio de 2014
MARISSA: MApReduce Implementation for Streaming Science Applications
E. Dede, Z. Fadika, J. Hartog, M. Govindaraju, L. Ramakrishnan, D. Gunter, R. Canon


I. Visão Global
O objetivo do projeto MARISSA, MApReduce Implementation for Streaming Science Applications, proposto pelos autores é apresentar um framework alternativo para Apache Hadoop Streaming[1]: utilitário que permite que ousuário crie e execute trabalhos com qualquer executável ou script, para processamento de grandes conjunto de dados, utilizando o modelo de programação MapReduce.

II. Resumo
Com a evolução dos sistemas de informação e, um aumento considerável de volume de dados, que precisam ser processados por esses sistemas, a Google Inc., desenvolveu um modelo de programação paralela para processar esses grandesvolumes de dados em sistemas distribuídos chamado MapReduce[2]. Desde sua criação, o MapReduce vem ganhando espaço em várias disciplinas científicas como, por exemplo, em astrofísica, astronomia, bioinformática, sistema climático, etc. Os frameworks mais conhecidos são: Apache Hadoop[1] e Apache Hadoop Streaming.
Ambos os frameworks tem limitações. O Apache Hadoop só oferece suporte nativopara aplicações Java e o seu sistema de arquivos, Hadoop File System (HDFS), não é compatível com Portable Operating System Interface (POSIX)[3][4]. Enquanto o Hadoop Streaming oferece suporte a aplicações compiladas em uma variedade de linguagens como C, C++, Python e Fortran. Porém, o Hadoop Streaming é menos eficiente em termos de desempenho e menos flexível quando comparado com o Apache Hadoop.O projeto MARISSA apresenta um framework alternativo para o Hadoop Streaming e o Apache Hadoop, que seja capaz de executar não só aplicações Java, mas qualquer executável binário. Ser mais eficiente em termos de desempenho. Os três principais pilares deste framework são: A) Gerenciamento de dados. B) Sincronização / Paralelização. C) Tolerância a falhas.

III. Contribuições
As contribuiçõesdo projeto são: 1) Um framework utilizando o modelo de programação MapReduce para processamento de dados científicos intensivos e contínuos (streaming). 2) Capacidade de executar não só aplicações em Java, mas também qualquer executável binário. 3) Fornecer um desempenho considerável de melhoria em relação ao Hadoop Streaming. 4) Capacidade de suportar uma variedade de sistemas de arquivoscompatíveis com POSIX. 5) Suporte a aplicações iterativas: A capacidade de um aplicativo avaliar a sua saída e agendar as execuções. 6) Capacidade de executar um executável diferente em cada nó do cluster. 7) Capacidade de executar diferentes conjuntos de dados de entrada em diferentes nós do cluster. 8) Capacidade de um subconjunto (ou todos) dos nós para executar a mesma aplicação, permitindo em reduziros passos para decidir qual resultado selecionar se for aplicável. 9) Capacidade dos programas em não ler do STDIN e escrever no STDOUT para ser executado.
Essas contribuições são contribuições práticas que se baseiam na colaboração com os cientistas que trabalham com o modelo de programação MapReduce para aplicações de processamento de dados intensivos.



IV. Defeitos/DesvantagensFaltou mencionar no artigo os trabalhos futuros e suas extensões.

V. Estilo e Estrutura
A Estrutura do artigo é organizada e foi dividida em seções pertinentes apresentando: 1) Desafios em aplicações científicas. 2) Desafios do Apache Hadoop. 3) Solução do framework alternativo MARISSA. 4) Arquitetura do MARISSA esboçada na “Fig. 4”. 5) Comparação de desempenho entre o Hadoop Streaming e MARISSAatravés de gráficos simples.
Os exemplos estão coerentes com a proposta do MARISSA. O inglês está de fácil entendimento. E o trabalho tem uma motivação para aplicações que dependem de sincronização e paralelismo sendo mais eficiente e rápido que os outros frameworks disponíveis. Além de poder trabalhar com qualquer executável binário, e não somente para aplicativos em Java.

VI....
Ler documento completo

Por favor, assinar para o acesso.

Estes textos também podem ser interessantes

  • Resumo de Artigos
  • Resumo do Artigo
  • Resumo artigo
  • Resumo da artigos
  • Resumo de Artigo
  • Resumo de Artigo
  • resumo de artigo
  • Resumo Artigos

Seja um membro do Trabalhos Feitos

CADASTRE-SE AGORA!