Avaliação da biblioteca scr em instâncias aws spot utilizando a ferramenta hpc@cloud

DSpace Repository

A- A A+

Avaliação da biblioteca scr em instâncias aws spot utilizando a ferramenta hpc@cloud

Show full item record

Title: Avaliação da biblioteca scr em instâncias aws spot utilizando a ferramenta hpc@cloud
Author: Feres, João Gabriel
Abstract: Introdução: A computação em nuvem inovou a computação de alto desempenho (HPC) ao fornecer uma infraestrutura flexível e escalável que permite experimentação em larga escala sem grandes investimentos destinados à infraestrutura física. As instâncias spot oferecidas pelos provedores de nuvem estão se tornando uma opção atraente devido ao seu baixo custo, possam ser tomadas do usuário a qualquer momento. A biblioteca Scalable Checkpoint/Restart (SCR) fornece métodos eficazes de verificação e recuperação de dados para garantir a confiabilidade de aplicações HPC na nuvem. Este estudo compara a biblioteca SCR com outras soluções para tolerância a faltas em clusters de instâncias spot. Objetivos: Este trabalho tem como objetivo avaliar a biblioteca (SCR) utilizando a ferramenta HPC@Cloud, comparando-a com outros dois mecanismos de tolerância a faltas existentes: User Level-Fault Mitigation (ULFM) e Berkeley Lab Checkpoint/Restart (BLCR). Método: A ferramenta HPC@Cloud foi desenvolvida para facilitar a criação de clusters e a execução de aplicações de HPC em nuvens públicas. Para tolerar faltas, o HPC@Cloud também inclui um mecanismo que permite recuperar automaticamente instâncias spot caso sejam terminadas. A ferramenta foi utilizada para a realização dos experimentos. Os experimentos foram realizados em diferentes clusters homogêneos de quatro e oito nós criados com a ferramenta HPC@Cloud utilizando as instâncias da AWS, utilizando-se uma aplicação que resolve equações de difusão de calor de Laplace baseada em um Método de Diferenças Finitas (FDM). Foi desenvolvida uma adaptação da aplicação para funcionar com SCR. Resultados: Os resultados mostram que os esquemas de redundância apresentam desempenhos relativamente diferentes. Ainda, quando comparados com as outras estratégias, apresentaram resultados mais homogêneos em relação aos diferentes clusters, o que aumenta a previsibilidade dos resultados. Também, percebe-se que a biblioteca SCR apresentou melhores resultados que a biblioteca BLCR com todas as diferentes configurações utilizadas no trabalho, e tende a ter tempos de execução parecidos ou até mesmo menores que a biblioteca ULFM. Conclusão: Nesse trabalho, foi apresentada uma avaliação da biblioteca SCR na ferramenta HPC@Cloud. Os experimentos foram realizados na AWS e foram avaliados os diferentes esquemas de redundância que o SCR suporta. Ainda, foram comparados os tempos de execução dos esquemas de redundância SCR com os de outras bibliotecas. Os resultados sugerem que o SCR pode ser tão, se não mais performático que as outras bibliotecas e estratégias analisadas.
Description: Seminário de Iniciação Científica e Tecnológica. Universidade Federal de Santa Catarina. Centro Tecnológico. Departamento de Informática e Estatística.
URI: https://repositorio.ufsc.br/handle/123456789/257862
Date: 2024-08-25


Files in this item

Files Size Format View
apresentacaofinal.mp4 103.1Mb MPEG-4 video View/Open

This item appears in the following Collection(s)

Show full item record

Search DSpace


Browse

My Account

Statistics

Compartilhar