Avaliação da biblioteca scr em instâncias aws spot utilizando a ferramenta hpc@cloud
Show simple item record
dc.contributor |
Universidade Federal de Santa Catarina |
pt_BR |
dc.contributor.advisor |
Castro, Márcio |
|
dc.contributor.author |
Feres, João Gabriel |
|
dc.date.accessioned |
2024-08-26T12:35:14Z |
|
dc.date.available |
2024-08-26T12:35:14Z |
|
dc.date.issued |
2024-08-25 |
|
dc.identifier.uri |
https://repositorio.ufsc.br/handle/123456789/257862 |
|
dc.description |
Seminário de Iniciação Científica e Tecnológica. Universidade Federal de Santa Catarina. Centro Tecnológico. Departamento de Informática e Estatística. |
pt_BR |
dc.description.abstract |
Introdução: A computação em nuvem inovou a computação de alto desempenho (HPC) ao fornecer uma infraestrutura flexível e escalável que permite experimentação em larga escala sem grandes investimentos destinados à infraestrutura física. As instâncias spot oferecidas pelos provedores de nuvem estão se tornando uma opção atraente devido ao seu baixo custo, possam ser tomadas do usuário a qualquer momento. A biblioteca Scalable Checkpoint/Restart (SCR) fornece métodos eficazes de verificação e recuperação de dados para garantir a confiabilidade de aplicações HPC na nuvem. Este estudo compara a biblioteca SCR com outras soluções para tolerância a faltas em clusters de instâncias spot. Objetivos: Este trabalho tem como objetivo avaliar a biblioteca (SCR) utilizando a ferramenta HPC@Cloud, comparando-a com outros dois mecanismos de tolerância a faltas existentes: User Level-Fault Mitigation (ULFM) e Berkeley Lab Checkpoint/Restart (BLCR). Método: A ferramenta HPC@Cloud foi desenvolvida para facilitar a criação de clusters e a execução de aplicações de HPC em nuvens públicas. Para tolerar faltas, o HPC@Cloud também inclui um mecanismo que permite recuperar automaticamente instâncias spot caso sejam terminadas. A ferramenta foi utilizada para a realização dos experimentos. Os experimentos foram realizados em diferentes clusters homogêneos de quatro e oito nós criados com a ferramenta HPC@Cloud utilizando as instâncias da AWS, utilizando-se uma aplicação que resolve equações de difusão de calor de Laplace baseada em um Método de Diferenças Finitas (FDM). Foi desenvolvida uma adaptação da aplicação para funcionar com SCR. Resultados: Os resultados mostram que os esquemas de redundância apresentam desempenhos relativamente diferentes. Ainda, quando comparados com as outras estratégias, apresentaram resultados mais homogêneos em relação aos diferentes clusters, o que aumenta a previsibilidade dos resultados. Também, percebe-se que a biblioteca SCR apresentou melhores resultados que a biblioteca BLCR com todas as diferentes configurações utilizadas no trabalho, e tende a ter tempos de execução parecidos ou até mesmo menores que a biblioteca ULFM. Conclusão: Nesse trabalho, foi apresentada uma avaliação da biblioteca SCR na ferramenta HPC@Cloud. Os experimentos foram realizados na AWS e foram avaliados os diferentes esquemas de redundância que o SCR suporta. Ainda, foram comparados os tempos de execução dos esquemas de redundância SCR com os de outras bibliotecas. Os resultados sugerem que o SCR pode ser tão, se não mais performático que as outras bibliotecas e estratégias analisadas. |
pt_BR |
dc.format.extent |
Vídeo |
pt_BR |
dc.language.iso |
por |
pt_BR |
dc.publisher |
Florianópolis, SC |
pt_BR |
dc.subject |
computacao de alto desempenho |
pt_BR |
dc.subject |
computacao em nuvem |
pt_BR |
dc.subject |
aws |
pt_BR |
dc.title |
Avaliação da biblioteca scr em instâncias aws spot utilizando a ferramenta hpc@cloud |
pt_BR |
dc.type |
Video |
pt_BR |
Files in this item
This item appears in the following Collection(s)
Show simple item record
Search DSpace
Browse
-
All of DSpace
-
This Collection
My Account
Statistics
Compartilhar