Title: | Uma estrategia de rebalanceamento de estados para checkpoints particionados |
Author: | Goulart, Henrique dos Santos |
Abstract: |
Esta pesquisa aborda os métodos de checkpoint/recuperação, que registram periodicamente o estado do sistema em momentos sem falhas, permitindo a recuperação a partir de um estado anterior estável. Embora o checkpoint acarrete custos, exigindo um equilíbrio entre o armazenamento das imagens do estado do sistema e o gerenciamento de entregas recebidas, uma abordagem promissória para agilizar o checkpoint é a divisão do estado do serviço, possibilitando o salvamento simultâneo de partições individuais. Esta estratégia não só potencializa o desempenho através do aumento do paralelismo no processamento das engenharias, mas também, como demonstrado pelos resultados desta pesquisa, permite um melhor rebalanceamento de carga e otimização da vazão sem custos adicionais. No entanto, uma pesquisa revela que, apesar destes avanços, houve apenas uma modesta melhoria na eficiência do processo de checkpoint em si. A pesquisa propõe uma metodologia que combina checkpoint paralelo com uma técnica de repartição flexível baseada em gráficos, definindo formalmente o problema e desenvolvendo uma análise detalhada do desempenho da abordagem proposta. Experimentos práticos demonstram as vantagens dos pontos de verificação paralelos e ressaltam as melhorias de eficiência alcançadas com a repartição baseada em grafos. Além disso, ao comparar um método de particionamento round-robin com uma abordagem dinâmica, o estudo enfoca o grau de paralelismo atingido pelos threads de checkpoint e o impacto das diferentes estratégias de repartição na eficiência do checkpoint e no desempenho geral da aplicação. Os resultados confirmam que é possível alcançar um desempenho superior no sistema de operações que envolve o acesso a múltiplas partições e bloqueio detalhado entre elas, sem incorreto em custos adicionais para o processo de checkpoint. Assim, a pesquisa fornece percepções importantes sobre como a otimização de processos em sistemas distribuídos pode ser realizada sem comprometer a eficiência ou acarretar custos adicionais. Abstract: This research addresses checkpoint/recovery methods, which periodically record the system?s state during fault-free moments, enabling recovery from a previously stable state. Although the checkpoint incurs costs, requiring a balance between storing the system state images and managing received requests, a promising approach to expedite the checkpoint is the division of the service state, allowing for the simultaneous saving of individual partitions. This strategy not only enhances performance through increased parallelism in request processing but also, as demonstrated by the results of this research, allows for improved load rebalancing and throughput optimization without additional costs. However, the research reveals that, despite these advancements, there was only a modest improvement in the efficiency of the checkpoint process itself. The research proposes a methodology that combines parallel checkpoint with a flexible graph-based partitioning technique, formally defining the problem and conducting a detailed analysis of the performance of the proposed approach. Practical experiments demonstrate the advantages of parallel checkpoints and highlight the efficiency improvements achieved with graph-based partitioning. Furthermore, by comparing a round-robin partitioning method with a dynamic approach, the study focuses on the degree of parallelism achieved by the checkpoint threads and the impact of different partitioning strategies on the checkpoint?s efficiency and the overall performance of the application. The results confirm that it is possible to achieve superior system performance for operations that involve accessing multiple partitions and require coordination among them, without incurring additional costs for the checkpoint process. Thus, the research provides important insights into how process optimization in distributed systems can be accomplished without compromising efficiency or incurring additional costs. |
Description: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2023. |
URI: | https://repositorio.ufsc.br/handle/123456789/254850 |
Date: | 2023 |
Files | Size | Format | View |
---|---|---|---|
PGCC1262-D.pdf | 2.066Mb |
View/ |