迭代应用的最佳检查点策略 这项工作提供了一种最佳的检查点策略,可以保护迭代应用程序免受故障停止错误的影响。 我们考虑一个非常通用的框架,其中应用程序通过执行连续的迭代来重复相同的执行模式,并且每个迭代都由多个任务组成。 这些任务具有不同的执行长度和不同的检查点成本。 天真的策略和Young / Daly策略都不理想。 我们的主要贡献是证明最佳检查点策略是全局周期性的,并设计一种动态编程算法来计算最佳检查点模式。 这种模式很可能会检查许多不同的任务,并且涉及许多不同的迭代。 通过在综合和实际应用场景中进行的仿真,我们表明,最佳策略明显优于单纯策略和Young / Daly策略。 代码 gen_faults.m生成服从指数分布的故障main_GCR.m为GCR应用程序进行仿真main_gopi.m为神经科学应用程序进行仿真main_random.m对合成应用程序进行仿真Simulation_e
2022-02-25 20:24:46 1KB
1
分布式Snapshot和Flink Checkpointing简介.docx
2021-01-28 04:28:04 205KB Snapshot Checkpointing Flink
1