Tardigrade项目可保护您的vms免受主机故障

目录:

视频: --Ó--º—Ë—Ä--∑--ª--∞—È --∫—Ä--Æ—Û —Å--Æ--Ω—Ü--∞ 2024

视频: --Ó--º—Ë—Ä--∑--ª--∞—È --∫—Ä--Æ—Û —Å--Æ--Ω—Ü--∞ 2024
Anonim

在过去几个月中进行了多次Azure更改和安全性改进之后,Microsoft推出了Tardigrade项目,这是他们使Azure更加可靠的最新尝试。

Tardigrade项目可防止平台故障

Project Tardigrade是一项旨在提高Azure弹性的新服务。 它包括缓解策略,可以保护Azure VM免受平台故障的影响。

以下是Microsoft Azure首席技术官Mark Russinovich描述Azure的当前工作的方式:

我们的目标是使组织能够在Azure上可靠地运行其工作负载。 以此为指导原则,我们一直在不断投资以发展Azure平台,以使其具有容错能力,不仅可以提高业务生产力,而且还可以提供无缝的客户体验。

为了防止对您的工作负载造成影响,该服务使组件能够自我修复,即使在严重的主机故障中,也可以从潜在故障中快速恢复。

Tardigrade项目如何工作?

这是有关Tardigrade恢复工作流程如何工作的示例:

  • 阶段1:此步骤对运行客户VM没有影响。 它只是回收主机上运行的所有服务。 在有故障的服务无法成功重启的极少数情况下,我们进入阶段2。
  • 阶段2:我们的诊断服务在主机上运行,​​以系统地收集所有相关的日志/转储,以确保我们可以彻底诊断阶段1中的失败原因。这种全面的分析使我们能够“找出原因”,从而防止再次发生在将来。
  • 阶段3:在较高的级别上,我们将操作系统重置为正常状态,对客户的影响最小,以减轻主机问题。 在此阶段,我们将每个VM的状态保存到RAM,然后开始将OS重置为正常状态。 当操作系统在下面快速重置时,由于CPU暂时挂起,服务器上托管的所有VM上正在运行的应用程序都会短暂地“冻结”。 这种体验类似于暂时丢失但由于重试逻辑而很快恢复的网络连接。 成功重置操作系统后,VM会消耗其存储状态并恢复正常活动,从而避免了任何可能的VM重新启动。

考虑到这一点,Tardigrade项目将确保主机中任何单个组件的故障都不会影响整个系统。 这样,客户虚拟机将不会受到主机故障的影响。

Microsoft正在努力改进和扩展不同的主机故障方案,以确保其云计算平台比以往更加可靠。

期望在不久的将来会有新的发展和其他可靠性实现。

Tardigrade项目可保护您的vms免受主机故障