プロジェクトターディグレードは、ホスト障害からVMを保護します

目次:

Anonim

過去数か月でAzureが何度も変更され、セキュリティが改善された後、MicrosoftはAzureの信頼性を高めるための最新の試みとしてProject Tardigradeを導入しています。

Project Tardigradeはプラットフォームの障害を防ぎます

Project Tardigradeは、Azureの復元力を向上させることを目的とした新しいサービスです。 プラットフォームの障害からAzure VMを保護する緩和戦略が含まれています。

Microsoft Azureの最高技術責任者であるMark Russinovichが、Azureでの現在の作業について説明しています。

私たちの目標は、Azureでワークロードを確実に実行できるように組織を強化することです。 これを指針として、ビジネスの生産性を高めるだけでなく、シームレスなカスタマーエクスペリエンスを提供するために、Azureプラットフォームの進化に継続的に投資して耐障害性を高めています。

ワークロードへの影響を防ぐために、このサービスにより、コンポーネントは自己修復し、重大なホスト障害でも潜在的な障害から迅速に回復できます。

Project Tardigradeはどのように機能しますか?

Tardigradeのリカバリワークフローの仕組みの例を次に示します。

  • フェーズ1:この手順は、顧客のVMの実行に影響を与えません。 ホストで実行されているすべてのサービスを単にリサイクルします。 まれに、障害が発生したサービスが正常に再起動しない場合は、フェーズ2に進みます。
  • フェーズ2:診断サービスをホストで実行して、関連するすべてのログ/ダンプを体系的に収集し、フェーズ1での失敗の理由を徹底的に診断できるようにします。将来は。
  • フェーズ3:高レベルで、OSを健全な状態にリセットし、お客様への影響を最小限に抑えてホストの問題を軽減します。 このフェーズでは、各VMの状態をRAMに保存します。その後、OSを正常な状態にリセットし始めます。 OSがすぐにリセットされますが、サーバーでホストされているすべてのVMでアプリケーションを実行すると、CPUが一時的に一時停止するため、一時的に「フリーズ」します。 このエクスペリエンスは、一時的に失われたネットワーク接続に似ていますが、再試行ロジックによりすぐに再開されました。 OSが正常にリセットされると、VMは保存された状態を消費して通常のアクティビティを再開し、VMの再起動を回避します。

これを念頭に置いて、Project Tardigradeは、ホスト内の単一コンポーネントの障害がシステム全体に影響を与えないようにします。 そのため、顧客のVMはホスト障害の影響を受けません。

マイクロソフトは、さまざまなホスト障害シナリオを改善および拡張して、クラウドコンピューティングプラットフォームの信頼性をこれまで以上に高めるために懸命に取り組んでいます。

近い将来、新しい開発やその他の信頼性の実装が期待されます。

プロジェクトターディグレードは、ホスト障害からVMを保護します