クラウドと Nutanix を活用した効果的なディザスタリカバリ
この eBook では、最新の事業継続・ディザスタリカバリ(BCDR)対策の一環として、プライベート IT インフラをパブリッククラウドに拡張する方法について説明します。パブリッククラウドのオンデマンド性と弾力性に加えて、Nutanix Clusters の統合コントロールプレーンと自動化を活用することにより、従来の DR アプローチよりもはるかに低コストで IT 環境の耐障害性を強化できます。
組織におけるデジタル化が進むにつれて、計画外のダウンタイムがビジネスに与える影響はより深刻なものになっています。451 Research の 2021 年の調査によれば、調査対象となった企業の 61% が、10万ドル以上の損害を伴うシステム停止を最近 1 回以上経験しています。
IT 運用を行う企業には、堅固な DR 戦略が必要です。しかし、DR 対策は IT インフラ管理の中でも最も難しい領域の 1 つであることは、周知の事実となっています。ベストプラクティスの慎重な選択と組み合わせ、IT リソースの定期的なバックアップ、DR 対策の反復的な検証が求められます。
DR 管理の中核となるのは、地理的に分散した IT ハードウェア、ソフトウェア、およびデータを複製し、保守するためのシステムです。IT リソースをバックアップし、継続的に同期することで、データセンター内のサーバー、ストレージ、ネットワークリソースが壊滅的な被害を受けて使用不能になった場合でも、事業の運営を維持できます。リモートでミラーリングされた IT サイトがあれば、ローカルまたはリージョンの IT が停止した場合でも、冗長インフラにフェイルオーバーして、顧客や従業員へのサービスを継続できます。パブリッククラウドは、オンプレミスのインフラストラクチャでは利用できない機能を備えているため、DR 計画において大きなちからを発揮することが期待されます。
本 eBook では、Nutanix Clusters を使用して、Nutanix オンプレミスインフラの DR 機能をパブリッククラウドに統合し、DR 計画のモダナイズによって高速リカバリを実現し、計画外のシステム停止によるビジネス損失を最小限に抑える方法について説明します。
1 451 Research, 2021: Voice of the Enterprise: Storage, Data Management, and Disaster Recovery
多くのジオロケーションでは、インターネットを経由することによって、ほぼ無限のパブリッククラウドリソースがさまざまな消費モデルで提供されています。これらは、使用量に応じた従量制のパブリッククラウドサービスとして利用できるため、ハイブリッドまたはマルチクラウドの設定で Nutanix のオンプレミス型クラウドと統合することにより、クラウドベースの DR が比較的低コストで簡単に実現します。
> 資本コストが不要:クラウド DR は、完全冗長化されたデータセンターと IT インフラを必要としないため、その構築と維持にかかる大規模な資本投入は不要です。クラウド DR では、データセンターと IT インフラに代えて DR 環境専用のミラーリングされたクラウドストレージ、コンピュート、ネットワーキングのリソースが提供されます。
> 運用の自動化:クラウド DR は、自動化されたレプリケーション処理により、運用担当者の関与を必要とせずに、最新の状態を保つことができます。
DR ソリューションの進化とシンプルなハイパーコンバージドインフラ(HCI)の組み合わせにより、ビジネスアプリケーションとデータを保護・復旧するための新しい効率的な方法がいくつか生まれました。しかし、IT フェイルオーバー用にほぼ同一のセカンダリ「ホット」サイトを構築する従来のアプローチでは、プライマリサイトの設計、構築、運用に伴う全ての時間、労力、コストと同じだけの投資が必要です。
> 統一された管理プレーン:データセンターの HCI アーキテクチャを主要なパブリッククラウドプロバイダーの API (アプリケーションプログラミングインターフェース)と統合することにより、Nutanix はオンプレミスとパブリッククラウドベースの両方の環境で統一された管理・制御プレーンを提供できます。
> アイドル状態のリソースや古いバックアップが不要:オンプレミスで構築したバックアップインフラは、壊滅的な事態が発生しないかぎり、ほぼ使われることはありません。そのようなバックアップインフラを維持し、本番システムと同期させておくには、かなりの投資と運用の労力が必要です。
> コストと運用を低減:クラウド DR モデルを採用することにより、ほとんど使用されない IT スタックの機器所有に伴う資本的支出が不要になります。クラウドの利用料金は、データレプリケーション時や、クラウドベースの DR インフラをフェイルオーバーまたはテストする際に発生する停電時のみに適用されるため、最小限に抑えることができます。
> オンプレミスとパブリッククラウドのシンプルな統合:Nutanix Cloud Platform は、パブリッククラウド上のベアメタルインスタンスで動作し、それぞれが独自のコンピュート、メモリ、ローカルストレージ、およびネットワーキングリソースを備えています。グループ化され、同じオンプレミスの Nutanix HCI ソフトウェアと組み合わせられているため、オンプレミスのセカンダリサイトを自分で構築・保守する手間をかけずに、セカンダリバックアップインフラを作成・運営できます。
Nutanix Clusters を使用すると、DR のポリシーと設計をより選択的で詳細に行うことができます。オンプレミスなどのプライベートデータセンターでも、単一または複数のパブリッククラウドでも、どこでどのようにワークロードを保護し、どこで復旧させるかを選択できます。そのための DR 設計は、ソリューションのコスト、復旧時間の要件、ワークロードやアプリケーションの重要度、コンプライアンス要件、およびその他の要因に基づいて決定することができます。
DR ソリューションの柔軟性を高め、コストを最小化するには、一般的に第 2 の物理データセンターの構築と維持のコストをなくす方法がありますが、それ以外にも 3 つの主要な戦略があります。
> DR の階層化: ネイティブの DR 機能により、アプリケーションとデータの個別のリカバリ要件に基づいて、専用の保護レベルを設定できます。ビジネスクリティカルなアプリケーションは最短の RPO と最速の RTO で保護し、低階層のアプリケーションとデータは、RPO がやや長く RTO がやや遅い、より安価なパブリッククラウド DR 階層に割り当てます。例えば、ビジネスクリティカルな 階層0 のデータはプライベートインフラにレプリケートし、階層1 ま たは階層2 のデータはパブリッククラウドにレプリケートします。
> エラスティックな DR:パブリッククラウドの「エラスティック」な特性とは、IT インフラのスケールアウトとスケールバックをオンデマンドで行えることを意味します。たとえば、プライマリ環境の全てを複製するのに十分なストレージを備えた、最小 3 ノードの小規模な「パイロットライト」の DR クラスタを作成します。この状態でフェイルオーバーイベントが発生すると、Nutanix の DR 保護ポリシーが自動的にトリガーされてクラスタをオンデマンドで拡張します。これにより、プライマリインフラが完全にミラーリングされると同時に、ほとんど使用されることのないホットクラウドリソースの費用は不要になるため、大幅なコスト削減が可能になります。
> クラスタのハイバネーション:DR の代替案として、完全なミラー DR クラスタ(ストレージ、コンピュート、ネットワーク)を作成し、それを休止状態(ハイバネーション)にする方法があります。このオプションでは、使用していない状態、つまりデータがクラスタにレプリケートされていないときにクラスタ全体をシャットダウンします。この間ベアメタルインスタンスの料金は発生しませんが、障害が発生すると、クラスタは自動的にハイバネーションから起動し、データはパブリッククラウドストレージから引き出されて、指定されたインフラ上のアプリケーションとワークロードを復元します。
はい。ワークロードやアプリケーションの種類ごとに、どのリカバリポリシーが必要かを確認しておくことは、使用する DR オプションを決定するうえで重要な鍵となります。エラスティックな DR を使用すると、必要な RPO でアプリとデータを保護する小規模なホットスタンバイインフラを作成することができます。ただし、エラスティックな DR を使用した場合、全てのリソースが直ちに利用できる状態にある場合よりも RTO が長くなります。フェイルオーバーの際に完全な Nutanix Clusters 環境を構築するには最大 1 時間を要するからです。DR ポリシーとさまざまな DR 機能やサイトとを適合させることで、必要なリカバリ時間と予算に合った最適なソリューションを選択することができます。
Nutanix Clusters インフラストラクチャでは、最低 3 台のノードが必要です。ただし、クラスタのサイズは、ストレージ、コンピュート、およびネットワークに対するワークロードの要件によって決まります。VDI (仮想デスクトップインフラ)は通常、ワークロードのイメージングを使用するため、最小限のストレージしか必要としません。そのため、エラスティックな DR クラスタのオンデマンドオプションを使用して、最小限のクラウドインフラを使用するように VDI 環境を構成することが可能です。
サイバー攻撃から完全に身を守るには、単一の対策では不十分です。最善の解決策は、予防、検知、復旧のためのベストプラクティスとツールを組み合わせた、多層的なセキュリティ戦略です。全ての侵害を防ぐことは不可能であるため、発生時に侵害を迅速に検知し、リカバリを実施できるように準備しておく必要があります。
> 防止:ベストプラクティスの採用により、サイバー攻撃による潜在的な影響を軽減できます。具体的には、強力なパスワードポリシーの適用、ネットワークのセグメント化、フィッシングやその他のハッカーの侵入手口に関するエンドユーザーの教育、ゼロトラストセキュリティポリシーによる役割ベースのアクセス制御(RBAC)、Write Once, Read Many(WORM)オブジェクトストレージの導入などがあげられます。Nutanix Cloud Platform は、これらのベストプラクティスによって堅固化され、セキュリティが保護されているため、セキュリティのあらゆる面に関するポリシーを作成し、プライベート Nutanix 環境とパブリッククラウドのクラスタDR インフラの両方に対し、統一されたインターフェースを使用して一元的に適用できます。
> 検知:認証に何度も失敗したり、ネットワークトラフィックやアプリケーション、ファイルへのアクセス数が大幅に増加するなど、異常な動作を監視する侵入検知ツールの利用は極めて重要です。バックアッププロセスを定常的に監視していれば、ランサムウェアのような被害の大きい攻撃を初期の段階で検知し、その影響を抑えることができます。
Nutanix は、エコシステムパートナーによるネットワークセキュリティと脅威認識ツールのポリシーベースのサービス挿入をサポートし、これを支援します。さらに、Nutanix の Prism Ops 管理ソフトウェアにより、インサイトと分析によってリソース使用率の異常を警告し、Nutanix Files のインテリジェント分析エンジンで、疑わしいファイル共有アクティビティを検知します。
> リカバリ:リカバリプランには、必要な RPO/RTO に基づいたレイヤーアプローチを採用する必要があります。攻撃者がデータを暗号化して身代金を要求するランサムウェアの場合は、感染直前のクリーンなスナップショットが、データ復旧の最速の解決策です。スナップショットが利用できない場合は、最後のバックアップサイクルからの復元が次善の選択肢となります。この場合、バックアップが破損なく保存されていることが不可欠です。次のような方法で確実にバックアップを保護してください。
まずワークロードのレプリケーションとリカバリの計画が作成から始めます。ワークロード、アプリケーション、およびデータをビジネスにとっての重要度でグループ化し、各グループについて RPO(数分、数時間、数日など、どの程度のデータ損失が許容されるかを示す)と RTO を設定します。DR 管理を簡素化しようとして、あらゆるアプリケーションとワークロードを 1 つのリカバリ層にまとめてはいけません。この方法では、あらゆるリソースを最高レベル(階層 0)の RPO とRTO でカバーしなければならないため、通常はさらにコストがかかります。通常は、いくつかの論理的な保護グループを定義し、それぞれを対応する社内ビジネス SLA に照らし合わせて、RPO と RTO を決定するのが得策です。RPO や RTO が長く設定された重要度の低いリソースについては、エラスティックな DR やハイバネートオプションを使用すると、要件とコストのバランスを取ることができます。
インフラストラクチャを追加しても、必ずしも既存のデータ保護の対策を変更する必要はありません。しかし、クラスタ導入プロジェクトの一環として DR の目標が変更される場合は、それに応じて既存のデータ保護の対策を変更する必要があります。具体的には、エラスティックな DR をサポートする保護ポリシーの採用や、以前は利用できなかった新しい DR 階層化オプションの活用などがあります。さらに、Nutanix Clusters を使用した DR では、現在インフラストラクチャを稼動させていないリージョンでもパブリッククラウドの IT リソースを使用できるようになります。これにより、リソースの冗長性を 2 つ以上の異なるスタンバイ DR サイトに分割し、多様性と保護を強化することが可能になるため、このような保護ポリシーの修正を取り入れた形でデータ保護対策の変更が行われる可能性もあります。
Nutanix Clusters の提供開始以来、ハイブリッドクラウド導入の手始めとして、クラウド DR を導入する企業が一般的になりました。Penn National Insurance 社はそのようなお客様の 1 社です。Nutanix を導入する前は、同社は DR とインフラ管理の複雑さが課題でした。データをテープにバックアップしてオフサイトに保管していましたが、データの急増に DR ソリューションが追いつかなくなりました。
復旧作業には数日かかるため、RPO/RTO を満たすことは到底できません。これらの課題を解決すべく、Penn National Insurance 社は、オンプレミスの Nutanix HCI と Amazon Web Services(AWS)クラウドの上の Nutanix Clusters で構成された最新のハイブリッドクラウド環境を導入しました。同社のシニアインフラシステムアーキテクトである Craig Wiley 氏は次のように述べています。「DR を AWS クラウドに移行したことで、復旧時間が数日から 2 時間以下に短縮されました。災害が発生しても、AWS 上の Nutanix Clusters を素早くスピンアップして、クラウド上の複製データを呼び出すことができます。」
Penn National Insurance 社におけるユースケースについては、こちらで詳しく説明しています。
Nutanix のプライベート IT インフラをパブリッククラウドに拡張し、計画外のダウンタイムに対する耐性を強化するにはいくつかの方法があります。Nutanix クラスタとパブリッククラウドをシームレスに組み合わせて DR 機能を強化する方法を以下のリンクからご覧ください。