ブログ

コロナ禍でわかったリモートによるデータセンター管理のメリット

スタン・ギブソン*/テクノロジージャーナリスト


Nutanixを始めとするIT企業がAI主導の未来を予想するなか、自動化は大きな収益源になると見込まれている。

新型コロナウイルスは日常生活に大きな混乱を与えつつ、ITによる運用はとても回復力があることが多くの組織で証明された。データセンターの自動化とリモート運用技術によって、人が直接関与することなく物事が動き続けていることがその理由だ。

NutanixのCIO(最高情報責任者)であるウェンディ M.ファイファーは、「我々はパンデミックの最中に在宅勤務に移行しましたが、グローバルデータセンターサービスが中断されることはありませんでした」と話す。

Nutanixが1年前、3つの主要なデータセンターをカリフォルニアから他の州に移転した際に、SDN(ソフトウェア定義ネットワーク)を介したリモート運用を経験していたことが、功を奏したとのことだ。

ファイファー 「ネットワークエンジニアがオンサイトで常駐し物理的なスイッチとルーターを設定する代わりに、リモートでネットワークのプロビジョニングと停止を行うようになりました」

NutanixのITシステムアーキテクトであるエリック・ピアースによると、同社はBig Switch Networks(Aristaが買収)のSDNでネットワーク管理業務を自動化しているため、何百ものネットワークスイッチを個別に構成する必要はなかった。

「今では、Big Switch REST APIを使って独自のPythonコードを作成しています」とピアース。Big Switchの製品は、Nutanix Prism仮想データセンター管理プラットフォームとも統合されるため、Prismの管理者がネットワークチームを関与させることなく、Prism GUI内からすべてのクラスターネットワークを構成できる。

ピアース 「これまでは、Prismの管理者はチケットシステムを介してネットワークの変更を依頼し、ネットワークチームが対応するのを待たなければなりませんでした。しかし、Big SwitchとPrismが統合したことで、Prismの管理者がセルフサービスでネットワークを管理できるようになりました」

人為的なミスの削減

データセンターの自動化とリモート運用は、非常時にこそ効果を発揮している。しかし、もっとも日常的に遭遇する問題が人為的ミスによるダウンタイムだ。
人為的なミスによる影響の大きさは調査によってさまざまだが、Uptime Instituteはデータセンターの全ダウンのうち70%は人為的なミスが原因であると推定している。

いま、ITの世界は過渡期にある。データ量がどうこうより、ワークロードを理解することが重要だ。Moor Insights&Strategyシニアアナリスト、スティーブ・マクダウェル氏は、数字はさておき、たった1つの人為的なミスが重大な結果をもたらすこともある、と話す。

マクダウェル氏 「たとえば、2017年に起こったブリティッシュエアウェイズのシステム障害は、あるエンジニアが電源を一度切断したあとに再接続したことが原因と判明しました。これによって発生した過電圧でIT機器が損傷してしまった結果、何百ものフライトが欠航になり、乗客への払い戻しと補償は1億1,200万ドルにのぼりました」

この出来事は、人が現場にいるよりもリモート運用のほうが時としてうまく機能することがあるという一例だ。

「ネットワークインフラストラクチャーをリモートで管理するほうが、現場で業務を行う担当者を配置するより効果的です。」とNutanixのピアースは言う。
ピアース 「現場で人が歩き回っていれば、視覚的にはうまくいっているように見えるかもしれません。しかし、リモートで出勤してもBigSwitchのSDNの機能を使ってすべてが正しく接続されているかどうかを判断し、実際の接続状態を確認することができるのです」

ケーブル配線の物理的な問題の修正は現場で手作業するしかない。しかし、ピアースは 「私たちは、リモートとオンサイト両方のデータセンタースタッフが、外部のチームに頼ることなく自分の作業を即座に検証・監査できるツールを作りました」と話した。

AIがあたりまえに

Moor Insights&Strategyのストレージおよびデータセンターテクノロジー担当シニアアナリストであるスティーブ・マクダウェル氏は、AIのおかげでリモートデータセンターとネットワークの高度な完全自動管理化が進んでいることによって労力が減り、稼働時間は増えると言う。

マクダウェル氏 「あるゆるベンダーがAIを意思決定に利用するようになってきています。たとえばストレージデバイスがAIアルゴリズムに関連付けられた情報を送信することで、障害を予測できます。そのほかにも、容量の拡張を検討する際、ITでは数千のVDI(仮想デスクトップインフラストラクチャー)ノードの動作をモデル化できるのです。インフラ自動化に、AI主導型の予測分析ツールは、いまやあたりまえのものになっていると言えます」

マクダウェル氏は自動化とリモート運用の増加により、IT運用マネージャーの仕事の中身に変化が起きていると言う。

マクダウェル氏 「いま、ITの世界は過渡期のさなかにあります。その仕事をレベルアップさせるのが私たちです。データ量がどうこうより、ワークロードを理解することが重要です」

続けて、マクダウェル氏は、AIツールの使用を増やすとIT担当者がアプリケーションのパフォーマンスをモデル化でき、さらに、オンプレミスとクラウドのどちらで仕事をするべきか金銭的判断を下せるようになる、と説明した。

コロナ禍の教訓

データセンターは自動化によってコロナウイルスという嵐を乗り切ろうとしていますが、このパンデミックは将来の教訓を与えるストレステストとなるだろう。

「今後半年も経てば、ITにおいて現在の状況がどれほど困難だったか、または容易だったか、どこが弱点だったか振り返ることができるでしょう」とマクダウェル氏は述べている。

マクダウェル氏 「私たちは、自動化の欠陥を明らかにするための重要な実験を経験しているのです。 SDI(ソフトウェア・ディファインド・インフラストラクチャー)に向けてITをさらに進めるために何が役立ち、何が役立たないのかわかるでしょう。オンプレミスやクラウドのリソースをプロビジョニングする必要があるため、クラウド対応のソフトウェア定義のツールが最も必要とされるはずです」

NutanixのCIOであるファイファーは、Nutanixはこの方向に順調に進んでいると言う。

ファイファー 「私たちはすでにハイブリッドクラウドモードで運用しています。 アマゾンとグーグルが提供する、パブリッククラウドインフラストラクチャーで重要な業務を行っています」

このハイブリッドモデルは、CitrixのVDIを使う必要がある従業員の多くが、コロナ禍の影響によって急にリモートワークをすることになった時に役立った。

ファイファー 「私たちは約2,500のリモートセッションをサポートするようにプロビジョニングされたデータセンターの1つで、重要なCitrixのファームを実行しています。しかし、在宅勤務をするエンジニアの人数が増えるにつれて容量が限界に近づいたため、自社のデータセンターに追加のサーバを調達してプロビジョニングするかわりに、AWS(アマゾン・ウェブ・サービス)に追加のVDI容量をプロビジョニングしてNutanix Frameの VDIファームをスケールアウトしました」

ファイファーは続けて、「現在、Nutanix Frameを利用するものの、AWSとNutanixのAcropolis Hypervisorで認定されたCitrixを利用する自社データセンターの両方で数千のVDIセッションを実行しています。この混合モードが可能なのは双方の環境が当社のハイブリッドOS(Acropolis Hypervisor plusとAcropolis operating system)という基盤を共有し、物理的なプロビジョニングが必要なかったためです」と話す。

パンデミックの先を見据えたとき、より賢く強力なリモートデータセンターの運用管理が必要になることは容易に予測ができる。

また、Nutanixのピアースは「データセンターに直接行けないことは、いまではたいした問題ではありません。データセンターが同じ建物内にあるか、数千マイル離れているかは関係なく、管理プロセスは同じです」と話した。今後は、ITチームは最初からそれを前提に設定する必要があると彼は言った。

(2020年5月22日, THE FORECAST by NUTANIX)記事構成:ニュータニックス・ニュース! 編集部, Nutanix Japan

*スタン・ギブソン氏はテクノロジージャーナリスト。

© 2020 Nutanix, Inc.All rights reserved.Nutanix、Nutanixのロゴ、その他のNutanixの製品および機能名は、Nutanix, Inc.の米国その他国における登録商標または商標です。本リリースに記載されているその他全てのブランド名は、識別目的でのみ使用されており、各所有者の商標です。その他のリーガル情報は、こちらをご確認ください。