執筆者:マイク・バーモンド Nutanix AIプロダクトマーケティングマネージャー
2025 年 5 月 8 日 13:00 | 7分
ワシントンD.C.で開催中の.NEXT 2025で発表されたNutanix Enterprise AI (NAI) 製品の最新バージョンは、NVIDIAのエージェント型ワークフローをサポートします。NAIとNVIDIA NIM™およびNVIDIA NeMo™のマイクロサービスおよびモデルは、NVIDIA Accelerated Computingを使用して、エージェント型ワークフローの設定をこれまで以上にシンプルにします。
生成AIのチャットシステムは、人間が行動するためのAIによる回答を提示しますが、AIエージェントはそれらの回答を受け取り、行動を自動化し、質問に答え、解決策を見つけ、関連するタスクを自律的に実行します。
どのように?それでは詳細を見ていきましょう。
AIエージェント(エージェント型AIとも呼ばれる)は、特定のタスクを実行するだけでなく、自律性、適応性、自己認識を示すAIシステムです。これらの資質により、AIシステムは効果的に動作し、人間の行動により近づけることができます。エージェント型AIは、文脈を理解し、経験から学び、より広い目的に沿った意思決定を行うことができます。
企業は生成AIを比較的短い時間軸で導入しようとしています。実装後のタスクや管理(Day 2運用)にも対応できる、レジリエンスを備えた安全なアーキテクチャの構築は、引き続き課題となっています。同じアーキテクチャが、エージェント型AIのように変化し続けるAIの状況にも適応できることを保証し続けることも、同様に困難です。
エージェント型AIソリューションは、プランニング用のLLM、様々な決定論的タスクを実行するためのツール、コンテキスト検索のための記憶を活用することで、人間の行動をより忠実に模倣することを目指しています。
エージェントのワークフローには、複数のLLMタイプのモデルが含まれます。例えば、RAG (Retrieval-Augmented Generation、検索拡張生成)フローは、推論LLMにコンテキストを送り、リランキングとセーフティガードレールを使って最良の答えを決定し、応答の安全性を確保することができます。エンベッディング・モデルは、ベクトル・データベースの統合を支援します。これらのワークフローは、プリセットの「ブループリント」として提供することもできます。AI推論、チューニング、トレーニングのいずれに重点を置いている場合でも、エージェントはAIを活用する新しい方法を提供します。
「シンプル」は必ずしも簡単という意味ではありません。生成AIの進歩は、技術スタックを再定義しかねないほどの新しいソリューションを要求がちで、特にエージェントの場合は、成功するために生成AIとの強固な基盤が必要です。
NutanixとNVIDIAは、Nutanix Enterprise AIで生成AIの導入を支援する簡単な方法を提供します。NAIは、生成AIアプリケーションをNVIDIA NIMおよびNeMoモデルに接続するためのAPIを備えたセキュアなエンドポイントの作成と管理を支援し、Day 2運用で生成AIのためのレジリエンスを備えたセキュアなモデルリポジトリを可能にします。
Nutanix と NVIDIA の価値
昨年11月のNAIのローンチには、NVIDIA APIカタログの最新モデル用のNVIDIA NIMマイクロサービスのビルトイン統合が含まれていました。NVIDIA NIMとNAIを組み合わせる利点は以下の通りです:
AIエージェントはいかがでしょうか?これらはすでに利用可能です。
NVIDIA GTC 2025は、エージェントの新しい世界の到来を告げるものでした。Nutanix Enterprise AIは、エージェント型AIアプリケーション用のNeMo Retrieverやエージェント型アプリケーションを保護する NeMo Guardrailsなど、NVIDIA NIMとNeMoマイクロサービスおよびモデルを使用して、生成AIタスク用のエージェント型ワークフローを統合します。エージェントのワークフローをシンプル化、制御、自動化し、3つの方法で選択肢と柔軟性を提供します:
複数のアプリケーションがアクセスし活用できるように、セキュアなエンドポイントとAPIを備えた単一の共有サービスに、ユースケースごとにモデルを組み合わせます。
エージェント型ワークフローが進歩するにつれ、複数のモデルとエンドポイントを再利用するというニーズが、アプリケーション間で効率とパフォーマンスを達成するための鍵となります。以下は、エンドポイントとAPIのRAGモデルセットが様々なアプリケーションでどのように機能するかの例です。
複数のアプリケーションで使用できる安全なエンドポイントを備えた NVIDIA NIM および NeMo マイクロサービスを含む、RAG 向けの単一のNAI 共有サービスモデルの例
一部のNVIDIA NIMおよびNeMoマイクロサービスモデルは、「ツールコール」とも呼ばれるファンクションコールオプションをサポートしています。これにより、LLMプロンプトに自動的に統合される外部データソースにクエリできます。これらの追加機能は、該当する論理データを提供することで、コンテキストに沿った回答を求めるエンドユーザーの要求を合理化し、直感的な回答と自動化によってDay 2運用オーバーヘッドを削減できる可能性があります。
NAIは、互換性のあるLLMに1-クリックでツールをコールする機能を追加します。以下の例は、ファンクションコールをオンにすることで、特定の場所のリアルタイムの天気を挿入できることを示しています:
以下のエンドポイントのペイロードのサンプルコードは、カリフォルニア州サンタクララの天気を尋ねるもので、「ツールコール」を含めるようにチェックされています。
そして、リアルタイムの気象データを要求するファンクションコールをオンにすることで、レスポンスが増強されます:
悪意のあるプロンプトインジェクションは、LLMのコアガードレールを取り除くことで、LLMの完全な侵害につながる可能性をはらんでいます。機密性の高い企業データの使用や自動化されたエージェントワークフローと組み合わせることで、企業AIエージェントのセキュリティは強固に強化されなければなりません。NVIDIA NeMo Guardrails は、ジェイルブレイクやプロンプトインジェクションのような一般的なLLMの脆弱性からLLMを搭載したチャットアプリケーションを保護するのに役立ついくつかのメカニズムを提供します。
NutanixとNVIDIAは、NeMo Guardrails を中心としたエンドツーエンドのエージェント型RAGワークフローを提供
その他の注目すべき改善点:
「Show only Pre-validated Models(検証済みモデルのみを表示)」スイッチを切り替えることで、両者を簡単に切り替えることができます:
NVIDIA NIMとNeMoマイクロサービスは、エージェント型RAGワークフローに構成することができます。そしてNAIは、標準化された推論管理によってこのワークフローを展開します。
以下は、NutanixとNVIDIAのエージェントベースのRAGワークフローのコンポーネントと、それぞれの機能です:
NutanixとNVIDIA、NeMo Guardrails でエンドツーエンドのエージェント型RAGワークフローを実現
NutanixとNVIDIAは、Nutanix GPT-in-a-Boxソリューションで、NVIDIA Accelerated ComputingとNutanix Kubernetes Platform(NKP)を使用したインフラストラクチャ、Nutanix Unified Storage(NUS)、NVIDIA NIMとNeMoマイクロサービスの推論プラットフォームとしてのNAIなど、RAGのエージェント型ワークフローを開始するために必要なものを提供します。
GPT-in-a-Boxは、NutanixとNVIDIAが提供するエージェント型アーキテクチャに必要なすべてのもの(データサービスを含む)に対応
また、NVIDIA GTC 2025で発表されたように、NUSは現在、NVIDIAのエンタープライズ・ストレージ・パートナー・プログラムと連携しています。NVIDIA認定システムプログラムのメンバーであるNUSは、NVIDIA Enterprise Storage Validatedソリューションであり、お客様のNVIDIA搭載AIワークロードやNVIDIA AI Data Platformのようなリファレンスアーキテクチャをサポートする準備が整っています。
Nutanix Unified StorageはNVIDIA GPUDirect Storageをサポートし、NVIDIA OVX認証を取得済み
また、Nutanix Unified StorageはNVIDIA GPUDirect Storageをサポートしており、ローカルまたはリモートのストレージとGPUメモリ間のダイレクトデータパスの作成を支援し、CPUに負担をかけることなく、ネットワークアダプタまたはストレージの近くでダイレクトメモリアクセス(DMA)エンジンを実現します。
NVIDIA GPUDirectとNutanix Unified Storageは、データへのダイレクト・パスを作成
このブログの末尾にあるリンクから、さらなる詳細をご確認ください。
NutanixとNVIDIAは、お客様のニーズに応じて、エッジ、コア、パブリッククラウドのどこにでもAIを導入するための重要なAI戦略パートナーとなります。
Nutanix GPT-in-a-Boxは、NVIDIA Accelerated Computingおよび認定システムと組み合わせることで、アーキテクチャを再定義することなく最適なパフォーマンスを保証します。
GPT-in-a-BoxをNAIで構成し、エッジからパブリッククラウドまで展開
NutanixとNVIDIAは、AIエージェントの理解を深めるお手伝いをします。シンプルなモデルの提供からAIエージェントとワークロードの実行まで、レジリエンスがあり、安全で、運用性に優れたソリューションで AI 戦略をシンプルに実現できます。
次はどうしますか?
Nutanix is a global leader in cloud software, offering organizations a single platform for running apps and data across clouds. With Nutanix, organizations can reduce complexity and simplify operations, freeing them to focus on their business outcomes. Building on its legacy as the pioneer of HCI, Nutanix is trusted by companies worldwide to power hybrid multicloud environments consistently, simply, and cost-effectively. Learn more at www.nutanix.com or follow us on social media @nutanix.
© 2025 Nutanix, Inc. All rights reserved. Nutanix, the Nutanix logo, and all Nutanix product and service names mentioned herein are registered trademarks or unregistered trademarks of Nutanix, Inc. (“Nutanix”) in the United States and other countries. Kubernetes® is a registered trademark of the Linux Foundation. Other brand names or marks mentioned herein are for identification purposes only and may be the trademarks of their respective holder(s). This blog is for informational purposes only and nothing herein constitutes a warranty or other binding commitment by Nutanix. This blog contains express and implied forward-looking statements, including but not limited to statements regarding our plans and expectations relating to new product features and technology that are under development, the capabilities of such product features and technology and our plans to release product features and technology in the future. Such statements are not historical facts and are instead based on our current expectations, estimates and beliefs. The accuracy of such statements involves risks and uncertainties and depends upon future events, including those that may be beyond our control, and actual results may differ materially and adversely from those anticipated or implied by such statements. Any forward-looking statements included herein speak only as of the date hereof and, except as required by law, we assume no obligation to update or otherwise revise any of such forward-looking statements to reflect subsequent events or circumstances. Any future product or product feature information is intended to outline general product directions, and is not a commitment, promise or legal obligation for Nutanix to deliver any functionality. This information should not be used when making a purchasing decision. Our decision to link to or reference an external site should not be considered an endorsement of any content on such a site. Certain information contained in this content may relate to, or be based on, studies, publications, surveys and other data obtained from third-party sources and our own internal estimates and research. While we believe these third-party studies, publications, surveys and other data are reliable as of the date of this paper, they have not independently verified unless specifically stated, and we make no representation as to the adequacy, fairness, accuracy, or completeness of any information obtained from a third-party.