Nutanix Agentic AI によるエンタープライズ AI スタックの構築

執筆者:Nutanix プリンシパル・プロダクトマネージャー Ashwini Vasanth

生成 AI の導入競争において、「最後のステップ」は最大の課題です。データサイエンティストや開発者に必要なのは単なる計算リソースだけではありません。エンタープライズグレードのエージェントを構築するためには、モデル、セキュリティガードレール、データコネクタを統合したエコシステムが必要です。

Nutanix はこの課題に対応します。Nutanix Enterprise AI(NAI)において、AI Gateway、拡張された Model-as-a-Service(MaaS)、MCP サーバーアクセス管理機能を提供し、Kubernetes ネイティブな包括的 AI サービスレイヤーを構築します。さらに、Nutanix Kubernetes Platform(NKP)上で提供予定の厳選された AI Catalog と組み合わせることで、モダンエンタープライズに最適化された本番対応の AI PaaS を提供します。

単一のインターフェースでベンダーロックインを排除:AI Gateway(テックプレビュー)

組織が規模を拡大するにつれ、ホスト型プロバイダ、ローカルモデル、ファインチューニング済みモデルなど、さまざまな AP I を扱う必要が生じ、SDK の乱立が課題になります。Nutanix AI Gateway は、モデルベンダーを横断した統一・標準 API を提供することで、この課題に対処します。

この抽象化レイヤーは、単にコードを簡素化するだけでなく、エンタープライズに不可欠な次の機能を提供します。

  • 高可用性:AI Gateway は、複数のアップストリームプロバイダへの接続に対応。プライマリプロバイダの障害発生や、予算が超過した場合も、正常な代替先へ自動的にトラフィックをルーティングし、エージェントの常時稼働を確保します。また、ホスト型・セルフホスト型を問わず、全てのモデルにわたる統一された可観測性を提供し、分断された可視化による分析精度の低下や意思決定リスクを低減します。
  • 分散型スケーラビリティ:リモートの NAI クラスタをプロバイダーとして登録可能。インフラ全体に分散した GPU を活用し、スループットのボトルネックを解消できます。
  • ガバナンスとコスト管理:ユーザーごとのグローバルかつきめ細かなトークンベースのレート制限により、財務上のガードレールとして機能。これにより、制御不能なエージェントによるコスト超過を防ぎ、開発者は請求額の監視ではなくロジックの構築に集中できるようになります。

Model as a Service の拡張

Model-as-a-Service(MaaS)の機能の拡張により、チームがインテリジェンスを柔軟に展開できるよう支援します。

検証済みカタログには、新たに Olmo および Ministral ファミリーのモデルを追加し、リソース自動計算機能も備えています。マルチモーダルアプリケーションを構築するユーザー向けに、高性能な音声認識を実現する NVIDIA Whisper NIM を統合しています。

さらに、KV-Cache Aware ルーティング(テックプレビュー)や Speculative Decoding により、初回トークン生成までの時間(TTFT)やトークン間のレイテンシを低減し、パフォーマンスを最適化します。高度なロジックを必要とするチーム向けに、LoRa ベースの教師ありファインチューニング(テックプレビュー)を導入しました。これにより、プライベートデータを用いた計算効率の高いチューニングが可能となり、生成されたモデルは NAI ワークフロー内で直接管理されるため、シームレスなデプロイと可観測性が実現します。

エージェントのセキュリティ確保:MCP サーバーアクセス管理(テックプレビュー)

Model Context Protocol(MCP)は、カスタム統合を行うことなく、エージェントが外部ツールや社内データベースとセキュアに連携できるよう設計されています。

NAI は、MCP サーバーアクセス管理において次の機能を提供します。

  • 統合セキュリティと RBAC:個々の MCP サーバーごとに設定するのではなく、ゲートウェイインターフェースで API キーを一元注入。
  • ツールレベルのフィルタリング:エージェントがアクセスできる特定のツール機能(例:「読み取り専用」対「書き込み」)を詳細に制御可能。
  • エンタープライズ可観測性:レイテンシや呼び出されている特定のツールを含む全ての MCP リクエストを記録し、AI ガバナンスに必要な完全な監査証跡を提供。

NKP AI Catalog:本番運用への迅速な導入を支えるキュレーション基盤

エージェント開発における最大の障壁は、多くの場合「Day 2の運用」、すなわち CVE(脆弱性)の管理、バージョン互換性の検証、分散したツールの統合にあります。

まもなく提供予定の NKP AI Catalog は、AI ライフサイクル全体を網羅する、厳選・検証済みのツールスイートを提供します。

  • 開発者向けツール:実験用にすぐに使える Jupyter Notebook
  • ベクトルデータベース:プライベートデータに基づくセマンティック検索を実現し、エージェントの精度を向上
  • MLOps とフレームワーク:高度なエージェントワークフローの構築のための検証済みスタック
  • NVIDIA NeMo サービス:NIM の評価と微調整を行うための専用ツール

シンプルなプロンプトから、ガバナンスとセキュリティを備えた AI エージェントの本番環境への道のりは、断片的で複雑であるべきではありません。NAI と NKP のこれらのアップデートにより、Nutanix はスケーラブルに対応可能な統合プラットフォームを提供します。オープンソースモデルの実験からグローバル規模のエージェントの展開に至るまで、Nutanix の AI PaaSは、インフラがボトルネックではなく、アクセラレータとなるよう支援します。

©2026 Nutanix, Inc. All rights reserved. Nutanix, the Nutanix logo, and all Nutanix product and service names mentioned herein are registered trademarks or trademarks of Nutanix, Inc. in the United States and other countries. Kubernetes® is a registered trademark of The Linux Foundation. NVIDIA®, Whisper™, and NIM™ are trademarks and/or registered trademarks of NVIDIA Corporation. All other brand names mentioned herein are for identification purposes only and may be the trademarks of their respective holder(s). This content may contain express and implied forward-looking statements, which are not historical facts and are instead based on our current expectations, estimates, and beliefs. The accuracy of such statements involves risks and uncertainties and depends upon future events, including those that may be beyond our control, and actual results may differ materially and adversely from those anticipated or implied by such statements. Any forward-looking statements included speak only as of the date hereof and, except as required by law, we assume no obligation to update or otherwise revise any such forward-looking statements to reflect subsequent events or circumstances.