Nutanix Agentic AI 解決方案抽象化複雜度,並架起代理型 AI 建構者和 AI 工廠營運商之間的無縫橋樑。此全堆疊解決方案透過簡化運作、最大化效能和安全性,以及最佳化詞元成本,為 AI 工廠營運商提供雲端作業模式。同時,它讓代理型 AI 建構者能專注於創新、模型管理和快速推論擴展。
代理型 AI
大多數 AI 平台都承諾提供大規模 AI 服務,但實際上卻帶來複雜性。Nutanix Agentic AI 是一款全堆疊軟體解決方案,提供雲端作業模型,協助組織建立、運作和管理 AI 工廠。透過與 NVIDIA 加速運算生態系統的整合,該解決方案可簡化運作、達到最高效能和安全性,並最佳化 GPU 利用率和詞元成本。
Nutanix 提供專為在 AI 工廠上執行的 AI 同事時代所設計的雲端作業模式。透過抽象化複雜性,並幫助 IT 決策者平衡效能、安全性和成本,Nutanix Agentic AI 解決方案不僅簡化營運;更從根本上最佳化 AI 的經濟效益。
統一、安全的推論端點可讓企業在使用私有大型語言模型的同時,使用雲端託管的模型(和詞元額度),並提供一致的驗證、可觀測性和基於詞元的速率限制。
Nutanix Enterprise AI 擴展其現有強大的模型即服務(MaaS)功能,使代理能夠安全地連接企業工具與資料來源。
使用預先驗證的開放原始碼 AI 服務目錄,包括筆記本、向量資料庫和 MLOps 引擎,將 Agentic 應用程式從概念階段快速部署至生產階段,而不會造成基礎架構延遲。該解決方案與 NVIDIA AI Enterprise 原生整合,讓開發人員可立即部署 NVIDIA NIM(包括 Nemotron),加速生產開發中的高效能 AI 應用程式。
Nutanix AHV 虛擬機器監控程式透過自動最佳化 GPU 密集伺服器的工作負載配置,確保硬體嚴格一致,無需手動調整基礎架構,實現最高效能、安全性與資源利用率。
利用 Nutanix Flow 與全新的 DPU 卸載功能,提供裸機的原始速度,兼具虛擬化環境的精密隔離功能,搭配最大化輸送量的高效能零信任網路基礎,同時確保資料在 AI 工廠間的安全且可靠地流動。
該解決方案支援整個 NKP 平台、NVIDIA GPU 和網路營運商的完全離線安裝,可讓高度管制或國防部門環境自動化驅動程式更新和網路最佳化,且無需暴露叢集於網際網路。
作為 NVIDIA 企業級認證的 AI 資料平台,Nutanix 統一儲存可以在數以千計的 GPU 用戶端上提供高速讀寫效能,確保資料可用性和運算速度同步擴展。
透過利用 NFS over RDMA 和即將推出的 S3 over RDMA 提供低延遲的資料路徑,確保 GPU 永遠不會「資料匱乏」。
透過提供高容量層級的 KV 快取卸載,降低每個詞元的總成本,並釋放關鍵 GPU 記憶體,讓您能處理更大範圍的上下文窗口和更多的並行使用者,且不會影響效能。
Nutanix Agentic AI 解決方案抽象化複雜度,並架起代理型 AI 建構者和 AI 工廠營運商之間的無縫橋樑。此全堆疊解決方案透過簡化運作、最大化效能和安全性,以及最佳化詞元成本,為 AI 工廠營運商提供雲端作業模式。同時,它讓代理型 AI 建構者能專注於創新、模型管理和快速推論擴展。
Agentic AI 建構者面臨高度的「創新摩擦」,因為他們需要在模型、工具和資料孤島等碎片化環境中不斷摸索,而非專注於建立智慧。開發人員則缺乏統一且安全的路徑,無法利用多元大型語言模型和開放原始碼工具,將應用程式從簡單的聊天介面快速演進為精密的代理型 AI,以推動實際的業務成果。
對於 AI 工廠營運者而言,最大的挑戰是如何提供以取得詞元的時間和每個詞元的成本來衡量的商業價值,這是由於 AI 工廠本身的運作複雜性,例如:
雲端作業模型是 Nutanix 用來彌合 AI 開發者與基礎架構團隊之間鴻溝的方法。此模型不再管理分散的單點解決方案或複雜的裸機叢集,而是提供統一的全端環境。它可讓營運商像管理雲端服務一樣,輕鬆管理 AI 基礎架構(GPU、DPU 和儲存設備),同時讓開發人員即時、安全地存取擴充數千個智慧型代理所需的工具和模型。
Nutanix 透過多項整合效率最佳化詞元經濟效益:
雖然裸機為初期模型訓練的標準,但其通常缺乏企業中代理擴展所需的安全性和隔離性。Nutanix 使用基於虛擬機器的 Kubernetes 基礎架構提供:
NAI Gateway 可作為所有 AI 模型的安全「前門」。它提供統一的推論端點,讓企業可以在同一處管理雲端託管模型和私有大型語言模型。關鍵功能包括:
該解決方案提供以開發人員為中心的環境來減少「創新摩擦」,讓他們可繞過基礎架構設定。透過 Nutanix Kubernetes 平台(NKP),建構者可存取豐富的 AI 目錄,包括:
Nutanix 統一儲存提供可擴展、高效能的資料平台,專為 AI 和新一代應用程式等現代工作負載而打造。關鍵功能包括: