作者:Ashwini Vasanth,Nutanix 首席產品經理
在部署生成式 AI 的競賽中,最後一哩路往往最為艱難。資料科學家和開發人員不僅需要原始的運算能力;他們還需要一個整合模型、安全護欄和資料連接器的生態系統,才能建立企業級代理程式。
如今,我們正在彌合此一差距。透過在 Nutanix Enterprise AI(NAI)導入 AI Gateway、擴展模型及服務(MaaS)和 MCP 伺服器存取管理功能,我們正在提供一個完整的 Kubernetes 原生 AI 服務層。結合 Nutanix Kubernetes 平台(NKP)上精心策劃的 AI Catalog(即將推出),Nutanix 正在提供專為現代企業設計,用於生產就緒的 AI PaaS。
隨著組織規模不斷擴大,其往往會發現自己深陷於 SDK 蔓延的困境,需要同時應付託管供應商、本地端模型和微調變體等不同的 API。Nutanix AI Gateway 透過提供跨模型廠商的統一標準化 API 來解決此問題。
這個抽象層不僅能簡化程式碼;它還提供關鍵的企業級功能:
我們正在擴充模型即服務(MaaS)功能,讓團隊在部署人工智慧方面擁有更高的彈性。
驗證目錄中的新模型包括 Olmo 和 Ministral 系列,並配備自動化的資源計算功能。對於建立多模態應用程式的使用者,我們則整合 NVIDIA Whisper NIM,以提供高效能的語音轉文字功能。
透過 KV-Cache Aware 路由(技術預覽)和 Speculative Decoding 進一步最佳化效能,以減少「首字回應時間」(TTFT)和權杖間延遲。對於需要專門邏輯的團隊,我們則推出 LoRa-based Supervised Fine-Tuning(技術預覽)。這讓私有資料可進行高效能的調校,並直接於 NAI 工作流程中管理模型,實現無縫部署和可觀測性。
模型情境協定(MCP)旨在允許代理程式能安全地與外部工具和內部資料庫互動,無需自訂程式碼整合。
NAI 為 MCP 伺服器存取管理提供下列功能:
代理程式建構者面臨的最大障礙通常為「系統上線後第 2 天」作業:管理 CVE、驗證版本相容性,以及將不同的工具拼湊在一起。
即將推出的 NKP AI Catalog 將提供一套精心策劃和驗證的工具,涵蓋整個 AI 生命週期:
從簡單的提示到在生產環境中部署受管控且安全的 AI 代理程式,整個過程不應是支離破碎的掙扎。透過 NAI 和 NKP 的更新,Nutanix 提供統一的平台,可隨您的遠大目標而擴展規模。無論您正在嘗試開放原始碼模型,或部署全域規模的代理程式,Nutanix AI PaaS 都能協助確保您的基礎架構成為加速器,而非瓶頸。
©2026 Nutanix, Inc. 保留所有權利。Nutanix、Nutanix 標誌和本文所提及的所有產品和服務名稱,均屬於 Nutanix 公司在美國和其他國家的註冊商標或商標。Kubernetes® 為 Linux 基金會的註冊商標。NVIDIA®、Whisper™ 與 NIM™ 均為 NVIDIA 公司的商標和/或註冊商標。此處提及的所有其他品牌名稱均僅供識別參考,且可能為其各自擁有者的商標。本內容可能包含明示和暗示的前瞻性陳述,這些陳述並非歷史事實,而是基於我們目前的預期、估計和信念。這些陳述的準確性涉及風險和不確定性,並取決於未來的事件,包括我們可能無法控制的事件,而實際結果可能與此類陳述所預期或暗示的內容有重大或相反的差異。任何前瞻性陳述僅代表截至本陳述發布之日的資訊,除法律規定外,我們概不承擔更新或以其他方式修改此類前瞻性陳述,以反映後續事件或情況的義務。