By Ashwini Vasanth, Principal Product Manager, Nutanix
일반 인공지능(GenAI)을 도입하기 위한 경쟁에서, 마지막 단계가 가장 어려운 경우가 많습니다. 데이터 과학자와 개발자에게는 단순한 컴퓨팅 성능뿐만 아니라, 엔터프라이즈급 에이전트를 구축하기 위한 모델, 보안 가이드라인, 데이터 커넥터로 구성된 유기적인 생태계가 필요합니다.
오늘, 우리는 그 격차를 해소합니다. Nutanix Enterprise AI(NAI) 내에 AI 게이트웨이, 확장된 MaaS(Model-as-a-Service) 및 MCP 서버 액세스 관리 기능을 도입함으로써, 포괄적인 쿠버네티스 네이티브 AI 서비스 계층을 제공합니다. Nutanix Kubernetes Platform(NKP)의 엄선된 AI 카탈로그(출시 예정)와 결합하여, Nutanix는 현대 기업을 위해 설계된 즉시 운영 가능한 AI PaaS를 제공합니다.
조직이 규모를 확장함에 따라, 호스팅형 제공업체, 로컬 모델, 미세 조정된 변형 모델 등을 위해 서로 다른 API를 동시에 관리해야 하는 ‘SDK 난립’ 문제에 직면하는 경우가 많습니다. Nutanix AI Gateway는 다양한 모델 공급업체에 걸쳐 통합되고 표준화된 API를 제공함으로써 이러한 문제를 해결합니다.
이 추상화 계층은 단순히 코드를 단순화하는 데 그치지 않고, 다음과 같은 중요한 엔터프라이즈 기능을 제공합니다:
팀들이 인텔리전스를 더욱 유연하게 배포할 수 있도록 서비스형 모델(MaaS) 기능을 확대하고 있습니다.
검증된 카탈로그에 추가된 새로운 모델로는 Olmo 및 Ministral 제품군이 있으며, 자동 리소스 계산 기능이 포함되어 있습니다. 또한, 다중 모달 애플리케이션을 개발하는 사용자를 위해 고성능 음성-텍스트 변환 기능을 제공하는 NVIDIA Whisper NIM을 통합했습니다.
“Time To First Token”(TTFT) 및 토큰 간 지연 시간을 줄이기 위해 설계된 KV-Cache Aware 라우팅(Tech Preview)과 추측 디코딩을 통해 성능이 더욱 최적화됩니다. 특화된 로직이 필요한 팀을 위해 LoRa 기반의 Supervised Fine-Tuning(기술 미리보기)을 도입했습니다. 이를 통해 사설 데이터에 대해 컴퓨팅 효율적인 튜닝이 가능하며, 생성된 모델은 NAI 워크플로우 내에서 직접 관리되어 원활한 배포와 가시성을 제공합니다.
모델 컨텍스트 프로토콜(MCP)은 에이전트가 별도의 맞춤형 통합 코딩 없이도 외부 도구 및 내부 데이터베이스와 안전하게 상호 작용할 수 있도록 설계되었습니다.
NAI는 MCP 서버 액세스 관리를 위해 다음과 같은 기능을 제공합니다:
에이전트 개발자들이 직면하는 가장 큰 난관은 대개 “2일차” 운영 단계입니다. 즉, CVE 관리, 버전 호환성 검증, 그리고 서로 다른 도구들을 통합하는 작업입니다.
곧 출시될 NKP AI 카탈로그는 AI 라이프사이클 전반에 걸쳐 엄선되고 검증된 도구 모음을 제공할 예정입니다.:
간단한 프롬프트에서 시작해 운영 환경에 배포된, 규정을 준수하고 안전한 AI 에이전트에 이르기까지의 과정은 더 이상 단편적이고 힘겨운 여정이 되어서는 안 됩니다. NAI와 NKP에 대한 이번 업데이트를 통해 Nutanix는 고객의 야망에 맞춰 확장될 수 있도록 설계된 통합 플랫폼을 제공합니다. 오픈소스 모델을 실험하든 글로벌 규모의 에이전트를 배포하든, Nutanix AI PaaS는 인프라가 병목 현상이 아닌 가속기 역할을 하도록 보장합니다.
©2026 Nutanix, Inc. All rights reserved. Nutanix, the Nutanix logo, and all Nutanix product and service names mentioned herein are registered trademarks or trademarks of Nutanix, Inc. in the United States and other countries. Kubernetes® is a registered trademark of The Linux Foundation. NVIDIA®, Whisper™, and NIM™ are trademarks and/or registered trademarks of NVIDIA Corporation. All other brand names mentioned herein are for identification purposes only and may be the trademarks of their respective holder(s). This content may contain express and implied forward-looking statements, which are not historical facts and are instead based on our current expectations, estimates, and beliefs. The accuracy of such statements involves risks and uncertainties and depends upon future events, including those that may be beyond our control, and actual results may differ materially and adversely from those anticipated or implied by such statements. Any forward-looking statements included speak only as of the date hereof and, except as required by law, we assume no obligation to update or otherwise revise any such forward-looking statements to reflect subsequent events or circumstances.