Nutanix 에이전틱 AI를 활용한 엔터프라이즈 AI 스택 구축하기

By Ashwini Vasanth, Principal Product Manager, Nutanix

일반 인공지능(GenAI)을 도입하기 위한 경쟁에서, 마지막 단계가 가장 어려운 경우가 많습니다. 데이터 과학자와 개발자에게는 단순한 컴퓨팅 성능뿐만 아니라, 엔터프라이즈급 에이전트를 구축하기 위한 모델, 보안 가이드라인, 데이터 커넥터로 구성된 유기적인 생태계가 필요합니다.

 

오늘, 우리는 그 격차를 해소합니다. Nutanix Enterprise AI(NAI) 내에 AI 게이트웨이, 확장된 MaaS(Model-as-a-Service) 및 MCP 서버 액세스 관리 기능을 도입함으로써, 포괄적인 쿠버네티스 네이티브 AI 서비스 계층을 제공합니다. Nutanix Kubernetes Platform(NKP)의 엄선된 AI 카탈로그(출시 예정)와 결합하여, Nutanix는 현대 기업을 위해 설계된 즉시 운영 가능한 AI PaaS를 제공합니다.

단일 인터페이스, 벤더 종속성 제로: AI 게이트웨이 (TechPreview)

조직이 규모를 확장함에 따라, 호스팅형 제공업체, 로컬 모델, 미세 조정된 변형 모델 등을 위해 서로 다른 API를 동시에 관리해야 하는 ‘SDK 난립’ 문제에 직면하는 경우가 많습니다. Nutanix AI Gateway는 다양한 모델 공급업체에 걸쳐 통합되고 표준화된 API를 제공함으로써 이러한 문제를 해결합니다.

이 추상화 계층은 단순히 코드를 단순화하는 데 그치지 않고, 다음과 같은 중요한 엔터프라이즈 기능을 제공합니다:

  • 고가용성: AI 게이트웨이는 여러 상위 공급자와 연결되도록 구성할 수 있습니다. 주 공급자가 장애를 겪거나 예산 한도를 초과할 경우, 트래픽은 자동으로 정상 작동 중인 대체 공급자로 라우팅되어 에이전트가 지속적으로 온라인 상태를 유지하도록 지원합니다. 또한 이 게이트웨이는 호스팅형 및 자체 호스팅형 모델을 아우르는 통합 가시성을 제공하여, 분석 결과를 왜곡하고 의사 결정에 차질을 빚을 수 있는 단편적인 시각을 해소합니다.
  • 분산 확장성: 원격 NAI 클러스터를 공급자로 등록할 수 있어, 전체 인프라에 분산된 GPU를 활용하여 처리량 병목 현상을 해소할 수 있습니다.
  • 거버넌스 및 비용 관리: 사용자별 글로벌 및 세분화된 토큰 기반 속도 제한 기능을 통해 게이트웨이는 재정적 안전장치 역할을 합니다. 이는 통제 불능 상태의 에이전트가 예산을 소진하는 것을 방지하여, 개발자가 비용 관리 대신 로직 개발에 집중할 수 있도록 합니다.

확장된 서비스형 모델(Model as a Service)

팀들이 인텔리전스를 더욱 유연하게 배포할 수 있도록 서비스형 모델(MaaS) 기능을 확대하고 있습니다.

검증된 카탈로그에 추가된 새로운 모델로는 Olmo 및 Ministral 제품군이 있으며, 자동 리소스 계산 기능이 포함되어 있습니다. 또한, 다중 모달 애플리케이션을 개발하는 사용자를 위해 고성능 음성-텍스트 변환 기능을 제공하는 NVIDIA Whisper NIM을 통합했습니다.

“Time To First Token”(TTFT) 및 토큰 간 지연 시간을 줄이기 위해 설계된 KV-Cache Aware 라우팅(Tech Preview)과 추측 디코딩을 통해 성능이 더욱 최적화됩니다. 특화된 로직이 필요한 팀을 위해 LoRa 기반의 Supervised Fine-Tuning(기술 미리보기)을 도입했습니다. 이를 통해 사설 데이터에 대해 컴퓨팅 효율적인 튜닝이 가능하며, 생성된 모델은 NAI 워크플로우 내에서 직접 관리되어 원활한 배포와 가시성을 제공합니다.

에이전트의 권한 보호: MCP 서버 액세스 관리 (Tech Preview)

모델 컨텍스트 프로토콜(MCP)은 에이전트가 별도의 맞춤형 통합 코딩 없이도 외부 도구 및 내부 데이터베이스와 안전하게 상호 작용할 수 있도록 설계되었습니다.

NAI는 MCP 서버 액세스 관리를 위해 다음과 같은 기능을 제공합니다:

  • MCP 서버를 위한 통합 보안 및 RBAC: 개별 MCP 서버마다 설정하는 대신 게이트웨이 인터페이스에서 API 인증키 설정(API Key injection)을 적용하십시오.
  • 도구 수준 필터링: 에이전트가 액세스할 수 있는 특정 도구 기능(예: “Read Only” 대 “Write”)을 제어합니다.
  • 전사 운영 가시성 및 관측 체계: 지연 시간 및 호출되는 특정 도구를 포함한 모든 MCP 요청이 기록되어, AI 거버넌스를 위한 완벽한 감사 추적을 제공합니다.

NKP AI 카탈로그: 운영 단계로의 신속한 진입을 위한 엄선된 가이드

에이전트 개발자들이 직면하는 가장 큰 난관은 대개 “2일차” 운영 단계입니다. 즉, CVE 관리, 버전 호환성 검증, 그리고 서로 다른 도구들을 통합하는 작업입니다.

곧 출시될 NKP AI 카탈로그는 AI 라이프사이클 전반에 걸쳐 엄선되고 검증된 도구 모음을 제공할 예정입니다.:

  • 개발자 도구들: 바로 실험에 활용할 수 있는 Jupyter Notebook
  • 벡터 데이터베이스: 프라이빗(사내) 데이터에 기반하여 에이전트를 운영할 수 있도록 의미론적 검색 기능을 구현
  • MLOps 및 프레임워크: 복잡한 에이전트 기반 워크플로우 구축을 위한 검증된 스택.
  • NVIDIA NeMo Services: NIM을 평가하고 미세 조정하기 위한 전용 도구.

간단한 프롬프트에서 시작해 운영 환경에 배포된, 규정을 준수하고 안전한 AI 에이전트에 이르기까지의 과정은 더 이상 단편적이고 힘겨운 여정이 되어서는 안 됩니다. NAI와 NKP에 대한 이번 업데이트를 통해 Nutanix는 고객의 야망에 맞춰 확장될 수 있도록 설계된 통합 플랫폼을 제공합니다. 오픈소스 모델을 실험하든 글로벌 규모의 에이전트를 배포하든, Nutanix AI PaaS는 인프라가 병목 현상이 아닌 가속기 역할을 하도록 보장합니다.

©2026 Nutanix, Inc. All rights reserved. Nutanix, the Nutanix logo, and all Nutanix product and service names mentioned herein are registered trademarks or trademarks of Nutanix, Inc. in the United States and other countries. Kubernetes® is a registered trademark of The Linux Foundation. NVIDIA®, Whisper™, and NIM™ are trademarks and/or registered trademarks of NVIDIA Corporation. All other brand names mentioned herein are for identification purposes only and may be the trademarks of their respective holder(s). This content may contain express and implied forward-looking statements, which are not historical facts and are instead based on our current expectations, estimates, and beliefs. The accuracy of such statements involves risks and uncertainties and depends upon future events, including those that may be beyond our control, and actual results may differ materially and adversely from those anticipated or implied by such statements. Any forward-looking statements included speak only as of the date hereof and, except as required by law, we assume no obligation to update or otherwise revise any such forward-looking statements to reflect subsequent events or circumstances.