By Kaushik Ghosh, Director, Product Management, Nutanix
Alex Almeida, Sr. Product Marketing Manager, Nutanix
단순한 챗봇의 시대는 막을 내렸습니다. 엔터프라이즈 AI는 모델 훈련과 기본적인 추론을 넘어, 복잡한 추론, 장시간 실행되는 워크플로우, 지속적 메모리, 실시간 의사결정이 가능한 자율 시스템인 ‘에이전트형 AI’로 빠르게 진화하고 있습니다.
하지만 AI 에이전트가 짧은 프롬프트에서 벗어나 끊임없이 변화하는 ‘실시간’ 기업 데이터를 기반으로 수 시간에 걸친 추론 세션을 수행하게 되면서, 중대한 인프라적 과제가 대두되고 있습니다. 바로 기존 스토리지 시스템은 AI의 ‘living memory’(동적 메모리) 역할을 하도록 설계되지 않았다는 점입니다.
기업들이 실험 단계에서 본격적인 AI 운영 환경으로 확장해 나갈 때, 두 가지 주요 장애물에 부딪히게 됩니다:
이러한 과제를 해결하기 위해 Nutanix는 Nutanix 통합 스토리지 를 Nutanix 에이전트 기반 AI 스택의 데이터 패브릭으로 발전시키고 있습니다. Nutanix 통합 스토리지는 단순한 수동적 저장 용량이 아닌, AI 팩토리의 고속 데이터 엔진으로 거듭납니다.
대규모 언어 모델(LLM)의 컨텍스트 메모리는 용량이 방대해질 수 있으므로, 최적의 성능과 비용 효율성을 위해 계층적으로 구성됩니다. 1~3티어는 노드 내 로컬 메모리로, GPU VRAM, 시스템 메모리 및 로컬 NVMe 드라이브에 저장됩니다. 4티어는 기초적인 공유 스토리지 계층으로, AI 팩토리의 “동적 메모리(living memory)” 역할을 합니다.
Nutanix는 수천 개의 GPU를 지원할 수 있는 RDMA 지원 고성능 저지연 데이터 계층을 제공함으로써 이 4티어(4번째 계층)을 실제 환경에 적용하고 있습니다. 특화된 캐시-계층화 오케스트레이션 소프트웨어인 LMCache를 Nutanix 통합 스토리지와 통합함으로써, AI 메모리는 비용이 많이 들고 용량에 제약이 있는 로컬 노드에서 복원력이 뛰어난 데이터센터 공유 스토리지로 원활하게 오프로드됩니다.
이러한 단계적 접근 방식을 통해 기업은 다음의 사항들이 가능해집니다:
NVIDIA 인증 AI 데이터 플랫폼(AIDP) 솔루션인 Nutanix는 고객이 AI 에이전트가 기업 데이터가 생성되는 즉시 이를 분석할 수 있도록 지원하는 기능을 제공합니다. NVIDIA Enterprise AI 소프트웨어와 Milvus 벡터 데이터베이스를 Nutanix 통합 스토리지와 직접 통합함으로써, 기업은 원시 데이터를 실시간으로 수집, 변환 및 벡터화할 수 있는 지속적인 데이터 파이프라인을 구축할 수 있습니다. 특히 Nutanix는 단일 스토리지 클러스터 내에서 GPU 지원 노드와 CPU 전용 고밀도 스토리지 노드를 혼합하여 사용할 수 있도록 지원합니다. 이러한 “컴퓨팅 인접(compute-adjacent)” 아키텍처는 AI를 데이터에 직접 적용함으로써, AI 에이전트가 항상 최신의 독점 인텔리전스를 기반으로 작동하도록 보장하고, 기존 데이터 이동 과정에서 발생하는 지연 시간과 마찰을 획기적으로 줄여줍니다.
고속 AI 컴퓨팅에 발맞추기 위해 Nutanix 통합 스토리지는 GPU와 스토리지 메모리 간에 저지연 RDMA 지원 데이터 경로를 제공하는 것을 목표로 합니다. 검증된 NVIDIA GPUDirect Storage(GDS) 솔루션인 Nutanix 통합 스토리지는 AI 워크로드가 I/O 처리 시 CPU를 완전히 우회할 수 있도록 하여, 클라이언트 및 스토리지 노드 모두에서 CPU 오버헤드를 줄이는 동시에 GPU 활용도를 극대화하고 토큰당 비용을 절감합니다. 현재 고성능 파일 액세스를 위해 RDMA 기반 NFS가 지원되며, 향후 지원 계획에는 오브젝트 스토리지를 위한 RDMA 기반 S3로 이 기능을 확장하는 것이 포함됩니다. 이러한 혁신은 오브젝트 스토리지의 방대한 확장성과 초저지연 직접 GPU 액세스를 결합하여, Nutanix 통합 스토리지의 오브젝트 스토리지를 대규모 AI 워크로드와 최신 AI 팩토리를 위한 이상적인 데이터 기반이 되게 합니다.
AI는 그 기반이 되는 데이터만큼만 신뢰할 수 있습니다. Nutanix Data Lens(NDL)는 AI 팩토리로 입력되는 데이터에 필수적인 보안 및 거버넌스를 제공하여, 사전 예방적 감사, 랜섬웨어 보호, 안전한 데이터 격리 기능을 구현합니다. 단일 SaaS 기반 포털을 통해, 또는 Nutanix 스토리지 클러스터에서 직접 실행함으로써, NDL은 조직이 단일 데이터 센터 내이든 전 세계적으로 분산된 환경이든 상관없이 여러 Nutanix 통합 스토리지 클러스터에 걸쳐 데이터 세트를 모니터링, 보호 및 거버넌스할 수 있도록 지원합니다. 이를 통해 AI 라이프사이클 전반에 걸쳐 기업 데이터가 안전하게 보호될 수 있습니다. 자동화된 데이터 분류 및 메타데이터 태깅과 같은 향후 계획된 기능을 통해 민감한 정보를 지능적으로 식별, 보호 및 종단 간(end-to-end)으로 거버넌스할 수 있어, 조직이 규정 준수 노력을 지원하면서 에이전트형 AI 워크로드를 안전하게 구동할 수 있도록 돕습니다.
Nutanix는 AI 팩토리를 위해 설계된 모듈형 레퍼런스 아키텍처인 NVIDIA STX의 설계(Design) 파트너가 된 것을 자랑스럽게 생각합니다. Nutanix는 NVIDIA Vera Rubin 아키텍처를 기반으로 공동 개발을 진행하고 BlueField-4 DPU를 활용함으로써, 지능형 데이터 처리를 스토리지 계층에 직접 통합하고 있습니다. 이를 통해 GPU, 벡터 데이터베이스, RAG 파이프라인이 서로 분리된 구성 요소가 아닌, 유기적으로 연결된 랙 규모 시스템으로 원활하게 작동할 수 있도록 지원합니다.
NVIDIA CMX의 설계 파트너로서 Nutanix는 새로운 G3.5 포드 공유 캐시 계층에 대한 지원을 구축할 계획입니다. 이 획기적인 기술은 확장 가능한 용량과 초고성능을 제공하며, GPU 포드 간 원활한 데이터 공유를 가능하게 합니다. 컨텍스트 메모리에 대한 이러한 계층적 접근 방식은 기업이 방대한 컨텍스트 윈도우를 실행하고, GPU 활용도를 극대화하며, “토큰당 비용”을 대폭 절감할 수 있도록 지원합니다.
Nutanix 에이전틱 AI 스택은 다음을 제공함으로써 기업이 실험 단계에서 운영 환경 수준의 AI 팩토리로 확장할 수 있도록 지원합니다:
Nutanix 통합 스토리지는 Nutanix 에이전틱 AI 스택의 핵심 구성 요소이자 현대적인 AI 팩토리의 데이터 기반입니다. AI를 데이터에 더 가깝게 배치하고 확장 가능한 AI ‘동적 메모리(living memory)’를 구현함으로써, Nutanix는 스토리지를 단순한 수동적 저장 용량에서 에이전틱 AI 시대를 위해 설계된 지능형 고속 데이터 엔진으로 탈바꿈시키고 있습니다.
에이전틱 시스템을 상용화하기 위한 경쟁에서 병목 현상은 더 이상 단순히 반도체 문제가 아니라 데이터 경로 문제입니다. 현대 기업이 직면한 진정한 과제는 더 이상 보유한 GPU의 수가 아니라, 데이터 기반이 대규모 에이전틱 AI의 속도를 따라갈 수 있는지 여부입니다.
Nutanix 통합 스토리지를 사용하면 가능합니다.
©2026 Nutanix, Inc. All rights reserved. Nutanix, the Nutanix logo, and all Nutanix product and service names mentioned herein are registered trademarks or trademarks of Nutanix, Inc. in the United States and other countries. Kubernetes is a registered trademark of The Linux Foundation. NVIDIA and the NVIDIA products mentioned are registered trademarks or trademarks of NVIDIA Corporation. All other brand names mentioned herein are for identification purposes only and may be the trademarks of their respective holder(s). This content may contain express and implied forward-looking statements, which are not historical facts and are instead based on our current expectations, estimates, and beliefs. The accuracy of such statements involves risks and uncertainties and depends upon future events, including those that may be beyond our control, and actual results may differ materially and adversely from those anticipated or implied by such statements. Any forward-looking statements included speak only as of the date hereof and, except as required by law, we assume no obligation to update or otherwise revise any such forward-looking statements to reflect subsequent events or circumstances.