By Mike Barmonde, Product Marketing Manager, AI
워싱턴 DC에서 열린 .NEXT 2025에서 발표된 최신 Nutanix 엔터프라이즈 AI(NAI)는 NVIDIA 에이전틱 워크플로우를 지원합니다. NAI와 NVIDIA NIMTM 및 NVIDIA NeMoTM 마이크로서비스 및 모델을 사용하면 NVIDIA 가속 컴퓨팅을 사용하여 에이전틱 워크플로우를 그 어느 때보다 간편하게 설정할 수 있습니다.
GenAI 채팅 시스템이 사람이 수행할 수 있도록 AI의 응답을 제공하는 데 그친다면, AI 에이전트는 그 응답을 바탕으로 질문에 답하고, 해결책을 찾으며, 관련 작업을 자율적으로 수행합니다.
어떻게 가능할까요? 이제부터 알아볼까요?
AI 에이전트(즉, 에이전틱 AI)는 특정 작업을 수행할 뿐만 아니라 자율성, 적응성, 자기 인식을 갖춘 AI 시스템입니다. 이러한 특성을 통해 AI 시스템은 효과적으로 작동하고 인간의 행동 방식에 더 가까워질 수 있습니다. 에이전틱 AI는 맥락을 이해하고, 경험을 통해 학습하며, 추론하여 더 넓은 목표에 부합하는 의사 결정을 내릴 수 있습니다.
기업들은 비교적 짧은 기간에 GenAI를 구현할 수 있었습니다. 구현 후 작업 및 운영 관리(Day 2 운영)까지 처리할 수 있는 탄력적이고 안전한 아키텍처를 구축하는 일은 여전히 큰 과제로 남아 있습니다. 동일한 아키텍처가 에이전틱 AI와 같은 끊임없이 변화하는 AI 환경에 유연하게 적응할 수 있도록 보장하는 것 또한 어려운 일입니다.
에이전틱 AI 솔루션은 계획 수립에 LLM을 활용하고, 다양한 결정론적 작업 수행을 위한 툴과 맥락 회수를 위한 메모리를 결합하여 인간의 행동을 보다 밀접하게 모방하는 것을 목표로 합니다.
에이전트 워크플로우에는 여러 개의 LLM 유형 모델이 포함됩니다. 예를 들어 검색 증강 생성(RAG )플로우는 컨텍스트를 추론용 LLM에 전달한 뒤, 재정렬(reranking) 및 안전성 가드레일을 통해 최적의 응답을 도출하고 그 안전성을 보장할 수 있습니다. 임베딩 모델은 벡터 데이터베이스 통합을 지원합니다. 이러한 워크플로우들은 함께 사전 정의된 ‘블루프린트’ 형태로 제공될 수도 있습니다. AI 추론, 튜닝, 또는 학습 중 어떤 분야에 집중하든, 에이전트는 AI를 보다 효과적으로 활용할 수 있는 새로운 방식을 제공합니다.
"간단하다"는 것이 항상 쉬운 것을 의미하지는 않습니다. GenAI의 발전은 기술 스택을 재정의할 수 있는 새로운 솔루션을 요구하며, 특히 에이전틱 AI는 성공을 위해 견고한 생성형 AI 기반이 필수적입니다.
Nutanix와 NVIDIA는 Nutanix 엔터프라이즈 AI를 통해 GenAI를 쉽게 배포할 수 있는 방법을 제공합니다. NAI는 GenAI 애플리케이션을 NVIDIA NIM 및 NeMo 모델과 연결할 수 있도록 API를 통해 보안 엔드포인트를 생성하고 관리하며, Day 2 운영을 고려한 탄력적이고 안전한 GenAI 모델 저장소를 제공합니다.
Nutanix와 NVIDIA의 가치.
작년 11월에 출시된 NAI에는 NVIDIA API 카탈로그의 최신 모델에 대한 NVIDIA NIM 마이크로서비스 통합이 기본으로 포함되어 있습니다. NVIDIA NIM과 NAI를 결합하면 다음과 같은 혜택이 있습니다.
그렇다면 AI 에이전트는 어떨까요? 이미 존재하고 있습니다.
NVIDIA GTC 2025는 에이전트의 새로운 세계를 열었습니다. Nutanix 엔터프라이즈 AI는 GenAI 작업을 위한 에이전틱 워크플로우와 에이전틱 AI 애플리케이션을 위한 NeMo Retriever, 에이전형 애플리케이션 보호를 위한 NeMo Guardrails와 같은 NVIDIA NIM 및 NeMo 마이크로서비스 및 모델을 통합합니다. 세 가지 방법의 선택과 유연성으로 에이전틱 워크플로를 단순화, 제어 및 자동화할 수 있습니다.
여러 애플리케이션이 접근하고 활용할 수 있는 단일 공유 서비스로 보안 엔드포인트와 API를 사용하여 사용 사례별 모델을 결합합니다.
에이전틱 워크플로우가 발전함에 따라 여러 모델과 엔드포인트를 재사용하는 것은 애플리케이션 전반에서 효율성과 성능을 달성하는 데 있어 핵심적인 요소입니다. 아래는 다양한 앱에서 엔드포인트 및 API의 RAG 모델 집합이 어떻게 작동하는지에 대한 예시입니다.
여러 애플리케이션에서 사용할 수 있는 보안 엔드포인트가 있는 NVIDIA NIM 및 NeMo 마이크로서비스를 포함하는 RAG용 단일 NAI 공유 서비스 모델의 예.
일부 NVIDIA NIM 및 NeMo 마이크로서비스 모델은 '툴 호출'이라고도 하는 함수 호출 옵션을 지원합니다. LLM 프롬프트에 자동으로 통합되는 외부 데이터 소스를 쿼리할 수 있습니다. 이러한 추가 기능은논리적인 데이터를 제공하여 상황에 맞는 답변을 원하는 사용자의 요구를 간소화하고, 직관적인 응답과 자동화를 통해 Day 2 운영 부담을 줄일 수 있습니다.
NAI는 원클릭으로 호환되는 LLM에 대한 툴 호출을 포함할 수 있는 기능을 추가합니다. 아래 예는 함수 호출을 켜면 특정 위치의 실시간 날씨를 삽입하는 방법을 보여줍니다.
아래 엔드포인트 페이로드의 샘플 코드는 캘리포니아주 산타클라라의 날씨에 대해 묻고 'Tool Calling'을 포함하도록 체크했습니다.
그런 다음 실시간 날씨 데이터를 요청하는 함수 호출을 켜서 응답을 강화합니다.
악의적인 프롬프트 인젝션은 핵심 가드레일을 제거하여 LLM을 완전히 손상시킬 수 있습니다. 민감한 엔터프라이즈 데이터 및 자동화된 에이전트 워크플로우의 사용과 함께 엔터프라이즈 AI 에이전트의 보안은 철저히 강화되어야 합니다. NVIDIA NeMo 가드레일은 LLM 기반 챗봇 애플리케이션을 탈옥(jailbreak)이나 프롬프트 인젝션과 같은 일반적인 LLM 취약점으로부터 보호하기 위한 다양한 보호 메커니즘을 제공합니다.
NeMo 가드레일을 중심으로 하는 Nutanix와 NVIDIA의 엔드투엔드 에이전트 RAG 워크플로우.
주목할 만한 개선 사항:
'사전 검증된 모델만 표시' 스위치를 토글하여 두 모델 사이를 쉽게 전환할 수 있습니다.
NVIDIA NIM 및 NeMo 마이크로서비스는 에이전틱 RAG 워크플로로 구성할 수 있습니다. 그런 다음 NAI는 표준화된 추론 관리를 통해 이 워크플로우를 배포합니다.
다음은 Nutanix와 NVIDIA 기반의 에이전틱 RAG 워크플로우 구성 요소들과 각 구성 요소의 역할입니다.
NeMo 가드레일을 사용한 Nutanix 및 NVIDIA 엔드투엔드 에이전틱 RAG 워크플로우.
Nutanix와 NVIDIA는 Nutanix GPT-in-a-Box 솔루션을 통해 RAG에 대한 에이전틱 워크플로우를 시작하는 데 필요한 모든 것을 제공합니다. 여기에는 NVIDIA 가속 컴퓨팅과 Nutanix 쿠버네티스 플랫폼(NKP), Nutanix 통합 스토리지(NUS), NVIDIA NIM 및 NeMo 마이크로서비스를 위한 추론 플랫폼으로서의 NAI를 사용하는 인프라가 포함됩니다.
GPT-in-a-Box는 데이터 서비스를 포함하여 Nutanix 및 NVIDIA의 에이전틱 아키텍처에 필요한 모든 것을 위한 제품입니다.
또한 NVIDIA GTC 2025에서 발표된 바에 따르면, NUS는 이제 NVIDIA의 엔터프라이즈 스토리지 파트너 프로그램과 협력하고 있습니다. NVIDIA 인증 시스템 프로그램의 멤버십을 보유한 NUS는 NVIDIA 엔터프라이즈 스토리지 검증 솔루션으로, NVIDIA 기반 AI 워크로드 및 NVIDIA AI 데이터 플랫폼과 같은 레퍼런스 아키텍처를 지원할 준비가 되어 있습니다.
Nutanix 통합 스토리지는 NVIDIA GPUDirect 스토리지를 지원하며 NVIDIA OVX 인증을 받았습니다.
또한 Nutanix 통합 스토리지는 로컬 또는 원격 스토리지와 GPU 메모리 간에 직접 데이터 경로를 생성하여 CPU에 부담을 주지 않고 네트워크 어댑터 또는 스토리지 근처에서 DMA(직접 메모리 액세스) 엔진을 사용할 수 있도록 지원하는 NVIDIA GPUDirect Storage를 지원합니다.
NVIDIA GPUDirect 및 Nutanix 통합 스토리지는 데이터에 대한 직접 경로를 생성합니다.
이 블로그 맨 밑에 있는 링크를 통해 자세히 알아보세요.
Nutanix와 NVIDIA는 고객의 필요에 따라 엣지, 코어, 퍼블릭 클라우드 등 어디에나 AI를 배포할 수 있는 핵심 AI 전략 파트너입니다.
NVIDIA 가속 컴퓨팅 및 인증 시스템과 결합된 Nutanix GPT-in-a-Box는 아키텍처를 재정의하지 않고도 최적의 성능을 보장합니다.
GPT-in-a-Box는 NAI를 사용하여 엣지에서 퍼블릭 클라우드에 배포하도록 구성할 수 있습니다.
Nutanix와 NVIDIA는 AI 에이전트의 이해를 돕습니다. 단순한 모델 제공부터 AI 에이전트 및 워크로드 실행까지, 탄력적이고 안전하며 운영이 간편한 솔루션으로 AI 전략을 간편하게 실행할 수 있습니다.
그렇다면 다음 단계는 무엇일까요?
Nutanix는 클라우드 소프트웨어 분야의 글로벌 리더로서 클라우드 전반에서 애플리케이션과 데이터를 실행할 수 있는 단일 플랫폼을 제공합니다. Nutanix를 통해 조직은 복잡성을 줄이고 운영을 단순화하여 비즈니스 성과에 집중할 수 있습니다. HCI의 선구자로서 쌓아온 업적을 바탕으로 Nutanix는 전 세계 기업들이 하이브리드 멀티클라우드 환경을 일관되고 간편하며 비용 효율적으로 지원하는 데 있어 신뢰를 받고 있습니다. 더 자세히 알아보려면, www.nutanix.com/kr을 방문하거나 소셜 미디어에서 @nutanix를 팔로우하십시오.
© 2025 Nutanix, Inc. All rights reserved. Nutanix, Nutanix 로고 및 본 문서에 언급된 모든 Nutanix 제품 및 서비스 이름은 미국 및 기타 국가에서 Nutanix, Inc.("Nutanix")의 등록상표 또는 미등록상표입니다. Kubernetes®는 Linux Foundation의 등록 상표입니다. 여기에 언급된 기타 브랜드 이름 또는 마크는 식별 목적으로만 사용되며 해당 소유자의 상표일 수 있습니다. 이 블로그는 정보 제공 목적으로만 제공되며, 여기에 포함된 어떠한 내용도 Nutanix의 보증 또는 기타 구속력 있는 약속을 구성하지 않습니다. 이 블로그에는 개발 중인 새로운 제품 기능 및 기술과 관련된 계획 및 기대, 해당 제품 기능 및 기술의 기능, 향후 제품 기능 및 기술 출시 계획에 관한 진술을 포함하되 이에 국한되지 않는 명시적 및 묵시적 미래예측진술이 포함되어 있습니다. 이러한 진술은 역사적 사실이 아니며 현재 예상, 추정 및 신념에 근거한 것입니다. 그 정확성은 여러 위험 요인 및 불확실성의 영향을 받으며, Nutanix의 통제 범위를 벗어난 것을 비롯한 향후 상황에 따라 달라질 수 있습니다. 그리고 실제 결과가 이 진술에서 예측했거나 암시한 것과 크게 다르거나 반대가 될 수도 있습니다. 본 자료에 포함된 모든 미래 예측 관련 고지는 오로지 본 자료 일자에 한해 유효하며, 법에서 달리 정한 경우를 제외하고 Nutanix는 후속 사건이나 상황을 반영하여 미래 예측 관련 고지를 업데이트하거나 기타 방식으로 수정할 의무가 없습니다. 향후 제품 또는 제품 기능 정보는 일반적인 제품 방향을 설명하기 위한 것이며, Nutanix가 어떤 기능을 제공하겠다는 약속, 약속 또는 법적 의무가 아닙니다. 따라서, 이러한 정보를 근거로 구매 결정을 해서는 안 됩니다. 외부 사이트에 링크하거나 참조하기로 한 당사의 결정이 해당 사이트의 콘텐츠를 보증하는 것으로 간주되어서는 안 됩니다. 본 콘텐츠에 포함된 특정 정보는 제3자 출처의 연구 조사, 간행물, 설문 조사, 기타 데이터 및 Nutanix 내부 예측/연구와 관련 있거나 그러한 데이터를 토대로 할 수 있습니다. Nutanix는 이러한 타사 연구 조사, 간행물, 설문 조사, 기타 데이터가 본 콘텐츠 일자를 기준으로 신뢰할 만하다고 판단하지만, 독립적인 검증을 거치지는 않았으며 제3자 출처의 어떤 정보에 대해서도 타당성, 공정성, 정확성, 완전성을 보장하지 않습니다.