양사가 공동 설계한 사전 구성 형식의 AI 튜닝 및 추론 솔루션을 기반으로, 다양한 규모의 기업은 프라이빗 데이터를 활용해 파운데이션 모델을 신속하게 맞춤화할 수 있다. 또한 엣지에서 클라우드에 이르기까지 어디서나 프로덕션 애플리케이션을 배포할 수 있다. 기업은 HPE와 엔비디아의 풀스택 AI 튜닝 및 추론 솔루션이 포함된 포트폴리오를 통해 생성형 AI 인프라 개발과 배치 과정에서 발생하는 복잡성을 줄일 수 있다.
HPE와 엔비디아는 파트너십 확대의 일환으로 풀스택 AI 솔루션인 신규 생성형 AI용 엔터프라이즈 컴퓨팅 솔루션을 선보인다. 해당 솔루션은 ▲엔비디아 네모(NeMo) 프레임워크를 포함한 엔비디아 AI 엔터프라이즈(NVIDIA AI Enterprise) 소프트웨어 제품군과 ▲HPE MLDE 소프트웨어(HPE Machine Learning Development Environment Software) ▲HPE 에즈메랄 소프트웨어(HPE Ezmeral Software) ▲HPE 프로라이언트 컴퓨트(HPE ProLiant Compute) ▲HPE 크레이 슈퍼컴퓨터(HPE Cray Supercomputers)를 통합해 제공한다.
HPE 회장 겸 CEO인 안토니오 네리는 “HPE와 엔비디아는 사전 구성된(pre-configured) 솔루션 포트폴리오를 통해 AI 모델을 개발하고 배포하는 여정을 획기적으로 간소화할 수 있는, 포괄적인 AI 네이티브 솔루션 제공업체로서 독보적인 위치에 있다”라며, “HPE와 엔비디아의 전략적 협력은 AI로 비즈니스를 혁신하고자 하는 고객의 장벽을 크게 낮출 것”이라고 말했다.
엔비디아 창립자 겸 CEO인 젠슨 황은 “기업들이 비즈니스를 재구상하기 위해 경쟁하면서 생성형 AI의 시대가 본격화되고 있다”라며, “HPE와의 협력 확대를 통해 기업은 비즈니스 데이터와 연결해 보다 정확한 어시스턴트, 정보 기반 챗봇 그리고 시맨틱 검색을 지원하는 AI 애플리케이션을 통해 전례 없는 생산성 향상을 이룰 수 있을 것”이라고 말했다.
생성형 AI용 엔터프라이즈 컴퓨팅 솔루션은 새롭게 선보이는 AI 튜닝 및 추론 데이터 센터 솔루션으로, 바로 사용할 수 있어 다양한 규모의 기업이 신속하게 AI를 도입할 수 있게 한다. 해당 솔루션을 활용해 기업은 사전 훈련된 파운데이션 모델을 프라이빗 데이터와 함께 사용함으로써 AI 챗봇과 같은 생산 애플리케이션을 만들 수 있다. 또한 RAG(Retrieval-Augmented Generation) 기술 기반 업무처리를 통해 애플리케이션의 데이터 품질과 정확도를 더욱 향상할 수 있다.
HPE 프로라이언트 컴퓨트 DL380a(HPE ProLiant Compute DL380a)는 엔비디아 L40S GPUs, 엔비디아 블루필드-3 DPU, 엔비디아 스펙트럼-X 이더넷 네트워킹 플랫폼으로 사전 구성된 랙 규모의 아키텍처다. 해당 솔루션은 700억 개 파라미터로 구성된 라마 2 모델을 미세 조정할 수 있는 크기이며, 16개의 HPE 프로라이언트 컴퓨트 DL380a 서버와 64개의 L40S GPU를 포함한다.
HPE AI 소프트웨어는 모델을 빠르게 프로토타입하고 테스트할 수 있는 새로운 생성형 AI 스튜디오 기능을 갖춘 HPE MLDE 소프트웨어(HPE Machine Learning Development Environment Software)와 하이브리드 클라우드 전반에 걸쳐 배포과정을 단순화하고 AI 워크로드를 위한 데이터 준비 과정을 가속화하는 새로운 GPU 인식 기능을 갖춘 HPE 에즈메랄 소프트웨어가 포함돼 제공된다.
엔비디아 AI 엔터프라이즈를 통해 보안, 안정성, 관리성 확보 및 지원을 통해 프로덕션 AI의 개발과 배포를 가속화한다. 또한, 기업용 생성형 AI를 간소화하기 위해 엔비디아 NeMo 프레임워크, 가드레일 툴킷, 데이터 큐레이션 도구, 사전 훈련된 모델을 제공한다.
HPE 서비스는 이제 컨설팅 서비스, 인력 훈련, 배포 솔루션이 포함된 광범위한 포트폴리오를 제공한다. 새로운 AI 서비스는 생성형 AI 및 LLM 디스커버리부터 구현에 이르기까지 고객이 AI를 도입 및 활용하는 모든 단계에 걸쳐 서비스를 제공한다. 이 과정을 통해 고객들은 솔루션을 구축, 배포, 확장해 혁신적인 결과를 만들어내는데 필요한 최적의 운영 모델과 하이브리드 클라우드 데이터 전략을 개발하게 된다. 이러한 포괄적인 서비스는 AI 및 데이터를 위한 새로운 글로벌 CoE(Centers of Excellence)를 통해 이용할 수 있고, 현재 스페인, 미국, 불가리아, 인도, 튀니지에서 사용할 수 있다.
지난 고성능 컴퓨팅 국제 컨퍼런스 ‘SC23’에서 HPE는 대기업, 연구기관, 정부 조직이 AI 생애주기의 첫 단계인 파운데이션 모델을 개발하고 훈련할 수 있도록 돕는 엔비디아 기반 슈퍼컴퓨팅 턴키 솔루션을 발표한 바 있다. 이번에 공개된 생성형 AI용 엔터프라이즈 컴퓨팅 솔루션은 튜닝 및 추론에 초점을 맞춘 기업 고객을 위한 더 작은 폼팩터 AI 솔루션이다.
HPE 디스커버 바르셀로나 2023(HPE Discover Barcelona 2023)에서 HPE는 새로운 개방형 풀스택 AI 네이티브 아키텍처와 머신러닝 개발, 데이터 분석, AI 최적화 파일 저장, AI 튜닝 및 추론, 전문 서비스를 위한 AI 네이티브 및 하이브리드 클라우드 제품 시리즈를 발표한 바 있다.
editor@itworld.co.kr