AIㆍML

엔비디아, 마이크로소프트 애저에서 생성형 AI 파운드리 서비스 제공

편집부 | ITWorld 2023.11.16
엔비디아가 마이크로소프트 애저(Microsoft Azure)에 AI 파운드리 서비스를 제공한다고 밝혔다. 

엔비디아 AI 파운드리 서비스는 엔비디아 AI 파운데이션 모델(AI Foundation Models), 엔비디아 네모 프레임워크(NeMo Framework), 엔비디아 DGX 클라우드(DGX Cloud) AI 슈퍼컴퓨팅 서비스를 통합해 기업이 맞춤 생성형 AI 모델을 제작할 수 있는 엔드투엔드 솔루션을 제공한다.

이를 통해 기업은 지능형 검색, 요약, 콘텐츠 생성 등을 지원하는 생성형 AI 애플리케이션의 구동을 위해 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어와 함께 맞춤형 모델을 배포할 수 있다. SAP SE, 암독스(Amdocs), 게티 이미지가 해당 서비스를 사용해 맞춤형 모델을 구축하고 있다.
 

엔비디아 CEO 젠슨 황은 “엔비디아 AI 파운드리 서비스는 엔비디아의 생성형 AI 모델 기술, LLM 트레이닝 전문성, 대규모 AI 팩토리를 통합한다”라며, “이를 마이크로소프트 애저에 구축해 전 세계 기업이 맞춤형 모델을 마이크로소프트의 클라우드 서비스와 연결할 수 있도록 했다”라고 말했다.

마이크로소프트의 회장 겸 CEO인 사티아 나델라는 “엔비디아와의 파트너십은 실리콘부터 소프트웨어까지 코파일럿(Copilot) 스택의 모든 계층을 아우르며, 새로운 AI 시대를 위해 함께 혁신하고 있다”라며, “엔비디아의 생성형 AI 파운드리 서비스를 통해 마이크로소프트 애저에서 스타트업을 포함한 기업이 클라우드를 기반으로 AI 애플리케이션을 구축하고 배포할 수 있는 새로운 기능을 제공한다”라고 밝혔다.

엔비디아 AI 파운드리 서비스는 엔터프라이즈 소프트웨어, 통신, 미디어를 비롯한 산업 전반에서 생성형 AI 기반 애플리케이션용 모델을 맞춤 설정하는 데 사용할 수 있다. 배포 준비가 완료되면 기업은 검색 증강 생성(Retrieval Augmented Generation, RAG) 기술을 사용해 모델을 엔터프라이즈 데이터와 연결하고 새로운 인사이트에 접근할 수 있다.

SAP는 마이크로소프트 애저 기반 엔비디아 DGX 클라우드의 첫 번째 고객이다. SAP는 이 서비스와 최적화된 RAG 워크플로우를 엔비디아 DGX 클라우드, 엔비디아 AI 엔터프라이즈 소프트웨어와 함께 사용할 계획이다. 이들은 애저에서 실행돼 새로운 자연어 생성 AI 코파일럿인 쥴(Joule)을 맞춤화하고 배포하도록 지원한다.

통신, 미디어 기업에 소프트웨어와 서비스를 제공하는 암독스는 전 세계 통신업체의 생성형 AI 애플리케이션과 서비스 채택을 가속화하기 위해 암독스 어메이즈(amAIz) 프레임워크에 대한 모델을 최적화하고 있다.

엔비디아 파운드리 서비스를 사용하는 고객은 애저 AI 모델 카탈로그에서 제공되는 여러 엔비디아 AI 파운데이션 모델 중에서 선택할 수 있다. 여기에는 새로운 엔비디아 네모트론-3 8B 모델(Nemotron-3 8B models) 제품군이 포함된다. 개발자는 엔비디아 NGC 카탈로그에서 네모트론-3 8B 모델에 접속할 수 있다. 아울러 가속 컴퓨팅을 위해 엔비디아에 최적화된 메타의 라마2(Llama 2)와 같은 커뮤니티 모델도 애저 AI 모델 카탈로그에 곧 제공될 예정이다.

80억 개의 파라미터로 최적화된 네모트론-3 8B 제품군에는 다양한 사용례에 맞게 설정된 버전이 포함돼 있다. 또한 맞춤형 엔터프라이즈 생성형 AI 애플리케이션을 구축할 수 있는 다국어 기능도 갖추고 있다.

엔비디아 DGX 클라우드 AI 슈퍼컴퓨팅은 현재 애저 마켓플레이스에서 이용할 수 있다. 사용자가 대여할 수 있는 인스턴스를 통해 수천 개의 엔비디아 텐서 코어 GPU(Tensor Core GPUs)로 확장 가능하다. 더불어 LLM 맞춤 설정을 가속화할 수 있도록 네모를 포함한 엔비디아 AI 엔터프라이즈 소프트웨어가 함께 제공된다. 애저 마켓플레이스에 DGX 클라우드가 추가됨에 따라 애저 고객은 기존 마이크로소프트 애저 소비 약정 크레딧으로 엔비디아 AI 슈퍼컴퓨팅과 소프트웨어을 활용해 모델 개발 속도를 높일 수 있다고 업체 측은 설명했다.

엔비디아 AI 엔터프라이즈 소프트웨어가 애저 머신러닝에 통합되면서 안전하고 안정적이고 지원 가능한 엔비디아 AI, 데이터 사이언스 소프트웨어 플랫폼이 추가됐다. 이로써 네모와 엔비디아 트리톤 추론 서버(Triton Inference Server)가 애저의 엔터프라이즈급 AI 서비스에 포함됐다.

아울러 전 세계 기업에 제작 준비가 완료된 AI 개발과 맞춤 생성형 AI 애플리케이션 배포를 위해 폭넓은 옵션을 제공하는 엔비디아 AI 엔터프라이즈를 애저 마켓플레이스에서 사용할 수 있다.
editor@itworld.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.