디지털이미지 / 서버

엔비디아, 차세대 파스칼 아키텍처 기반 ‘테슬라 P100’ GPU 출시

편집부 | ITWorld 2016.04.06
엔비디아(www.nvidia.co.kr)는 미국 캘리포니아 새너제이에서 열리고 있는 GPU 개발자 컨퍼런스 ‘GTC 2016’에서 가장 진보된 하이퍼스케일 데이터 센터 가속기인 ‘테슬라(Tesla) P100’ GPU를 출시했다고 밝혔다.

엔비디아의 차세대 ‘파스칼(Pascal)’ GPU 아키텍처를 기반으로 한 최신 가속 컴퓨팅 플랫폼 테슬라 P100은 수백 개의 CPU 노드를 합친 것과 동일한 수준의 성능을 제공한다고 업체는 설명했다. 가장 심화된 연산 작업을 하는 애플리케이션을 위한 성능과 효율성을 제공하므로, 극대화된 노드와 빠른 속도를 필요로 하는 인공지능 및 과학 응용 분야에 적합하다고 덧붙였다.

테슬라 P100은 이전 세대인 엔비디아 맥스웰(Maxwell) 기반 솔루션과 비교, 12배 향상된 뉴럴 네트워크 훈련 성능을 보이며, 엔비디아의 NV링크의 고속 GPU는 다중의 CPU에 걸쳐 애플리케이션을 확장하며, 현재 최고 수준의 솔루션과 비교했을 때 5배 가속화된 대역폭을 제공한다. 최대 8대의 테슬라 P100 GPU를 NV링크로 연결, 단일 노드에서 애플리케이션 성능을 최대화할 수 있다. 더 빠른 CPU와 GPU 간 정보 전송을 위해 IBM은 POWER8 CPU에 NV링크를 탑재했다.

16나노미터의 핀펫(FinFET, 3차원 입체 구조의 칩 설계 기술) 공정 기술의 153억 트랜지스터를 기반으로 한 파스칼 GPU 아키텍처는 극한의 워크로드를 위해 가장 빠른 성능과 최상의 에너지 효율성을 제공한다.

파스칼 아키텍처는 효율성 극대화를 위해 프로세서와 데이터를 하나로 통합했다. HBM2(고대역폭 메모리)을 탑재한 CoWoS(Chip on Wafer on Substrate) 형태의 메모리 디자인을 통해, 맥스웰 아키텍처와 비교해 초당 720GB 또는 3배 이상 높은 메모리 대역폭 성능을 제공한다.

새로운 반정밀도의 명령은 딥러닝을 위해 21테라플롭스(teraflop) 이상의 성능을 제공한다. 배정밀도 및 단일 정밀도에서는 5에서 10테라플롭스을 제공하는 가속기다.

젠슨 황 엔비디아 CEO 겸 공동창립자는 “암 치료 방법을 찾고, 기후 변화를 이해하며, 차세대 인공지능을 제작하는 등 우리의 과학적이고 기술적인 도전은 거의 무한한 양의 컴퓨팅 성능을 필요로 한다”며, “성능과 효율성 등 모든 수준에서 혁신적으로 발전한 엔비디아의 파스칼 GPU 아키텍처는 혁신가들에게는 새로운 기회를 제공할 것”이라고 말했다.

한편 엔비디아는 GPU 컴퓨팅을 위한 개발 플랫폼인 엔비디아 SDK 업데이트도 함께 발표했다. 이번 업데이트는 ‘엔비디아 CUDA 8’를 포함하는 엔비디아 병렬 컴퓨팅 플랫폼의 최신 버전으로, 개발자가 통합 메모리와 NV링크를 포함하는 새로운 파스칼 기능에 직접 접근할 수 있도록 돕는다. editor@itworld.co.kr
 Tags GPU 엔비디아
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.