2017.05.11

엔비디아, 괴물급 볼타 GPU 공개… 5,120개 코어 집적

Brad Chacos | PCWorld
GTX 2017 컨퍼런스의 기조 연설을 시작하며, 엔비디아 CEO 젠슨 황은 “우리는 무어의 법칙 이후의 삶으로 나아갈 길을 찾아야 한다”라고 말했다. 하지만 엔비디아가 길을 찾느라 머뭇거리고 있는 것은 아니다. 이는 엔비디아의 차세대 볼타(Volta) GPU 기반의 첫 제품을 바로 공개한 것으로 알 수 있다.

현재 GPU 시장을 장악하고 있는 것은 엔비디아의 파스칼 프로세서이지만, AMD의 베가 GPU가 6월말 출시되면 왕좌를 위협 받게 된다. 볼타는 베가가 출시되기도 전에 AMD를 힘든 처지로 몰아넣는 데 일조할 것으로 보인다. 더구나 첫 제품인 테슬라 V100 GPU는 데이터센터에 중점을 두고 있지만, 그 파장은 적지 않을 것이로 보인다.



크기나 성능 모두 괴물급인 볼타 GPU는 210억 개의 트랜지스터를 집적했으며, 부스트 클럭 속도 1,455MHz의 CUDA 코어 5,120개를 탑재했다. 또한 엔비디아의 현재 GPU보다 앞선 12나노 공정으로 제조된다. 비교하자면 기존 파스칼 GPU의 주력 제품은 14나노의 테슬라 P100으로, 3,840개의 CUDA 코어와 150억 개의 트랜지스터를 갖추고 있다. 지포스 GTX 1060은 테슬라 V100의 1/4인 1,280개의 CUDA 코어를 탑재했다.

이 모든 것을 담느라 크기도 커졌는데, 테슬라 V100에 탑재된 볼타 GPU의 크기는 무려 815제곱mm로, 테슬라 P100의 600제곱mm보다 1/3 이상 크다.

젠슨 황은 볼타가 “포토리소그라피 기술의 한계점에 있다”며, 30억 달러 이상의 연구개발 예산을 투여했다고 강조했다.



엔비디아는 파스칼보다 효율을 50% 높이기 위해 볼타의 마이크로프로세서 아키텍처를 재설계했다고 밝혔는데, 사실이라면 주목할만한 성과이다. 엔비디아는 재설계를 통해 "동일한 전력으로 FP32와 FP64 성능을 대폭 높였다"고 밝혔다. 엔비디아가 밝힌 테슬라 V100의 부동소수점 연산 성능은 7.5테라플롭(FP64), 15테라플롭(FP32)이다. 테슬라 V100은 또한 딥러닝에 특화된 신형 텐서 코어도 포함되어 있는데, 파스칼 기반의 테슬라 P100보다 12배의 테라플롭 처리량을 제공한다.

테슬라 V100은 16GB의 초고속 고대역 메모리를 사용해 데이터를 신속하게 처리한다. 볼타 기반의 일반 소비자용 그래픽 카드가 HBM2 메모리를 사용할지는 확실하지 않다. 라데온 베가는 HBM2를 사용하지만 아직 관련 기술이 비교적 초기이고 비싸다는 단점이 있다. 지포스 GTX 10 시리즈 그래픽 카드는 신형 GDDR5X 기술을 기반으로 하는데, 최근 SK 하이닉스는 "2018년 초 고객사들이 고성능 GDDR6 DRAM을 탑재한 고급형 그래픽 카드를 출시할 수 있도록 대량 생산할 계획"이라고 밝혔다.



엔비디아는 HBM2 메모리의 대역폭이 900GB/s이며, 테슬라 V100는 2세대 NVLink 기술을 사용한다고 밝혔다. 젠슨 황은 NVLink가 이제 300GB/s의 데이터 전송 속도로 표준 PCIe 연결보다 열 배 빠르다고 강조했다.

엔비디아는 이와 함께 볼타의 데이터센터 및 아키텍처 상세 정보 자료도 공개했다.

물론 볼타 GPU 공개가 당장 일반 소비자에게 영향을 미치지는 않는다. 하지만 이번 발표 내용으로 향후 지포스 그래픽 카드가 어떻게 발전할지를 추측해 볼 수 있다. 엔비디아는 GTC 2016에서 파스칼 GPU를 테슬라 P100을 통해 공개했고, 이는 최종적으로 타이탄 Xp, 지포스 GTX 1080 Ti로 내려왔다.

지포스 GTX 10 시리즈는 파스칼 GPU 공개 후 한 달 만에 출시됐다. 하지만 볼타 기반 지포스 제품도 바로 출시될 것이라고 보기는 어렵다. 특히 SK 하이닉스의 GDDR6 메모리가 정말로 엔비디아 차세대 제품군에 탑재된다면, 좀 더 기다려야 할 것이다.  editor@itworld.co.kr

2017.05.11

엔비디아, 괴물급 볼타 GPU 공개… 5,120개 코어 집적

Brad Chacos | PCWorld
GTX 2017 컨퍼런스의 기조 연설을 시작하며, 엔비디아 CEO 젠슨 황은 “우리는 무어의 법칙 이후의 삶으로 나아갈 길을 찾아야 한다”라고 말했다. 하지만 엔비디아가 길을 찾느라 머뭇거리고 있는 것은 아니다. 이는 엔비디아의 차세대 볼타(Volta) GPU 기반의 첫 제품을 바로 공개한 것으로 알 수 있다.

현재 GPU 시장을 장악하고 있는 것은 엔비디아의 파스칼 프로세서이지만, AMD의 베가 GPU가 6월말 출시되면 왕좌를 위협 받게 된다. 볼타는 베가가 출시되기도 전에 AMD를 힘든 처지로 몰아넣는 데 일조할 것으로 보인다. 더구나 첫 제품인 테슬라 V100 GPU는 데이터센터에 중점을 두고 있지만, 그 파장은 적지 않을 것이로 보인다.



크기나 성능 모두 괴물급인 볼타 GPU는 210억 개의 트랜지스터를 집적했으며, 부스트 클럭 속도 1,455MHz의 CUDA 코어 5,120개를 탑재했다. 또한 엔비디아의 현재 GPU보다 앞선 12나노 공정으로 제조된다. 비교하자면 기존 파스칼 GPU의 주력 제품은 14나노의 테슬라 P100으로, 3,840개의 CUDA 코어와 150억 개의 트랜지스터를 갖추고 있다. 지포스 GTX 1060은 테슬라 V100의 1/4인 1,280개의 CUDA 코어를 탑재했다.

이 모든 것을 담느라 크기도 커졌는데, 테슬라 V100에 탑재된 볼타 GPU의 크기는 무려 815제곱mm로, 테슬라 P100의 600제곱mm보다 1/3 이상 크다.

젠슨 황은 볼타가 “포토리소그라피 기술의 한계점에 있다”며, 30억 달러 이상의 연구개발 예산을 투여했다고 강조했다.



엔비디아는 파스칼보다 효율을 50% 높이기 위해 볼타의 마이크로프로세서 아키텍처를 재설계했다고 밝혔는데, 사실이라면 주목할만한 성과이다. 엔비디아는 재설계를 통해 "동일한 전력으로 FP32와 FP64 성능을 대폭 높였다"고 밝혔다. 엔비디아가 밝힌 테슬라 V100의 부동소수점 연산 성능은 7.5테라플롭(FP64), 15테라플롭(FP32)이다. 테슬라 V100은 또한 딥러닝에 특화된 신형 텐서 코어도 포함되어 있는데, 파스칼 기반의 테슬라 P100보다 12배의 테라플롭 처리량을 제공한다.

테슬라 V100은 16GB의 초고속 고대역 메모리를 사용해 데이터를 신속하게 처리한다. 볼타 기반의 일반 소비자용 그래픽 카드가 HBM2 메모리를 사용할지는 확실하지 않다. 라데온 베가는 HBM2를 사용하지만 아직 관련 기술이 비교적 초기이고 비싸다는 단점이 있다. 지포스 GTX 10 시리즈 그래픽 카드는 신형 GDDR5X 기술을 기반으로 하는데, 최근 SK 하이닉스는 "2018년 초 고객사들이 고성능 GDDR6 DRAM을 탑재한 고급형 그래픽 카드를 출시할 수 있도록 대량 생산할 계획"이라고 밝혔다.



엔비디아는 HBM2 메모리의 대역폭이 900GB/s이며, 테슬라 V100는 2세대 NVLink 기술을 사용한다고 밝혔다. 젠슨 황은 NVLink가 이제 300GB/s의 데이터 전송 속도로 표준 PCIe 연결보다 열 배 빠르다고 강조했다.

엔비디아는 이와 함께 볼타의 데이터센터 및 아키텍처 상세 정보 자료도 공개했다.

물론 볼타 GPU 공개가 당장 일반 소비자에게 영향을 미치지는 않는다. 하지만 이번 발표 내용으로 향후 지포스 그래픽 카드가 어떻게 발전할지를 추측해 볼 수 있다. 엔비디아는 GTC 2016에서 파스칼 GPU를 테슬라 P100을 통해 공개했고, 이는 최종적으로 타이탄 Xp, 지포스 GTX 1080 Ti로 내려왔다.

지포스 GTX 10 시리즈는 파스칼 GPU 공개 후 한 달 만에 출시됐다. 하지만 볼타 기반 지포스 제품도 바로 출시될 것이라고 보기는 어렵다. 특히 SK 하이닉스의 GDDR6 메모리가 정말로 엔비디아 차세대 제품군에 탑재된다면, 좀 더 기다려야 할 것이다.  editor@itworld.co.kr

X