2018.03.30

엔비디아, 2페타플롭 집적한 DGX-2 발표…칩부터 SW까지 대폭 강화

Andy Patrizio | Network World
자사의 GTC(GPU Technology Conference) 에서 엔비디아는 신형 DGX-2 시스템을 공개했다. 단일 서버로 2페타플롭 성능을 제공하는 최초의 서버라 주장하는 이 제품은 크기를 대폭 줄인 것이 특징이다.



DGX-2는 1세대 제품 출시 이후 7개월 만에 나오는 업그레이드 버전으로 올해 3분기 이후에 정식 출시된다. 하지만 엔비디아는 GPU 수를 두 배나 집적하고 더 많은 그래픽 메모리, 더 빠른 메모리와 GPU 상호 연결을 통해 연산 성능을 10배 높였다고 강조했다.

DGX-2는 우선 엔비디아의 HPC 및 AI 기반 카드 제품군 중 최상위 제품인 테슬라 V100 CPU를 사용하며, 내장 메모리는 32GB로 두 배 늘렸다. 엔비디아는 DGX-2가 한 대의 물리 서버로 2페타플롭의 성능을 제공하는 최초의 서버라는 점을 강조한다. 2페타플롭의 성능은 보통은 수백 대의 서버를 네트워크로 클러스터를 구성해야 구현할 수 있기 때문이다.

엔비디아는 DGX-2급 성능을 인텔 스카이레이크 제온 기반 서버로 구현하려면, 300개의 CPU와 15대의 서버 랙으로 구성된 200만 달러짜리 시스템이 필요하다고 설명했다. DGX-2의 시작 가격은 39만 9,000달러로, 가격은 60배 더 저렴하고 전력 소비도 18배 더 낮다는 것이 엔비디아의 주장이다.

물론 HPC는 이런 식으로 동작하지 않는다. 1/4의 공간에 같은 성능을 제공한다면, HPC 센터는 4배의 성능을 얻기 위해 새 장비로 공간을 가득 채울 것이다. HPC는 에너지 효율은 상관하지 않고 성능에만 집중하며, AI도 그런 성향이 강하다. 더 적은 공간에 더 많은 성능이란 단지 같은 공간에 더 많은 성능을 의미할 뿐이다.

엔비디아 DGX-2의 진짜 비법은 새로운 상호 연결 기술일 것이다. PCIe의 더딘 개발 속도에 질린 엔비디아는 2016년 자체 상호연결 기술인 NV링크(NVLink)를 개발했다. 하지만 당시에는 8개의 GPU를 연결하는 것이 한계였다. 더 많은 GPU를 연결하려면 인피니밴드를 거쳐야 하고, NV링크보다 느리기 때문에 지연을 유발했다.

엔비디아는 NV스위치(NVSwitch) 칩을 새로 개발했다. DGX-2 내에서 최대 16개의 GPU를 연결하는 NV스위치는 시장에 나와 있는 최상급 PCIe 스위치보다 5배 많은 대역폭을 제공한다는 것이 엔비디아의 설명이다. 스위치 하나가 18개의 전대역 포트로 900Gb/s의 양방향 대역폭을 통합한다.

IBM은 이미 NV링크를 자사의 파워9 RISC 기반 서버에 사용하는데, NV스위치 역시 라이선스할 가능성이 크다. PCIe SIG의 새 기술을 기다리다 지친 관련 업계가 어떤 기술을 내놓는지 지켜보는 것도 흥미로운 일이 될 것이다.

이처럼 HPC와 AI 업계는 테슬라 GPU로 결집하고 있다. 이번 행사에서만도 크레이, HPE, IBM, 슈퍼마이크로, 타이안 등이 모두 올해 2분기에 신형 테슬라 V199 32GB 시스템을 출시할 것이라고 발표했다. 오라클 클라우드 인프라도 올해 하반기에 테슬라 V100 32GB를 자사 클라우드에서 제공할 계획이라고 밝혔다.

엔비디아가 하드웨어 칩만 발표한 것은 아니다. 엔비디아는 구글 텐서플로우 프레임워크와 통합된 자사의 텐서RT(TensorRT) 추론 소프트웨어의 새 버전도 발표했는데, CPU와 비교해 최대 190배 더 빠른 딥러닝 추론 성능을 제공한다고 주장했다.

마지막으로 엔비디아는 ARM과의 협력관계를 발표했는데, 엔비디아의 딥러닝 가속 프레임워크를 ARM의 머신러닝 플랫폼과 결합한다. 목표는 IoT 애플리케이션을 개발하는 ARM 라이선스 업체들이 AI를 설계부터 통합하고 스마트 디바이스에 AI와 머신러닝을 폭넓게 활용할 수 있도록 하는 것이다.  editor@itworld.co.kr


2018.03.30

엔비디아, 2페타플롭 집적한 DGX-2 발표…칩부터 SW까지 대폭 강화

Andy Patrizio | Network World
자사의 GTC(GPU Technology Conference) 에서 엔비디아는 신형 DGX-2 시스템을 공개했다. 단일 서버로 2페타플롭 성능을 제공하는 최초의 서버라 주장하는 이 제품은 크기를 대폭 줄인 것이 특징이다.



DGX-2는 1세대 제품 출시 이후 7개월 만에 나오는 업그레이드 버전으로 올해 3분기 이후에 정식 출시된다. 하지만 엔비디아는 GPU 수를 두 배나 집적하고 더 많은 그래픽 메모리, 더 빠른 메모리와 GPU 상호 연결을 통해 연산 성능을 10배 높였다고 강조했다.

DGX-2는 우선 엔비디아의 HPC 및 AI 기반 카드 제품군 중 최상위 제품인 테슬라 V100 CPU를 사용하며, 내장 메모리는 32GB로 두 배 늘렸다. 엔비디아는 DGX-2가 한 대의 물리 서버로 2페타플롭의 성능을 제공하는 최초의 서버라는 점을 강조한다. 2페타플롭의 성능은 보통은 수백 대의 서버를 네트워크로 클러스터를 구성해야 구현할 수 있기 때문이다.

엔비디아는 DGX-2급 성능을 인텔 스카이레이크 제온 기반 서버로 구현하려면, 300개의 CPU와 15대의 서버 랙으로 구성된 200만 달러짜리 시스템이 필요하다고 설명했다. DGX-2의 시작 가격은 39만 9,000달러로, 가격은 60배 더 저렴하고 전력 소비도 18배 더 낮다는 것이 엔비디아의 주장이다.

물론 HPC는 이런 식으로 동작하지 않는다. 1/4의 공간에 같은 성능을 제공한다면, HPC 센터는 4배의 성능을 얻기 위해 새 장비로 공간을 가득 채울 것이다. HPC는 에너지 효율은 상관하지 않고 성능에만 집중하며, AI도 그런 성향이 강하다. 더 적은 공간에 더 많은 성능이란 단지 같은 공간에 더 많은 성능을 의미할 뿐이다.

엔비디아 DGX-2의 진짜 비법은 새로운 상호 연결 기술일 것이다. PCIe의 더딘 개발 속도에 질린 엔비디아는 2016년 자체 상호연결 기술인 NV링크(NVLink)를 개발했다. 하지만 당시에는 8개의 GPU를 연결하는 것이 한계였다. 더 많은 GPU를 연결하려면 인피니밴드를 거쳐야 하고, NV링크보다 느리기 때문에 지연을 유발했다.

엔비디아는 NV스위치(NVSwitch) 칩을 새로 개발했다. DGX-2 내에서 최대 16개의 GPU를 연결하는 NV스위치는 시장에 나와 있는 최상급 PCIe 스위치보다 5배 많은 대역폭을 제공한다는 것이 엔비디아의 설명이다. 스위치 하나가 18개의 전대역 포트로 900Gb/s의 양방향 대역폭을 통합한다.

IBM은 이미 NV링크를 자사의 파워9 RISC 기반 서버에 사용하는데, NV스위치 역시 라이선스할 가능성이 크다. PCIe SIG의 새 기술을 기다리다 지친 관련 업계가 어떤 기술을 내놓는지 지켜보는 것도 흥미로운 일이 될 것이다.

이처럼 HPC와 AI 업계는 테슬라 GPU로 결집하고 있다. 이번 행사에서만도 크레이, HPE, IBM, 슈퍼마이크로, 타이안 등이 모두 올해 2분기에 신형 테슬라 V199 32GB 시스템을 출시할 것이라고 발표했다. 오라클 클라우드 인프라도 올해 하반기에 테슬라 V100 32GB를 자사 클라우드에서 제공할 계획이라고 밝혔다.

엔비디아가 하드웨어 칩만 발표한 것은 아니다. 엔비디아는 구글 텐서플로우 프레임워크와 통합된 자사의 텐서RT(TensorRT) 추론 소프트웨어의 새 버전도 발표했는데, CPU와 비교해 최대 190배 더 빠른 딥러닝 추론 성능을 제공한다고 주장했다.

마지막으로 엔비디아는 ARM과의 협력관계를 발표했는데, 엔비디아의 딥러닝 가속 프레임워크를 ARM의 머신러닝 플랫폼과 결합한다. 목표는 IoT 애플리케이션을 개발하는 ARM 라이선스 업체들이 AI를 설계부터 통합하고 스마트 디바이스에 AI와 머신러닝을 폭넓게 활용할 수 있도록 하는 것이다.  editor@itworld.co.kr


X