2018.11.09

AMD, 라데온 인스팅트로 데이터센터용 GPU 시장 공략…CUDA 극복이 과제

Andy Patrizio | Network World
AMD의 그래픽 사업은 CPU 사업이 침체를 겪을 때도 나쁘지 않은 성적을 유지했다. AMD의 분기 수익 전부가 GPU 사업에서 나온 적도 한두 번이 아니다.

스팀의 분석에 따르면, AMD와 엔비디아의 점유율은 2대 1 정도이다. 엔비디아는 탄력을 받은 성장세를 잘 유지하고 있다. 엔비디아는 이런 여세를 몰아 AI 시장을 공략하고 있으며, 이제 게임 시장이 2순위가 될 정도에 이르렀다. 엔비디아에 게임은 여전히 중요한 시장이지만, 더 이상 최우선 순위는 아니다.

CPU 사업이 되살아나고 있는 AMD가 이런 엔비디아의 데이터센터 시장 독식에 제동을 걸고 나섰다. 데이터센터와 HPC 및 AI 워크로드를 염두에 둔 신형 GPU를 발표한 것이다.



라데온 인스팅트(Radeon Instinct) MI60과 MI50은 AMD의 현 세대 베가 아키텍처와 TSMC의 7나노 공정을 기반으로 한다. 게임보다는 머신러닝, HPC, 렌더링 애플리케이션 전용 제품이다.

MI60은 32GB의 ECC HBM2 메모리를 탑재하고, AI나 HPC 애플리케이션에 중요한 메모리 대역폭을 최대 1Tbps까지 제공한다. MI50은 메모리 용량이 16GB이다.

신형 그래픽 카드는 PCIe 4.0을 지원해 PCIe 3.0보다 두 배 높은 전송 속도를 제공하며, AMD 인피니티 패브릭을 사용해 GPU와 GPU를 직접 연결할 수 있다. 인피니티 패브릭은 라이젠과 에픽 칩에서 CPU 코어를 연결하는 데 사용하는 기술로, 4개의 GPU를 최대 200GB/s 대역폭을 연결한다. PCI 4.0보다 3배는 빠른 속도이다.

가상화를 기본적으로 지원해 하나의 카드를 여러 가상머신이 안전하게 공유할 수 있는데, 이는 GPU 가속 가상머신을 제공하는 퍼블릭 클라우드 서비스 업체에 중요한 기능이 될 것으로 보인다.

AMD는 MI60이 최대 7.4TFLOPS의 성능으로 가장 빠른 배정도 가속카드가 될 것이라고 주장했다. MI50의 성능은 6.7TFLOPS이다.

신형 GPU와 함께 오픈소스 ROCm 런타임의 새 버전도 발표했다. ROCm은 리눅스 상에서 GPU를 이용한 HPC 워크로를 지원하는 라이브러리 프레임워크이다.

사실 소프트웨어는 AMD에게 가장 불리한 요소이다. 엔비디아는 벌써 10년 이상 HPC와 AI용 소프트웨어를 개발했다. 2007년 스탠포드 연구팀이 GPU의 병렬 처리 특성을 이용하기 위해 CUDA 언어를 개발했고, 엔비디아는 CUDA를 전세계 대학에 퍼뜨리는 일을 멋지게 해냈다.

수천 명의 개발자가 CUDA을 이용하고 있으며, 엔비디아도 개발자 육성에 상당한 노력을 기울였다. CUDA는 현재 GPU 처리 영역에서는 사실 상의 표준이 되었으며, AMD에게는 실질적인 진입 장벽이 아닐 수 없다.

CUDA를 라데온에 이식하지 않고는 AMD에는 힘든 싸움이 될 것이다. 개발자는 보통 여러 언어를 지원하는 것을 좋아하지 않으며, CUDA를 아는 개발자는 이를 고수하려 할 것이다. AMD의 진짜 과제는 개발자들이 CUDA 대신 ROCm을 채택하도록 만드는 일인데, 매우 어려운 일이 될 것이다.  editor@itworld.co.kr


2018.11.09

AMD, 라데온 인스팅트로 데이터센터용 GPU 시장 공략…CUDA 극복이 과제

Andy Patrizio | Network World
AMD의 그래픽 사업은 CPU 사업이 침체를 겪을 때도 나쁘지 않은 성적을 유지했다. AMD의 분기 수익 전부가 GPU 사업에서 나온 적도 한두 번이 아니다.

스팀의 분석에 따르면, AMD와 엔비디아의 점유율은 2대 1 정도이다. 엔비디아는 탄력을 받은 성장세를 잘 유지하고 있다. 엔비디아는 이런 여세를 몰아 AI 시장을 공략하고 있으며, 이제 게임 시장이 2순위가 될 정도에 이르렀다. 엔비디아에 게임은 여전히 중요한 시장이지만, 더 이상 최우선 순위는 아니다.

CPU 사업이 되살아나고 있는 AMD가 이런 엔비디아의 데이터센터 시장 독식에 제동을 걸고 나섰다. 데이터센터와 HPC 및 AI 워크로드를 염두에 둔 신형 GPU를 발표한 것이다.



라데온 인스팅트(Radeon Instinct) MI60과 MI50은 AMD의 현 세대 베가 아키텍처와 TSMC의 7나노 공정을 기반으로 한다. 게임보다는 머신러닝, HPC, 렌더링 애플리케이션 전용 제품이다.

MI60은 32GB의 ECC HBM2 메모리를 탑재하고, AI나 HPC 애플리케이션에 중요한 메모리 대역폭을 최대 1Tbps까지 제공한다. MI50은 메모리 용량이 16GB이다.

신형 그래픽 카드는 PCIe 4.0을 지원해 PCIe 3.0보다 두 배 높은 전송 속도를 제공하며, AMD 인피니티 패브릭을 사용해 GPU와 GPU를 직접 연결할 수 있다. 인피니티 패브릭은 라이젠과 에픽 칩에서 CPU 코어를 연결하는 데 사용하는 기술로, 4개의 GPU를 최대 200GB/s 대역폭을 연결한다. PCI 4.0보다 3배는 빠른 속도이다.

가상화를 기본적으로 지원해 하나의 카드를 여러 가상머신이 안전하게 공유할 수 있는데, 이는 GPU 가속 가상머신을 제공하는 퍼블릭 클라우드 서비스 업체에 중요한 기능이 될 것으로 보인다.

AMD는 MI60이 최대 7.4TFLOPS의 성능으로 가장 빠른 배정도 가속카드가 될 것이라고 주장했다. MI50의 성능은 6.7TFLOPS이다.

신형 GPU와 함께 오픈소스 ROCm 런타임의 새 버전도 발표했다. ROCm은 리눅스 상에서 GPU를 이용한 HPC 워크로를 지원하는 라이브러리 프레임워크이다.

사실 소프트웨어는 AMD에게 가장 불리한 요소이다. 엔비디아는 벌써 10년 이상 HPC와 AI용 소프트웨어를 개발했다. 2007년 스탠포드 연구팀이 GPU의 병렬 처리 특성을 이용하기 위해 CUDA 언어를 개발했고, 엔비디아는 CUDA를 전세계 대학에 퍼뜨리는 일을 멋지게 해냈다.

수천 명의 개발자가 CUDA을 이용하고 있으며, 엔비디아도 개발자 육성에 상당한 노력을 기울였다. CUDA는 현재 GPU 처리 영역에서는 사실 상의 표준이 되었으며, AMD에게는 실질적인 진입 장벽이 아닐 수 없다.

CUDA를 라데온에 이식하지 않고는 AMD에는 힘든 싸움이 될 것이다. 개발자는 보통 여러 언어를 지원하는 것을 좋아하지 않으며, CUDA를 아는 개발자는 이를 고수하려 할 것이다. AMD의 진짜 과제는 개발자들이 CUDA 대신 ROCm을 채택하도록 만드는 일인데, 매우 어려운 일이 될 것이다.  editor@itworld.co.kr


X