2017.01.09

“모습 드러낸 라데온 베가” AMD의 최신 그래픽 카드에 관해 알아야 할 5가지

Brad Chacos | PCWorld
 “베가(Vega)를 기다리라.” 

AMD의 RX 400 시리즈를 능가하는 엔비디아의 지포스 GTX 1070과 GTX 1080가 나온 후 지난 6개월간 AMD가 라데온 지지자들에게 한 말이다.

엔비디아의 강력한 새로운 16nm 파스칼(Pascal) GPU 아키텍처는 저렴한 120달러짜리 GTX 1050부터 강력한 1,200달러짜리 GTX 타이탄(Titan) X까지 광범위하게 적용된 반면에 AMD의 14nm 폴라리스(Polaris) 그래픽은 주력 비디오 카드를 위해 개발되었고ㅡ 플래그십 라데온 RX 480은 엔비디아의 고급 제품에 상대가 되지 않는다. 그래서 “베가를 기다리라”가 황홀한 게임플레이에 목마른 AMD지지자들에게 강령이 되었다. 베가는 2017년 초 예정된 AMD 로드맵에서 유출된 새로운 매니아용 14nm 라데온 그래픽 아키텍처의 코드명이다.

안타깝게도 2017년 전반기까지 새로운 아키텍처가 출고될 계획이 없기 때문에 기다림은 계속될 것이다. 하지만 CES에서 베가는 단순한 코드명 이상이었다. AMD가 드디어 엔비디아의 타이탄에 대항할 라데온의 성능 지향적 제품에 대하여 새 GPU가 그래픽 성능에 끼치는 영향과 혁신적인 메모리 아키텍처 등에 관한 기술 정보를 공개했다.



좀 더 자세히 알아보기에 앞서 베가의 기술적 아키텍처에 대한 수준 높은 개요를 살펴보기로 하자.

1. 빠르다.
정말이다.

12월 기자와 분석가들을 상대로 진행한 프리뷰에서 AMD는 초기 라데온 베가 10 그래픽 카드로 둠(Doom)을 4K 해상도에서 울트라(Ultra)라로 시연했다. 둠이 멋있긴 하지만 그래픽 카드에는 지옥과도 같다. 심지어 GTX 1080도 이런 설정으로 초당 평균 60 프레임을 기록하지 못했다고 테크스팟(Techspot)이 밝혔다. 한편, 라데온 베가는 60~70fps를 기록했다. 불론 다이렉트X(DirectX) 11 대신에 둠에서 라데온 카드에 유리한 그래픽 API인 불칸(Vulkan)을 실행했다. 어쨌든 시연은 인상적이었다.

최근 베가의 속도를 확인하는 목격담이 있었다. 세상에 AMD의 라이젠(Ryzen) CPU를 공개한 뉴호라이즌(New Horizon) 라이브스트림에서 라이젠과 베가를 장착한 PC로 구동하는 스타워즈: 배틀프론트(Star Wars: Battlefront)를 선보였다. 해당 시연은 모든 것을 울트라로 설정한 상태에서 4K 모니터의 60Hz 속도로 진행했다. 한편, 테크스팟의 테스트 결과 GTX 1080은 50fps 남짓을 기록한 것으로 나타났다.


한편, 12월 초 AoS(Ashes of the Singularity) 데이터베이스에서 유출되었다가 삭제된 자료에 따르면 장치 ID가 “687F:C1”인 GPU가 벤치마크 결과에서 상당수의 GTX 1080 제품들을 능가한 것으로 나타났다. 여기에 힌트가 있다. 최근 둠을 이용한 AMD의 베가 프리뷰에서 프레임률에 표시된 장치 ID가 실제로 687F:C1였다.

이를 통해 많은 것을 알 수 있다. 베가 10은 아직 최종적인 형태가 아니며 AMD가 공개한 그래픽 카드가 베가의 최종 형태인지는 알 수 없고 벤치마크에 활용한 3종의 게임은 모두 라데온에 유리하다 등을 알 수 있다.

하지만 베가는 분명 그래픽 성능 측면에서 경쟁력이 있는 것으로 보이며 그 이유 중 하나는 AMD가 베가를 단순히 더 열심히 작동할 뿐 아니라 더욱 스마트하게 작동하도록 설계했기 때문이기도 한다. "적절한 시점에 적절한 데이터를 이동하고 적절하게 처리하는 것"이 해당 팀의 주된 목표였다고 그래픽 및 병렬 연산 아키텍처에 집중하는 AMD의 기업 연구원 마이크 맨토(Mike Mantor)가 말했다. 그리고 이는 베가의 급진적인 메모리 디자인을 통한 더욱 긴밀한 그래픽 처리 덕분이다.

2. 중요한 것은 메모리
온보드 메모리의 경우 베가는 전작들과 마찬가지로 혁신적이다.

AMD의 최신 고급 그래픽 카드인 라데온 퓨리(Radeon Fury) 시리즈는 최신 고대역폭 메모리를 실현했다. 베가는 그 뒤를 이어 AMD가 공개한 "고대역폭 캐시 컨트롤러"로 강화한 차세대 HBM2를 탑재했다.

기술적인 한계로 인해 HBM 1세대는 4GB 용량으로 제한되었고 이로 인해 퓨리 시리즈의 온보드 RAM은 4GB로 제한되었다. 다행이도 HBM의 순 속도 때문에 대부분의 게임에서 이 결함이 나타나지 않았지만 이제 HBM2는 이런 족쇄에서 벗어났다. AMD가 베가의 용량을 공식적으로 확인한 것은 아니지만 둠 시연 중 화면을 통해 특정 그래픽 카드에 8GB RAM이 탑재되었음이 드러났다. 그리고 이런 고속 RAM은 더욱 빨라지고 있으며 AMD의 조 마크리는 HBM2가 HBM1보다 핀당 2배의 대역폭을 제공한다고 밝혔다.


베가의 고대역폭 캐시와 캐시 컨트롤러는 메모리의 한계를 극복한다.

하지만 HBM은 시작에 불과했다. "시간이 지나면서 취하여 강화하고 개선할 수 있는 혁신적인 기술이다"고 HBM 개발에 참여한 마크리가 말했다. 베가는 새로운 고대역폭 캐시와 고대역폭 캐시 컨트롤러를 라데온 책임자 라자 코두리가 말하는 "세계에서 가장 확장성이 뛰어난 GPU 메모리 아키텍처"를 완성함으로써 HBM을 개선했다.

AMD는 순수한 그래픽 성능이 급속도로 향상되지만 메모리 용량과 능력이 상대적으로 정체된 시점에 메모리 설계를 발전시키기 위해 베가의 고대역폭 메모리 아키텍처를 개발했다. HB 캐시는 해당 그래픽 카드의 전통적인 프레임 버퍼(Frame Buffer)를 대체하지만, HB 캐시 컨트롤러는 데이터를 미묘하게 제어할 수 있으며 512 ‘테라바이트’의 가상 주소 공간을 지원한다. 베가의 HBM 디자인은 그래픽 메모리를 온보드 RAM을 넘어 한 번에 여러 개의 메모리 소스를 관리할 수 있는 좀 더 이질적인 메모리 시스템으로 확장할 수 있다.



이를 통해 고용량 NAND 메모리를 그래픽 프로세서에 직접 접목한 새로운 라데온 인스팅트(Radeon Instinct) 제품군 또는 최신 라데온 프로(Pro) SSG 카드 등의 전문가용 제품에 가장 큰 영향을 끼칠 가능성이 높다. “우리는 이를 통해 GPU에 테라바이트 단위의 메모리를 연결할 수 있다"고 AMD의 IA(Industry Alliances) 책임자 데이비드 워터스가 라데온 프로 SSG가 공개되었을 때 밝혔으며, HBM의 빠른 속도를 위해 개발된 이 새로운 캐시와 컨트롤러 아키텍처로 이런 능력이 더욱 향상될 것이다.

잠재적인 이점을 실현하기 위해 AMD는 마크리의 거실을 사진으로 재현하여 공개했다. 이 600GB 용량의 사진을 렌더링(Rendering)하려면 통상 몇 시간이 소요되지만 베가의 성능과 새로운 HBM2 아키텍처를 합쳐 수 분 만에 완성했다. 심지어 AMD는 기자들이 방 안에서 카메라를 실시간으로 움직여 볼 수 있도록 허용했다. 단, 약간의 지연은 발생했다. 정말 놀라운 시연이었다.



코두리는 고대역폭 캐시 컨트롤러의 미세 동적 데이터 관리가 게임에도 유리할 수 있다고 강조하면서 위처 3(Witcher 3)와 폴아웃 4(Fallout 4)를 언급했다. 두 게임 모두 실제로 4K 해상도로 실행할 때 게임이 할당한 메모리의 절반도 사용하지 못한다. 고성능 게임의 메모리 요건이 증가하고 있으며 해상도도 마찬가지이다. 본 기사의 뒷부분에서 HBM의 순 속도와 HB 캐시의 미세한 제어 능력에 기타 개선사항을 더해 논의할 수 있기를 바란다.

또한 AMD는 미래 세대의 게임이 고대역폭 메모리 디자인을 활용하여 지금의 좀 더 직접적인 접근방식 대신에 대용량 데이터를 그래픽 프로세서에 직접 업로드할 수 있을 것이라고 밝혔다.


2017.01.09

“모습 드러낸 라데온 베가” AMD의 최신 그래픽 카드에 관해 알아야 할 5가지

Brad Chacos | PCWorld
 “베가(Vega)를 기다리라.” 

AMD의 RX 400 시리즈를 능가하는 엔비디아의 지포스 GTX 1070과 GTX 1080가 나온 후 지난 6개월간 AMD가 라데온 지지자들에게 한 말이다.

엔비디아의 강력한 새로운 16nm 파스칼(Pascal) GPU 아키텍처는 저렴한 120달러짜리 GTX 1050부터 강력한 1,200달러짜리 GTX 타이탄(Titan) X까지 광범위하게 적용된 반면에 AMD의 14nm 폴라리스(Polaris) 그래픽은 주력 비디오 카드를 위해 개발되었고ㅡ 플래그십 라데온 RX 480은 엔비디아의 고급 제품에 상대가 되지 않는다. 그래서 “베가를 기다리라”가 황홀한 게임플레이에 목마른 AMD지지자들에게 강령이 되었다. 베가는 2017년 초 예정된 AMD 로드맵에서 유출된 새로운 매니아용 14nm 라데온 그래픽 아키텍처의 코드명이다.

안타깝게도 2017년 전반기까지 새로운 아키텍처가 출고될 계획이 없기 때문에 기다림은 계속될 것이다. 하지만 CES에서 베가는 단순한 코드명 이상이었다. AMD가 드디어 엔비디아의 타이탄에 대항할 라데온의 성능 지향적 제품에 대하여 새 GPU가 그래픽 성능에 끼치는 영향과 혁신적인 메모리 아키텍처 등에 관한 기술 정보를 공개했다.



좀 더 자세히 알아보기에 앞서 베가의 기술적 아키텍처에 대한 수준 높은 개요를 살펴보기로 하자.

1. 빠르다.
정말이다.

12월 기자와 분석가들을 상대로 진행한 프리뷰에서 AMD는 초기 라데온 베가 10 그래픽 카드로 둠(Doom)을 4K 해상도에서 울트라(Ultra)라로 시연했다. 둠이 멋있긴 하지만 그래픽 카드에는 지옥과도 같다. 심지어 GTX 1080도 이런 설정으로 초당 평균 60 프레임을 기록하지 못했다고 테크스팟(Techspot)이 밝혔다. 한편, 라데온 베가는 60~70fps를 기록했다. 불론 다이렉트X(DirectX) 11 대신에 둠에서 라데온 카드에 유리한 그래픽 API인 불칸(Vulkan)을 실행했다. 어쨌든 시연은 인상적이었다.

최근 베가의 속도를 확인하는 목격담이 있었다. 세상에 AMD의 라이젠(Ryzen) CPU를 공개한 뉴호라이즌(New Horizon) 라이브스트림에서 라이젠과 베가를 장착한 PC로 구동하는 스타워즈: 배틀프론트(Star Wars: Battlefront)를 선보였다. 해당 시연은 모든 것을 울트라로 설정한 상태에서 4K 모니터의 60Hz 속도로 진행했다. 한편, 테크스팟의 테스트 결과 GTX 1080은 50fps 남짓을 기록한 것으로 나타났다.


한편, 12월 초 AoS(Ashes of the Singularity) 데이터베이스에서 유출되었다가 삭제된 자료에 따르면 장치 ID가 “687F:C1”인 GPU가 벤치마크 결과에서 상당수의 GTX 1080 제품들을 능가한 것으로 나타났다. 여기에 힌트가 있다. 최근 둠을 이용한 AMD의 베가 프리뷰에서 프레임률에 표시된 장치 ID가 실제로 687F:C1였다.

이를 통해 많은 것을 알 수 있다. 베가 10은 아직 최종적인 형태가 아니며 AMD가 공개한 그래픽 카드가 베가의 최종 형태인지는 알 수 없고 벤치마크에 활용한 3종의 게임은 모두 라데온에 유리하다 등을 알 수 있다.

하지만 베가는 분명 그래픽 성능 측면에서 경쟁력이 있는 것으로 보이며 그 이유 중 하나는 AMD가 베가를 단순히 더 열심히 작동할 뿐 아니라 더욱 스마트하게 작동하도록 설계했기 때문이기도 한다. "적절한 시점에 적절한 데이터를 이동하고 적절하게 처리하는 것"이 해당 팀의 주된 목표였다고 그래픽 및 병렬 연산 아키텍처에 집중하는 AMD의 기업 연구원 마이크 맨토(Mike Mantor)가 말했다. 그리고 이는 베가의 급진적인 메모리 디자인을 통한 더욱 긴밀한 그래픽 처리 덕분이다.

2. 중요한 것은 메모리
온보드 메모리의 경우 베가는 전작들과 마찬가지로 혁신적이다.

AMD의 최신 고급 그래픽 카드인 라데온 퓨리(Radeon Fury) 시리즈는 최신 고대역폭 메모리를 실현했다. 베가는 그 뒤를 이어 AMD가 공개한 "고대역폭 캐시 컨트롤러"로 강화한 차세대 HBM2를 탑재했다.

기술적인 한계로 인해 HBM 1세대는 4GB 용량으로 제한되었고 이로 인해 퓨리 시리즈의 온보드 RAM은 4GB로 제한되었다. 다행이도 HBM의 순 속도 때문에 대부분의 게임에서 이 결함이 나타나지 않았지만 이제 HBM2는 이런 족쇄에서 벗어났다. AMD가 베가의 용량을 공식적으로 확인한 것은 아니지만 둠 시연 중 화면을 통해 특정 그래픽 카드에 8GB RAM이 탑재되었음이 드러났다. 그리고 이런 고속 RAM은 더욱 빨라지고 있으며 AMD의 조 마크리는 HBM2가 HBM1보다 핀당 2배의 대역폭을 제공한다고 밝혔다.


베가의 고대역폭 캐시와 캐시 컨트롤러는 메모리의 한계를 극복한다.

하지만 HBM은 시작에 불과했다. "시간이 지나면서 취하여 강화하고 개선할 수 있는 혁신적인 기술이다"고 HBM 개발에 참여한 마크리가 말했다. 베가는 새로운 고대역폭 캐시와 고대역폭 캐시 컨트롤러를 라데온 책임자 라자 코두리가 말하는 "세계에서 가장 확장성이 뛰어난 GPU 메모리 아키텍처"를 완성함으로써 HBM을 개선했다.

AMD는 순수한 그래픽 성능이 급속도로 향상되지만 메모리 용량과 능력이 상대적으로 정체된 시점에 메모리 설계를 발전시키기 위해 베가의 고대역폭 메모리 아키텍처를 개발했다. HB 캐시는 해당 그래픽 카드의 전통적인 프레임 버퍼(Frame Buffer)를 대체하지만, HB 캐시 컨트롤러는 데이터를 미묘하게 제어할 수 있으며 512 ‘테라바이트’의 가상 주소 공간을 지원한다. 베가의 HBM 디자인은 그래픽 메모리를 온보드 RAM을 넘어 한 번에 여러 개의 메모리 소스를 관리할 수 있는 좀 더 이질적인 메모리 시스템으로 확장할 수 있다.



이를 통해 고용량 NAND 메모리를 그래픽 프로세서에 직접 접목한 새로운 라데온 인스팅트(Radeon Instinct) 제품군 또는 최신 라데온 프로(Pro) SSG 카드 등의 전문가용 제품에 가장 큰 영향을 끼칠 가능성이 높다. “우리는 이를 통해 GPU에 테라바이트 단위의 메모리를 연결할 수 있다"고 AMD의 IA(Industry Alliances) 책임자 데이비드 워터스가 라데온 프로 SSG가 공개되었을 때 밝혔으며, HBM의 빠른 속도를 위해 개발된 이 새로운 캐시와 컨트롤러 아키텍처로 이런 능력이 더욱 향상될 것이다.

잠재적인 이점을 실현하기 위해 AMD는 마크리의 거실을 사진으로 재현하여 공개했다. 이 600GB 용량의 사진을 렌더링(Rendering)하려면 통상 몇 시간이 소요되지만 베가의 성능과 새로운 HBM2 아키텍처를 합쳐 수 분 만에 완성했다. 심지어 AMD는 기자들이 방 안에서 카메라를 실시간으로 움직여 볼 수 있도록 허용했다. 단, 약간의 지연은 발생했다. 정말 놀라운 시연이었다.



코두리는 고대역폭 캐시 컨트롤러의 미세 동적 데이터 관리가 게임에도 유리할 수 있다고 강조하면서 위처 3(Witcher 3)와 폴아웃 4(Fallout 4)를 언급했다. 두 게임 모두 실제로 4K 해상도로 실행할 때 게임이 할당한 메모리의 절반도 사용하지 못한다. 고성능 게임의 메모리 요건이 증가하고 있으며 해상도도 마찬가지이다. 본 기사의 뒷부분에서 HBM의 순 속도와 HB 캐시의 미세한 제어 능력에 기타 개선사항을 더해 논의할 수 있기를 바란다.

또한 AMD는 미래 세대의 게임이 고대역폭 메모리 디자인을 활용하여 지금의 좀 더 직접적인 접근방식 대신에 대용량 데이터를 그래픽 프로세서에 직접 업로드할 수 있을 것이라고 밝혔다.


X