2020.10.05

엔비디아 지포스 RTX 3080 파운더스 에디션 리뷰 : “2세대 RTX 기다릴 만했다”

Brad Chacos |
엔비디아의 지포스 RTX 3080 그래픽 카드는 최첨단 기술이 등장하면 2세대를 기다리라고 조언하는 이유를 상징적으로 보여준다.

새로 탑재된 튜링 GPU는 모든 종류의 첨단 기술을 집약하여 게임 산업의 오랜 숙원인 실시간 레이 트레이싱이 가능하도록 설계됐다. 튜링은 레이 트레이싱 작업처리만을 위한 전문 RT 코어를 도입했을 뿐만 아니라, 텐서 코어, 즉 머신러닝 기술로 레이 트레이싱 비주얼의 디노이즈를 돕고 환상적인 딥러닝 슈퍼 샘플링(DLSS) 기술과 같은 AI 강화 툴을 지원하는 전용 하드웨어를 선보였다. 튜링 GPU는 또한 전통적인 쉐이더 코어로까지 확장되어 오버홀 된 처리 파이프라인을 도입해 새로운 다이렉트X 12와 벌칸 그래픽 API를 사용하여 구축된 게임을 처리할 수 있다. 이 모든 것은 기존의 표준에서 크게 벗어난 것이었다.

그러나 새로운 것이 항상 위대한 것을 의미하지는 않는다. RTX 20 시리즈가 실제로 새로운 레이 트레이싱 시대를 열었지만, 레이 트레이싱이나 DLSS를 지원하는 게임은 매우 드물었다. 설상가상으로 RTX 20 시리즈 카드는 기존 게임에서 GTX 10 시리즈와 본질적으로 동일한 성능을 제공했다. RTX 20 시리즈의 시장 진입과 판매 초기는 그다지 화려하지 않았다. 

699달러에 출시된 지포스 RTX 3080과 엔비디아의 새로운 암페어 GPU 아키텍처는 지금까지의 상황을 전부 바꿔버린다. 성능은 정말로 환상적이다. 이전의 699달러짜리 지포스 RTX 2080보다 엄청나게 업그레이드되어 1,200달러짜리 지포스 RTX 2080 Ti 플래그십보다도 훨씬 빠르다. 이전의 지포스 GTX 1080만 사용해봤다면 지포스 RTX 3080에 압도될 것이다. 지포스 rtx 3080은 4K와 초고속 1440p 게임에 아주 훌륭한 그래픽 카드다. 출시될 때 구매할 여력이 있다면 말이다.

지포스 RTX 3080 : 사양, 특징, 그리고 암페어 아키텍처

ⓒ BRAD CHACOS/IDG

지포스 RTX 3080의 새로운 기능에 대해 살펴보기 전에 먼저 파운더스 에디션 카드의 자세한 사양을 알아보자. 지포스 RTX 30 시리즈 대 RTX 20 시리즈 사양을 비교하면 이전 세대에 얼마나 견줄 수 있는지 더 자세히 알 수 있다.

-    CUDA 코어 : 8,704
-    부스트 클럭 : 1.71GHz
-    메모리 : 10GB GDDR6X at 9500MHz
-    메모리 버스 : 320비트
-    메모리 대역폭 : 760GB/s
-    RT 코어 : 68(2세대)
-    텐서 코어 : 384(3세대)
-    NV링크 SLI : 해당 없음
-    PCIe : 4세대
-    HDMI : 2.1
-    HDCP : 2.3
-    디스플레이 커넥터 : 1x HDMI 2.1, 3x 디스플레이 포트 1.4
-    길이 : 11.2 인치
-    폭 : 4.4 인치
-    높이 : 2슬롯
-    최대 GPU 온도 : 93도
-    그래픽 카드 파워 : 320W
-    권장 파워 서플라이 : 750W
-    파워 커넥터 : 2x 8핀 (12핀 어댑터 포함)

이제 잠시 상식과 다른 순서로 기사를 작성하려고 한다. 지포스 RTX 3080 내부의 기술이 어떻게 작동하는지 자세히 알고 싶지 않다면 다음 섹션으로 건너뛰자.
 
ⓒ NVIDIA

지포스 RTX 3080 내부의 고동치는 심장은 엔비디아의 새로운 GA102 ‘암페어’ GPU다. 암페어는 TSMC 14나노에서 더욱 개선되어 GTX 10 시리즈와 RTX 20 시리즈 카드에 사용되는 12나노 노드를 조금 변형한 삼성의 8나노 프로세서 노드로 개발되며, 그래서 엔비디아의 제품 세대를 뛰어넘는 도약이다. 지난 번 노드의 세대가 바뀌었을 때는 지포스 GTX 10시리즈가 직전 모델들을 부숴버렸다. 곧 알게 되겠지만, 이번에도 다르지 않다.
 
ⓒ NVIDIA

튜링이 GPU 디자인을 뒤흔든 반면, 암페어는 튜링의 토대를 이어간다. 튜링의 동시 멀티프로세서(SM), 즉 GPU의 구성 블록은 상당한 오버홀을 받았으며, 전통적으로 쉐이딩 처리를 위해 사용되던 부동 소수점 파이프라인(floating point pipeline, FP32) 옆에 새로운 정수 파이프라인(integer pipeline, INT32)을 추가했다. 새로운 파이프라인은 엔비디아의 GPU가 전통적인 FP 지침과 동시에 정수 지시를 처리할 수 있게 해 튜링 기반 그래픽 카드를 이러한 작업에 크게 의존하는 게임, 즉 최적화가 잘된 벌칸과 다이렉트X 12 게임에서 큰 속도 향상을 가져다주었다. 그러나 RTX 20 시리즈의 그래픽 카드에서 기존 게임 성능은 대체로 정체되었다. FP32가 일반적으로 게임 워크로드에 더 중요한 이유도 있다.

암페어는 튜링을 기반으로 구축되고 각 SM의 CUDA 코어 수를 2배로 늘려 디자인을 축소한다. 새로운 아키텍처는 그러한 중요한 FP32 작업에 전용 데이터 경로를 두는 반면, 두 번째 경로는 INT 전용이 아니라 INT 또는 FP 작업 중 어느 것이든 처리할 수 있다. 그래서 암페어는 기존 게임 렌더링에서 훨씬 강하다.

특히 INT 지침이 두 번째 경로의 총 FP 처리량을 잠식할 가능성이 있어 전체 게임 성능이 CUDA 코어 수에 따라 완벽하게 확장되지는 않는다는 점에 유의해야 한다. 대체적으로는 훌륭하고 합리적인 변경이다. 야수를 지탱하기 위해 엔비디아는 각 SM에서 L1 캐시의 대역폭과 파티션 크기를 두 배로 늘렸고, L1 용량을 33% 더 추가했다.

전문 RT 및 텐서 코어도 각각 RT 코어는 2세대 버전으로, 텐서 코어는 3세대 버전으로 업그레이드되었다. RTX 3080에는 RT 코어가 더 많고 텐서 코어는 적다. 그러나 3세대 텐서 코어는 전 세대보다 성능이 훨씬 뛰어나 개수가 줄었음에도 불구하고 더 높은 성능을 발휘할 수 있다.

RT 코어에는 삼각 위치를 연결하는 기능도 추가되었다. 이것은 특히 동작이 흐릿하고, 레이 트래버설이 8배로 빨라지는 장면에서 도움이 된다. 전체적으로 새로운 RT 코어가 이전보다 1.7배 빨라졌으며 텐서 코어는 2.7배 더 효율적이 되었다고 엔비디아는 말한다. 그렇지만 실제 게임 성능에 완벽하게 확장되지는 않는다. 
 
ⓒ NVIDIA

텐서 코어와 RT 코어에 대한 작업을 동시에 실행할 수 있는 암페어의 새로운 역량에 의해 이러한 장점은 더욱 증대된다. 튜링에서는 레이 트레이싱 작업이 쉐이더 기능과 함께 실행되었지만, GPU는 최종 이미지를 내보내기 전에 레이 트레이싱 작업을 마무리하고 디노이징 및 DLSS를 위해 텐서 코어에 이를 넘겨야 했다. 암페어에서는 쉐이더 코어와 RT 코어가 그 다음 프레임에서 작동하면서 텐서 코어가 DLSS를 실행하여 한 프레임을 상향 조정할 수 있으며, 3가지 프로세스 작업을 모두 동시에 실행한다. 향상된 쉐이더 기능과 페어링되어, 레이 트레이싱과 DLSS가 활성화된 튜링에서 최대 13ms가 소요된 프레임을 암페어에서는 6.7ms에 내보낼 수 있다. 엄청나다. 

요컨대, 암페어 GPU 아키텍처의 향상은 엔비디아의 RTX 기능을 활용하는 게임뿐 아니라 전통적인 게임 모두에서 성능에 큰 향상을 가져온다.

그러나 지포스 RTX 3080의 장점이 단지 암페어 아키텍처에서만 오는 것은 아니다. 이전 GTX 1080과 RTX 2080처럼 엔비디아의 최신 플래그십도 최첨단 메모리를 도입한다. 이번에는 지포스 RTX 3080(그리고 곧 출시될 RTX 3090)이 마이크론의 초고속 GDDR6X 메모리 모듈을 사용한다. 마이크론의 메모리는 기존의 2개에서 사이클당 4개의 가능한 값을 전송할 수 있는 ‘PAM4’ 신호 기술을 선보였다. 이를 통해 GDDR6X는 이전 모델보다 2배 빠른 속도로 데이터를 이동시킬 수 있다. RTX 3080의 10GB GDDR6X 메모리는 320비트 버스를 통해 데이터를 전송하며 총 메모리 대역폭은 760GBps이다. 이에 비해 지포스 RTX 2080 수퍼의 비X GDDR6 8GB는 전체 대역폭 496GBps에 256비트 버스를 사용했다.
 
ⓒ NVIDIA 기존 GDDR6과 RTX 3080에 쓰인 GDDR6x 메모리 비교

엔비디아는 또한 320W 지포스 RTX 3080이 심지어 전 세대의 대표 제품 RTX 2080 Ti보다 눈에 띄게 더 많은 전력을 사용하기 때문에, 메모리가 효율성을 향상하는 방식을 수정했다. 잘 된 일이다. 250mV 전압 스텝과 새로운 ‘최대 전환 회피 코딩(max transition avoidance coding)’을 추가해 칩이 최저치에서 최고치로 정신없이 출렁이지 않고 4신호 PAM4 메모리를 활용할 수 있도록 했으며, 에너지 호(energy arc)를 발생시킬 수 있다. 그래픽 코어 및 메모리 시스템에도 자체 전용 파워 레일을 부여해 GPU가 각각 파워 수준을 별도로 미세 조정해 효율을 높였다. 이전의 칩 디자인은 이 2가지에 공유 파워 레일을 사용했다.
파워에 관해 이야기하고 있으니 지포스 RTX 3080 파운더스 에디션의 디자인으로 넘어가기에 좋은 시점이다.
 

지포스 RTX 3080 파운더스 에디션 디자인

지포스 RTX 3080 파운더스 에디션의 디자인은 엔비디아의 과거제품과는 확연히 다르다. 대부분 암페어의 전력 소비량 증가에서 일어난 변화일 것이다.
 
ⓒ BRAD CHACOS/IDG

튜링의 플래그십인 지포스 RTX 2080 Ti은 260와트에 그쳤다. 지포스 RTX 3080은 320W급이며, 한 단계 위인 RTX 3090은 350W급이다. 암페어처럼 프로세스 노드를 위로 이동하면 동일한 성능을 훨씬 더 효율적으로 제공하거나, 동일한 전력에서 더 많은 성능을 제공하거나, 또는 이 두 극단 사이의 성능을 제공하는 것이 가능하다. 암페어는 튜링보다 더 효율적이다. 엔비디아는 220W 지포스 RTX 3070이 260W RTX 2080 Ti와 동일한 성능을 제공한다고 주장하지만, 엔비디아가 발빠르게 조치를 취한 것이 분명하다.

3080 및 3090 파운더스 에디션 카드 모두에서 파워 부품이 최소 750W여야 한다는 점에 주목해야 한다. RTX 30 시리즈 GPU의 ROG 스트릭스(Strix)를 소개하면서 에이수스는 “파워 소비량이 증가하므로 사용자는 파워 전력 정격을 재평가해야 할 수 있다”고 경고하기도 했다. 수 년 동안 써 온 파워 서플라이는 빠른 부하 변화에 대처할 때 필요한 전압 요건을 갖추지 못했을 수 있다. 괴물급 GPU에는 충분한 전력 공급이 필요하다.

이처럼 강력한 메모리와 짝을 이룬 강력한 GPU는 강력한 냉각도 필요로 한다. PCB 디자인부터 파워 커넥터 설계에서 최근 유행하는 쿨러 설계까지 지포스 RTX 3080에서는 모든 것이 다르다.
 
ⓒ BRAD CHACOS/IDG

이 모든 것이 새로운 쿨러와 관련이 있다. 지포스 RTX 20 시리즈에 앞서 모든 엔비디아 파운더스 에디션과 레퍼런스 카드는 시스템 뒤쪽에서 뜨거운 공기를 뿜어내는 블로워 스타일의 쿨러를 사용했다. 엔비디아는 RTX 20 시리즈를 통해 기존에는 커스텀 보드에서나 볼 수 있었던 이중 축(dual-axial) 팬 디자인으로 옮겨갔다. 지포스 RTX 3080은 그 중간에 선다.
 
ⓒ NVIDIA

엔비디아의 새로운 파운더스 에디션 디자인은 독특한 푸시풀 ‘플로우 스루(flow-through)’ 디자인을 배치했다. 시스템 후면의 팬은 보통의 위치, 즉 카드 하단의 보호판(shroud)에 내장되어 유지된다. 전면 팬은 그래픽 카드의 상단으로 옮겨가는데, 보통 이 위치에서는 후면 플레이트나 PCB가 보였다. 

후면 팬은 카드의 I/O 브래킷에서 뜨거운 공기를 밀어내는 전통적인 블로워 스타일 쿨러와 같은 기능을 한다. 그러나 상단에 장착된 전면 팬은 GPU 하단과 카드 상단에 있는 팬을 통해 공기를 흡입하여 시스템 상단으로 배출한다. 케이스 상단이나 후면에 있는 팬이 공기를 빼낸다. 엔비디아는 이렇게 해서 케이스의 팬 사이에서 커다란 소리를 내는 이중 축 카드로 인해 모든 것이 방해받는 것이 아니라, 시스템의 흡입-배출 공기 흐름을 더욱 일관되게 유지할 수 있다고 설명한다.

실제로, 지포스 RTX 3080 파운더스 에디션은 냉각 부담을 시스템의 나머지 부분에 일부 맡긴다. 이 방식이 CPU와 메모리 성능에 영향을 미치는지 알아보려면 더 많은 테스트를 해야 할 것이다. 케이스에 후면 배출 팬이 장착되어 있는지 확인하라. 모든 케이스에 기본으로 포함되 있지는 않다.
 
ⓒ BRAD CHACOS/IDG

지포스 RTX 3080 파운더스 에디션의 나머지 부분은 크고 통통한 검은색 히트싱크 핀(fin)과 산업적인 면에서 놀라울 정도로 매끈해 보이는 광각 금속 보호판으로 가득하다. 이 카드는 또한 RTX 20시리즈 파운더스 에디션 모델보다 손에 들어보면 상당히 무겁다고 느껴진다. 응축되어 있는 것이다. 그러나 이 새로운 디자인은 매우 잘 작동하여, 야수 같은 암페어 GPU를 확실히 냉각시키는 동시에 최신 세대의 이중 축 디자인보다 소음도 훨씬 적게 발생한다. 그러나 소형 폼팩터 PC에서는 잘 작동하지 않을 수도 있다.
 
ⓒ BRAD CHACOS/IDG

하지만 납땜 색조를 띤 금속 표면은 몇 시간 동안 게임을 로딩한 후에 매우 뜨거워진다. 최신 세대의 파운더스 에디션 디자인처럼 RTX 3080 FE의 고도로 일체화된 디자인 역시 분해하는 것은 악몽처럼 보인다.

엔비디아 PR은 검토자의 주석에서 카드가 “디자인과 조립 모두에서 독특하다”고 지적하고 특별한 ‘엔지니어링 승인’ 지시사항을 게시하면서 “카드를 손상시키지 않고 분해하려면 각별한 주의가 필요하다”고 경고했다. 이 멋진 그래픽 카드를 쉽게 분리할 수 있으리라고 생각하는 것은 금물이다.
 
ⓒ NVIDIA


물론 PCB를 통해 뜨거운 공기를 밀어낼 수는 없다. 엔비디아의 또 다른 차이점으로 지포스 RTX 3080 파운더스 에디션은 레퍼런스 보드가 아닌 커스텀 PCB를 사용한다. 정말 커스텀이다. 앞선 이미지에서 볼 수 있듯이 이 카드는 맨 끝에서 가장 자리가 벗겨진 길고 각진 노치가 있는 아주 작은 PCB를 사용하는데, 괴물 같은 이빨을 가진 팩맨 캐릭터를 연상시키는 외관이다. 비록 수밀 지원(water block support)이 DIY 액체 마니아에게는 보잘것 없는 것이겠지만, 재미있는 새 팬이 히트싱크를 통해 공기를 빨아들일 수 있는 공간을 남겨둔다.



2020.10.05

엔비디아 지포스 RTX 3080 파운더스 에디션 리뷰 : “2세대 RTX 기다릴 만했다”

Brad Chacos |
엔비디아의 지포스 RTX 3080 그래픽 카드는 최첨단 기술이 등장하면 2세대를 기다리라고 조언하는 이유를 상징적으로 보여준다.

새로 탑재된 튜링 GPU는 모든 종류의 첨단 기술을 집약하여 게임 산업의 오랜 숙원인 실시간 레이 트레이싱이 가능하도록 설계됐다. 튜링은 레이 트레이싱 작업처리만을 위한 전문 RT 코어를 도입했을 뿐만 아니라, 텐서 코어, 즉 머신러닝 기술로 레이 트레이싱 비주얼의 디노이즈를 돕고 환상적인 딥러닝 슈퍼 샘플링(DLSS) 기술과 같은 AI 강화 툴을 지원하는 전용 하드웨어를 선보였다. 튜링 GPU는 또한 전통적인 쉐이더 코어로까지 확장되어 오버홀 된 처리 파이프라인을 도입해 새로운 다이렉트X 12와 벌칸 그래픽 API를 사용하여 구축된 게임을 처리할 수 있다. 이 모든 것은 기존의 표준에서 크게 벗어난 것이었다.

그러나 새로운 것이 항상 위대한 것을 의미하지는 않는다. RTX 20 시리즈가 실제로 새로운 레이 트레이싱 시대를 열었지만, 레이 트레이싱이나 DLSS를 지원하는 게임은 매우 드물었다. 설상가상으로 RTX 20 시리즈 카드는 기존 게임에서 GTX 10 시리즈와 본질적으로 동일한 성능을 제공했다. RTX 20 시리즈의 시장 진입과 판매 초기는 그다지 화려하지 않았다. 

699달러에 출시된 지포스 RTX 3080과 엔비디아의 새로운 암페어 GPU 아키텍처는 지금까지의 상황을 전부 바꿔버린다. 성능은 정말로 환상적이다. 이전의 699달러짜리 지포스 RTX 2080보다 엄청나게 업그레이드되어 1,200달러짜리 지포스 RTX 2080 Ti 플래그십보다도 훨씬 빠르다. 이전의 지포스 GTX 1080만 사용해봤다면 지포스 RTX 3080에 압도될 것이다. 지포스 rtx 3080은 4K와 초고속 1440p 게임에 아주 훌륭한 그래픽 카드다. 출시될 때 구매할 여력이 있다면 말이다.

지포스 RTX 3080 : 사양, 특징, 그리고 암페어 아키텍처

ⓒ BRAD CHACOS/IDG

지포스 RTX 3080의 새로운 기능에 대해 살펴보기 전에 먼저 파운더스 에디션 카드의 자세한 사양을 알아보자. 지포스 RTX 30 시리즈 대 RTX 20 시리즈 사양을 비교하면 이전 세대에 얼마나 견줄 수 있는지 더 자세히 알 수 있다.

-    CUDA 코어 : 8,704
-    부스트 클럭 : 1.71GHz
-    메모리 : 10GB GDDR6X at 9500MHz
-    메모리 버스 : 320비트
-    메모리 대역폭 : 760GB/s
-    RT 코어 : 68(2세대)
-    텐서 코어 : 384(3세대)
-    NV링크 SLI : 해당 없음
-    PCIe : 4세대
-    HDMI : 2.1
-    HDCP : 2.3
-    디스플레이 커넥터 : 1x HDMI 2.1, 3x 디스플레이 포트 1.4
-    길이 : 11.2 인치
-    폭 : 4.4 인치
-    높이 : 2슬롯
-    최대 GPU 온도 : 93도
-    그래픽 카드 파워 : 320W
-    권장 파워 서플라이 : 750W
-    파워 커넥터 : 2x 8핀 (12핀 어댑터 포함)

이제 잠시 상식과 다른 순서로 기사를 작성하려고 한다. 지포스 RTX 3080 내부의 기술이 어떻게 작동하는지 자세히 알고 싶지 않다면 다음 섹션으로 건너뛰자.
 
ⓒ NVIDIA

지포스 RTX 3080 내부의 고동치는 심장은 엔비디아의 새로운 GA102 ‘암페어’ GPU다. 암페어는 TSMC 14나노에서 더욱 개선되어 GTX 10 시리즈와 RTX 20 시리즈 카드에 사용되는 12나노 노드를 조금 변형한 삼성의 8나노 프로세서 노드로 개발되며, 그래서 엔비디아의 제품 세대를 뛰어넘는 도약이다. 지난 번 노드의 세대가 바뀌었을 때는 지포스 GTX 10시리즈가 직전 모델들을 부숴버렸다. 곧 알게 되겠지만, 이번에도 다르지 않다.
 
ⓒ NVIDIA

튜링이 GPU 디자인을 뒤흔든 반면, 암페어는 튜링의 토대를 이어간다. 튜링의 동시 멀티프로세서(SM), 즉 GPU의 구성 블록은 상당한 오버홀을 받았으며, 전통적으로 쉐이딩 처리를 위해 사용되던 부동 소수점 파이프라인(floating point pipeline, FP32) 옆에 새로운 정수 파이프라인(integer pipeline, INT32)을 추가했다. 새로운 파이프라인은 엔비디아의 GPU가 전통적인 FP 지침과 동시에 정수 지시를 처리할 수 있게 해 튜링 기반 그래픽 카드를 이러한 작업에 크게 의존하는 게임, 즉 최적화가 잘된 벌칸과 다이렉트X 12 게임에서 큰 속도 향상을 가져다주었다. 그러나 RTX 20 시리즈의 그래픽 카드에서 기존 게임 성능은 대체로 정체되었다. FP32가 일반적으로 게임 워크로드에 더 중요한 이유도 있다.

암페어는 튜링을 기반으로 구축되고 각 SM의 CUDA 코어 수를 2배로 늘려 디자인을 축소한다. 새로운 아키텍처는 그러한 중요한 FP32 작업에 전용 데이터 경로를 두는 반면, 두 번째 경로는 INT 전용이 아니라 INT 또는 FP 작업 중 어느 것이든 처리할 수 있다. 그래서 암페어는 기존 게임 렌더링에서 훨씬 강하다.

특히 INT 지침이 두 번째 경로의 총 FP 처리량을 잠식할 가능성이 있어 전체 게임 성능이 CUDA 코어 수에 따라 완벽하게 확장되지는 않는다는 점에 유의해야 한다. 대체적으로는 훌륭하고 합리적인 변경이다. 야수를 지탱하기 위해 엔비디아는 각 SM에서 L1 캐시의 대역폭과 파티션 크기를 두 배로 늘렸고, L1 용량을 33% 더 추가했다.

전문 RT 및 텐서 코어도 각각 RT 코어는 2세대 버전으로, 텐서 코어는 3세대 버전으로 업그레이드되었다. RTX 3080에는 RT 코어가 더 많고 텐서 코어는 적다. 그러나 3세대 텐서 코어는 전 세대보다 성능이 훨씬 뛰어나 개수가 줄었음에도 불구하고 더 높은 성능을 발휘할 수 있다.

RT 코어에는 삼각 위치를 연결하는 기능도 추가되었다. 이것은 특히 동작이 흐릿하고, 레이 트래버설이 8배로 빨라지는 장면에서 도움이 된다. 전체적으로 새로운 RT 코어가 이전보다 1.7배 빨라졌으며 텐서 코어는 2.7배 더 효율적이 되었다고 엔비디아는 말한다. 그렇지만 실제 게임 성능에 완벽하게 확장되지는 않는다. 
 
ⓒ NVIDIA

텐서 코어와 RT 코어에 대한 작업을 동시에 실행할 수 있는 암페어의 새로운 역량에 의해 이러한 장점은 더욱 증대된다. 튜링에서는 레이 트레이싱 작업이 쉐이더 기능과 함께 실행되었지만, GPU는 최종 이미지를 내보내기 전에 레이 트레이싱 작업을 마무리하고 디노이징 및 DLSS를 위해 텐서 코어에 이를 넘겨야 했다. 암페어에서는 쉐이더 코어와 RT 코어가 그 다음 프레임에서 작동하면서 텐서 코어가 DLSS를 실행하여 한 프레임을 상향 조정할 수 있으며, 3가지 프로세스 작업을 모두 동시에 실행한다. 향상된 쉐이더 기능과 페어링되어, 레이 트레이싱과 DLSS가 활성화된 튜링에서 최대 13ms가 소요된 프레임을 암페어에서는 6.7ms에 내보낼 수 있다. 엄청나다. 

요컨대, 암페어 GPU 아키텍처의 향상은 엔비디아의 RTX 기능을 활용하는 게임뿐 아니라 전통적인 게임 모두에서 성능에 큰 향상을 가져온다.

그러나 지포스 RTX 3080의 장점이 단지 암페어 아키텍처에서만 오는 것은 아니다. 이전 GTX 1080과 RTX 2080처럼 엔비디아의 최신 플래그십도 최첨단 메모리를 도입한다. 이번에는 지포스 RTX 3080(그리고 곧 출시될 RTX 3090)이 마이크론의 초고속 GDDR6X 메모리 모듈을 사용한다. 마이크론의 메모리는 기존의 2개에서 사이클당 4개의 가능한 값을 전송할 수 있는 ‘PAM4’ 신호 기술을 선보였다. 이를 통해 GDDR6X는 이전 모델보다 2배 빠른 속도로 데이터를 이동시킬 수 있다. RTX 3080의 10GB GDDR6X 메모리는 320비트 버스를 통해 데이터를 전송하며 총 메모리 대역폭은 760GBps이다. 이에 비해 지포스 RTX 2080 수퍼의 비X GDDR6 8GB는 전체 대역폭 496GBps에 256비트 버스를 사용했다.
 
ⓒ NVIDIA 기존 GDDR6과 RTX 3080에 쓰인 GDDR6x 메모리 비교

엔비디아는 또한 320W 지포스 RTX 3080이 심지어 전 세대의 대표 제품 RTX 2080 Ti보다 눈에 띄게 더 많은 전력을 사용하기 때문에, 메모리가 효율성을 향상하는 방식을 수정했다. 잘 된 일이다. 250mV 전압 스텝과 새로운 ‘최대 전환 회피 코딩(max transition avoidance coding)’을 추가해 칩이 최저치에서 최고치로 정신없이 출렁이지 않고 4신호 PAM4 메모리를 활용할 수 있도록 했으며, 에너지 호(energy arc)를 발생시킬 수 있다. 그래픽 코어 및 메모리 시스템에도 자체 전용 파워 레일을 부여해 GPU가 각각 파워 수준을 별도로 미세 조정해 효율을 높였다. 이전의 칩 디자인은 이 2가지에 공유 파워 레일을 사용했다.
파워에 관해 이야기하고 있으니 지포스 RTX 3080 파운더스 에디션의 디자인으로 넘어가기에 좋은 시점이다.
 

지포스 RTX 3080 파운더스 에디션 디자인

지포스 RTX 3080 파운더스 에디션의 디자인은 엔비디아의 과거제품과는 확연히 다르다. 대부분 암페어의 전력 소비량 증가에서 일어난 변화일 것이다.
 
ⓒ BRAD CHACOS/IDG

튜링의 플래그십인 지포스 RTX 2080 Ti은 260와트에 그쳤다. 지포스 RTX 3080은 320W급이며, 한 단계 위인 RTX 3090은 350W급이다. 암페어처럼 프로세스 노드를 위로 이동하면 동일한 성능을 훨씬 더 효율적으로 제공하거나, 동일한 전력에서 더 많은 성능을 제공하거나, 또는 이 두 극단 사이의 성능을 제공하는 것이 가능하다. 암페어는 튜링보다 더 효율적이다. 엔비디아는 220W 지포스 RTX 3070이 260W RTX 2080 Ti와 동일한 성능을 제공한다고 주장하지만, 엔비디아가 발빠르게 조치를 취한 것이 분명하다.

3080 및 3090 파운더스 에디션 카드 모두에서 파워 부품이 최소 750W여야 한다는 점에 주목해야 한다. RTX 30 시리즈 GPU의 ROG 스트릭스(Strix)를 소개하면서 에이수스는 “파워 소비량이 증가하므로 사용자는 파워 전력 정격을 재평가해야 할 수 있다”고 경고하기도 했다. 수 년 동안 써 온 파워 서플라이는 빠른 부하 변화에 대처할 때 필요한 전압 요건을 갖추지 못했을 수 있다. 괴물급 GPU에는 충분한 전력 공급이 필요하다.

이처럼 강력한 메모리와 짝을 이룬 강력한 GPU는 강력한 냉각도 필요로 한다. PCB 디자인부터 파워 커넥터 설계에서 최근 유행하는 쿨러 설계까지 지포스 RTX 3080에서는 모든 것이 다르다.
 
ⓒ BRAD CHACOS/IDG

이 모든 것이 새로운 쿨러와 관련이 있다. 지포스 RTX 20 시리즈에 앞서 모든 엔비디아 파운더스 에디션과 레퍼런스 카드는 시스템 뒤쪽에서 뜨거운 공기를 뿜어내는 블로워 스타일의 쿨러를 사용했다. 엔비디아는 RTX 20 시리즈를 통해 기존에는 커스텀 보드에서나 볼 수 있었던 이중 축(dual-axial) 팬 디자인으로 옮겨갔다. 지포스 RTX 3080은 그 중간에 선다.
 
ⓒ NVIDIA

엔비디아의 새로운 파운더스 에디션 디자인은 독특한 푸시풀 ‘플로우 스루(flow-through)’ 디자인을 배치했다. 시스템 후면의 팬은 보통의 위치, 즉 카드 하단의 보호판(shroud)에 내장되어 유지된다. 전면 팬은 그래픽 카드의 상단으로 옮겨가는데, 보통 이 위치에서는 후면 플레이트나 PCB가 보였다. 

후면 팬은 카드의 I/O 브래킷에서 뜨거운 공기를 밀어내는 전통적인 블로워 스타일 쿨러와 같은 기능을 한다. 그러나 상단에 장착된 전면 팬은 GPU 하단과 카드 상단에 있는 팬을 통해 공기를 흡입하여 시스템 상단으로 배출한다. 케이스 상단이나 후면에 있는 팬이 공기를 빼낸다. 엔비디아는 이렇게 해서 케이스의 팬 사이에서 커다란 소리를 내는 이중 축 카드로 인해 모든 것이 방해받는 것이 아니라, 시스템의 흡입-배출 공기 흐름을 더욱 일관되게 유지할 수 있다고 설명한다.

실제로, 지포스 RTX 3080 파운더스 에디션은 냉각 부담을 시스템의 나머지 부분에 일부 맡긴다. 이 방식이 CPU와 메모리 성능에 영향을 미치는지 알아보려면 더 많은 테스트를 해야 할 것이다. 케이스에 후면 배출 팬이 장착되어 있는지 확인하라. 모든 케이스에 기본으로 포함되 있지는 않다.
 
ⓒ BRAD CHACOS/IDG

지포스 RTX 3080 파운더스 에디션의 나머지 부분은 크고 통통한 검은색 히트싱크 핀(fin)과 산업적인 면에서 놀라울 정도로 매끈해 보이는 광각 금속 보호판으로 가득하다. 이 카드는 또한 RTX 20시리즈 파운더스 에디션 모델보다 손에 들어보면 상당히 무겁다고 느껴진다. 응축되어 있는 것이다. 그러나 이 새로운 디자인은 매우 잘 작동하여, 야수 같은 암페어 GPU를 확실히 냉각시키는 동시에 최신 세대의 이중 축 디자인보다 소음도 훨씬 적게 발생한다. 그러나 소형 폼팩터 PC에서는 잘 작동하지 않을 수도 있다.
 
ⓒ BRAD CHACOS/IDG

하지만 납땜 색조를 띤 금속 표면은 몇 시간 동안 게임을 로딩한 후에 매우 뜨거워진다. 최신 세대의 파운더스 에디션 디자인처럼 RTX 3080 FE의 고도로 일체화된 디자인 역시 분해하는 것은 악몽처럼 보인다.

엔비디아 PR은 검토자의 주석에서 카드가 “디자인과 조립 모두에서 독특하다”고 지적하고 특별한 ‘엔지니어링 승인’ 지시사항을 게시하면서 “카드를 손상시키지 않고 분해하려면 각별한 주의가 필요하다”고 경고했다. 이 멋진 그래픽 카드를 쉽게 분리할 수 있으리라고 생각하는 것은 금물이다.
 
ⓒ NVIDIA


물론 PCB를 통해 뜨거운 공기를 밀어낼 수는 없다. 엔비디아의 또 다른 차이점으로 지포스 RTX 3080 파운더스 에디션은 레퍼런스 보드가 아닌 커스텀 PCB를 사용한다. 정말 커스텀이다. 앞선 이미지에서 볼 수 있듯이 이 카드는 맨 끝에서 가장 자리가 벗겨진 길고 각진 노치가 있는 아주 작은 PCB를 사용하는데, 괴물 같은 이빨을 가진 팩맨 캐릭터를 연상시키는 외관이다. 비록 수밀 지원(water block support)이 DIY 액체 마니아에게는 보잘것 없는 것이겠지만, 재미있는 새 팬이 히트싱크를 통해 공기를 빨아들일 수 있는 공간을 남겨둔다.



X