게임 / 퍼스널 컴퓨팅

벤치마크 | 지포스 RTX 4090, 고품질 콘텐츠 제작에 날개를 달다

Adam Taylor  | PCWorld 2022.11.15
엔비디아의 지포스 RTX 4090이 무려 1,600달러라는 가격표를 달고 출시되자, 인터넷에서는 가격을 두고 갖가지 풍자가 넘쳤다. 보통 PC 부품 가격은 PC 전체 예산을 넘지 않는데, 단일 부품에 1,600달러라는 가격을 지출하는 것은 일반적인 경우가 아니다. 그러나 게이밍 대신 유튜브 채널 관리에 대부분의 시간을 보내는 필자는 3D와 AI 가속화 작업이라는 업무에 필수적인 성능이 향상될 가능성에 매료되지 않을 수 없었다. 

그래서 지포스 RTX 4090의 콘텐츠 제작 성능을 자세히 뜯어보았다. 결론부터 이야기하자면 거의 환상적이다. ‘2배 성능 향상’이라는 말도 안 되는 광고 문구가 대부분의 경우 사실로 드러났다. 그러나 모든 영상 및 콘텐츠 제작 성능이 2배씩 증가한 것은 아니었다.

자세한 벤치마크 결과를 살펴보자.
 

테스트 사양

  • 인텔 코어 i9-12900k CPU (Intel Core i9-12900k CPU)
  • 32GB 커세어 벤전스 DDR5 5200MT/s RAM (32GB Corsair Vengeance DDR5. 5200MT/s RAM)
  • 에이수스 로그 스트릭스 Z690-E 게이밍 와이파이 마더보드(ASUS ROG STRIX. Z690-E Gaming Wifi Motherboard)
  • EVGA G3 850W PSU
  • PCle 4세대 NVMe SSD에 저장된 소스 파일

이번 테스트의 목표는 RTX 4090이 RTX 타이탄(지금까지 주로 작업하던 카드), 그리고 이전 세대 제품인 지포스 RTX 3090과 비교해 어느 정도 업그레이드되었는지 확인하는 것이다. RTX 3090과 RTX 타이탄은 실제로 큰 차이가 없었기 때문에 RTX 4090에서 큰 도약이 있었는지 확신하지는 못했다. 일부 강도 높은 테스트는 다음 사양에서 진행했다. 

 
  • AMD 쓰레드리퍼 프로 3975WX CPU  
  • 256GB 킹스톤 ECC DDR4 RAM  
  • 에이수스 WRX80 세이지 마더보드  
  • 비콰이어트 1400W PSU  
  • PCle 4세대 NVMe SSD에 저장된 소스 파일

결과가 뒤섞이지 않도록 각 GPU를 동일한 구성에 적용해 테스트를 실행했다.
 

영상 제작 부문

ⓒ Adam Taylor
 
ⓒ Adam Taylor

물론 유튜브 콘텐츠를 제작하는 것이 필자의 직업이므로 가장 먼저 테스트한 것이 영상 콘텐츠 제작 시 얻을 수 있는 이점이 있는지였다. 워크스테이션 제작 업체인 푸젯 시스템(Puget Systems)의 푸젯벤치에서 RTX 4090을 장착하자, 어도비 프리미어 프로 성능이 매우 미약하게 오른 것을 확인했다.

그러나 블랙매직 다빈치 리졸브를 사용할 때는 RTX 3090와 RTX 타이탄 모두에 비해 전반적으로 성능이 크게 향상됐다. 리졸브가 프리미어 프로보다 GPU 워크플로에 훨씬 더 최적화되어 있으므로 타당한 결과다. 3D 컴퓨트 온 효과와 인코딩 내장 하드웨어 덕분에 렌더링 속도가 더욱 빨라졌고, 일반적인 재생 및 워크플로도 훨씬 더 빨라지고 응답성이 높아졌다. 
 
ⓒ Adam Taylor
 
ⓒ Adam Taylor
 
ⓒ Adam Taylor
 
ⓒ Adam Taylor
 
ⓒ Adam Taylor

기존의 리졸브 벤치마크 성능도 충분히 인상적이었기 때문에 쓰레드리퍼 프로 워크스테이션으로 2차 테스트를 구축하기로 했다. 8K RAW 소스 영상, 많은 효과, 4K 영상의 수퍼 스케일(리졸브의 내부 스마트 업스케일러) 등으로 8K 영상 렌더링과 내보내기를 수행했다. 간단한 프로젝트가 아니었다. 일반적인 최상위 등급 게이밍 카드를 쓰면 VRAM 양이 적어 프로젝트를 처리할 수 없기 때문에 오류가 발생한다. RTX 3060, 2080, 3080으로는 실행할 수 없는 작업이다. 그러나 괴물 같은 용량인 24VRAM 갖춘 RTX 4090은 테스트보다 8분 더 빠르게 프로젝트를 내보냈다. 무려 8분이나 더 빨랐다. 이 정도의 시간 단축 효과는 1인 워크플로우에 그야말로 작업의 판도를 바꾸는 효과를 낸다.
 
ⓒ Adam Taylor

고해상도 혹은 효과를 많이 쓰는 영상을 편집할 경우, RTX 4090을 쓴다면 시작부터 많은 대기 시간을 줄이고 작업 속도를 높일 것이다. 아직 인코딩 속도에 대해서는 언급하지도 않았다. 
 

영상 인코딩

ⓒ Adam Taylor

새로운 에이다 러브레이스(Ada Lovelace) 아키텍처도 전작인 암페어와 튜링보다 H.264, H.265 인코딩에 이미 상당히 빠른 효과른 내는 듀얼 인코더 칩을 포함한다. 오픈 미디어 연합(Alliance for Open Media)의 새로운 오픈소스 영상 코덱인 AV1도 인코딩한다.
 
ⓒ Adam Taylor

지원되는 소프트웨어가 많지 않아, 아직 인텔과 엔비디아 AV1 인코더 간 품질을 정확하게 비교할 수는 없다. 현재 가능한 기본 테스트에서 엔비디아의 AV1 인코딩은 인텔과 같은 수준이지만, 이후 두 제품이 지원하는 소프트웨어에서 인코더를 미세하게 조정하면 양쪽 그래픽 카드가 기능을 잘 발휘할 수 있다는 점을 알게 됐다.

성능 면에서 AV1은 RTX 4090에서 H.265/HEVC 만큼 빠르게 작동한다. 나쁘지 않다. 그러나 새로운 듀얼 인코더 칩으로는 H.265과 AV1로 8K60 영상, 더 빠른 4K60 영상을 인코딩할 수도 있다. 영상 프레임을 수평으로 반으로 나누고, 그 반을 별도의 칩에 인코딩한 다음 스트림을 완성하기 전에 다시 꿰매는 방식으로 작업이 이루어진다. 인텔의 하이퍼 인코드(Hyper Encode)와 비슷해 보인다. 하이퍼 인코더는 iGPU와 아크 등 dGPU 사이에서 GOP(이미지 혹은 프레임의 집합)를 분리한다. 그러나 이번에 진행한 모든 테스트에서는 하이퍼 인코드가 프로세스를 가속화하기보다는 둔화시킨다는 점만 파악할 수 있었다. (게다가 AV1에서는 작동하지 않았다.)
 

스트리밍

ⓒ Adam Taylor


앞서 언급한 인코더 속도 향상으로, 화면, 카메라, 게임 플레이 스트리밍과 녹화 경험이 모두 훨씬 개선됐다. OBS 스튜디오 내 NVENC 인코더 SDK에 대한 업데이트가 함께 제공되며, 현재 사용자는 가장 빠르고 품질이 낮은 P1에서 가장 느리고 품질이 높은 P7로 나누어지는 7개의 프리셋(X264의 CPU 활용 프리과 유사함)을 제공받는다. 이 영상에서 테스트 시 P6과 P7은 기본적으로 RTX 2000, 3000, 4000 시리즈에서 결과가 동일했고 X264 베리슬로우(X264 VerySlow)와는 품질 면에서 경쟁했다. 

게임 스트리밍을 하는 동안 H.264는 대부분 다른 GPU에서 스파이더맨 리마스터(다른 게임은 더 결과가 좋았을 것이다)를 플레이할 때와 성능 기록이 동일했지만, AV1을 사용한 인코딩은 게임 성능에 전혀 영향을 미치지 않았다. 거의 투명했다. 심지어 최고 품질의 프리셋에서도 녹화를 하고 있다는 사실조차 인식하지 못할 것이다. 심지어 OBS를 8K로 설정하고 스크린샷 캡처 수준을 1440p에서 OBS 내에서 8K로 상향 조정하며, 듀얼 인코더 칩을 사용해 녹화할 공간이 충분했지만, 여전히 큰 차이를 확인하지는 못했다.
 

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.