게임 / 디지털 디바이스

엔비디아 지포스 RTX 4060 Ti 8GB 리뷰ㅣ400달러짜리 치고는 실망스럽다

Brad Chacos | PCWorld 2023.05.26
ⓒITWorld

엔디비아의 399달러(한화 약 53만 원)짜리 ‘지포스 RTX 4060 Ti(8GB)’는 언뜻 보면 대성공작이다. 이전 모델인 2020년형 399달러짜리 지포스 RTX 3060 Ti는 강력한 RTX 30 시리즈 중에서도 최고의 GPU였다. 합리적인 가격에 흠잡을 데 없는 1,080p와 놀라운 1,440p 성능을 했기 때문이다. 새로운 RTX 4060 Ti는 동일한 가격이면서도 DLSS 3, 리플렉스(Reflex), RTX 비디오 수퍼 레졸루션(Video Super Resolution), 동급 최고의 레이 트레이싱, AV1 인코딩, 놀라운 전력 효율성 등 엔비디아의 최신 킬러 RTX 40 시리즈 기능도 함께 제공한다. 

하지만 껍질을 하나씩 벗기면 그렇지 않다.
 
ⓒBrad Chacos/IDG

엔비디아는 코어 수를 줄이고, 메모리 하부 시스템을 변경하는 기술적인 결정을 내렸다. 그 결과, 지포스 RTX 4060 Ti는 1,080p 해상도에서는 뛰어난 성능을 발휘하지만 1,440p 게임에서는 그다지 매력적이지 않다. 아울러 4060 Ti는 순수 성능 측면에서도 평범한 세대 업그레이드에 불과하다. 엔비디아가 인정한 바와 같이, 이 카드에 8GB 메모리를 장착하기로 한 결과 1,080p에서도 모든 게임을 최대 옵션으로 실행할 수 없게 됐다. 물론 DLSS 3에 AI-생성 프레임이 추가된 것은 환영할 만한 일이지만, 이미지 업샘플링 기술은 픽셀 밀도가 낮은 1,080p 해상도에서 눈에 띄는 시각적 결함을 발생시킨다. 따라서 DLSS의 성능 향상이 이 상황에서 그리 중요하지 않게 된다.

그렇다면 결론은 다음과 같다. 과연 2023년에 8GB 메모리가 탑재된 1,080p 그래픽 카드를 400달러나 내고 살 의향이 있는가?
 

엔비디아 지포스 RTX 4060 Ti의 사양과 가격

엔비디아는 지포스 RTX 4060 Ti 8GB를 발표하면서 세부 정보를 공개했으나 더 심도 있는 기술 정보는 제공하지 않았다. RTX 3060 Ti와 비교한 내용은 다음과 같다(299달러짜리 RTX 4060과 499달러짜리 RTX 4060 Ti 16GB도 공개했으며, 7월에 출시 예정이다).
 
정정: 3060 Ti의 L2 캐시는 4KB가 아니라 4MB다. ⓒBrad Chacos/IDG

몇 가지 세부 사항이 눈에 띈다. 첫째, 엔비디아의 새로운 ‘에이다 러브레이스(Ada Lovelace)’ GPU 아키텍처를 기반으로 구축된 RTX 4060 Ti는 전력 효율성이 뛰어나며, 이전보다 GPU 및 메모리 클럭 속도가 훨씬 더 빨라졌다. 찬사를 받아 마땅하다.

둘째, 이 새로운 카드는 전작인 RTX 3060 Ti에 비해 쿠다, 텐서 및 RT 코어 수가 훨씬 줄어들었다. 이 때문에 RTX 4060 Ti는 일부 상황에서 이전 제품보다 실제로 느릴 수 있으며, 전반적으로 성능 향상은 보통 수준에 불과하다. 최상의 시나리오에서는 RTX 3060 Ti보다 약 15~20% 더 빠르지만, 사실상 세대 간 성능 차가 거의 없는 게임과 해상도가 더 많다. 물론 초저전력 소비를 고려할 때, 이 GPU의 코어 수가 훨씬 더 적다는 점까지 감안하면 속도 업그레이드가 있다는 사실만으로도 러브레이스의 우수성이 입증된다. 하지만 세대 업그레이드로는 여전히 미미한 수준이다. 
 
ⓒBrad Chacos/IDG

셋째, 엔비디아는 지포스 RTX 4060 Ti의 메모리 하부 시스템을 AMD의 라데온 인피니티 캐시(Radeon Infinity Cache) 구성과 비슷하게 조정해 대용량 L2 칩 내 캐시를 추가하는 한편, 메모리 버스 폭은 128비트까지 줄였다(3060 Ti에는 256비트 버스가 있다). 또한 최신 게임이 1,080p 해상도에서도 그 이상의 용량을 소모하는 시대에 엔비디아는 메모리 용량을 전작과 동일한 8GB GDDR6로 유지했다. VRAM 용량은 충분하거나 부족할 수 있다.

이 메모리 구성으로 인해 지포스 RTX 4060 Ti는 장기적으로 그리고 현재 많은 상황에서 높음/최고(High/Ultra) 1,440p 게이밍 옵션이 될 수 없다. 그 이유는 RTX 4060 Ti가 최초 공개됐을 때의 분석 기사에서 다음과 같이 설명했다.
 

RTX 3060 Ti에서는 256비트였던 메모리 버스 폭이 4060 Ti에서는 128비트로 줄어들었다. 교통 체증 상황으로 비유해 보자. 메모리 요청이 자동차라면 버스 폭은 도로의 크기다. 100대의 자동차는 1차선 비포장도로보다 4차선 고속도로에서 훨씬 빠르게 달릴 수 있다. 그 주행 속도는 카드의 전체 메모리 대역폭과 유사하다. 겉으로 보기에 지포스 RTX 4060 Ti는 초당 288GB의 전체 메모리 대역폭을 제공하는 반면, 3060 Ti는 초당 448GB로 차이가 크다/큰 차이가 있다. 하지만 그렇게 간단하지 않다.”

대용량 칩 내 L2 캐시 없이 기존 GPU 메모리가 어떻게 작동하는지 보여주는 예시 ⓒNvidia
비교 이미지는 엔비디아의 RTX 40 시리즈 GPU의 대용량 칩 내 L2 캐시가 기존 메모리 호출을 훨씬 더 적게 만드는 데 어떻게 도움이 되는지 보여준다. ⓒNvidia

“엔비디아는 RTX 40시리즈 제품에서 AMD의 인피니티 캐시 기술을 모방해 GPU 자체에 대형 칩 내 캐시를 탑재했으며, RTX 4060 제품군도 다르지 않다. 물리적으로 가까울수록 캐시가 더 빨라질 뿐만 아니라, 이 캐시를 배치하면 GPU 주변에 배열된 메모리 칩에 많은 요청을 보낼 필요도 줄어든다. AMD의 인피니티 캐시가 L3 캐시를 사용하는 반면, 엔비디아는 32MB L2 캐시를 선택했다. 엔비디아는 더 커진 L2 캐시가 특히 레이 트레이싱과 DLSS 성능 개선에 도움이 되며, 기술 사양에 표시된 ‘효과적인’ 메모리 대역폭을 제공한다고 밝혔다.” 

“하지만 문제는 32MB의 인피니티 캐시와 128비트 버스의 지난 세대 라데온 RX 6600 XT의 리뷰에서 증명된 바와 같이, 대형 칩 내 캐시와 제한된 버스 폭을 함께 사용하면 GPU가 목표로 하는 디스플레이 해상도에서는 성능과 전력 모두에서 탁월한 성능을 발휘하지만, 일반적으로 더 높은 해상도에서는 예상보다 낮은 결과를 초래한다는 것이다. 해상도가 높을수록 메모리가 더 많이 필요하기 때문에 칩 내 캐시 히트 횟수가 줄어든다. 그렇게 되면 메모리 요청은 기존 메모리로 전달되고, RTX 4060 Ti의 훨씬 작은 128비트 버스가 불안정해질 수 있다.”


RTX 4060 Ti를 테스트한 결과, 실제로 더 높은 1,440p 해상도에서 속도가 느려진다는 사실을 확인할 수 있었다. 사실 1,440p에서는 2020년 500달러로 판매됐던 RTX 3070과도 경쟁이 안 된다. 새로운 카드라면 무려 2.5년 전 100달러 더 비쌌던 구형 GPU에 적어도 필적할 것이라 예상하겠지만 RTX 4060 Ti는 그 낮은 기준을 넘지 못했다.

엔비디아는 러브레이스의 전력 효율성과 엔비디아의 지포스 기능으로 4060 Ti의 장점을 강화하고 있는 듯하다. 이를테면 DLSS 3, RTX 비디오 수퍼 레졸루션, 엔비디아 브로드캐스트(Nvidia Broadcast), 최첨단 AV1 인코딩, 동급 최고의 레이 트레이싱, 엔비디아 리플렉스 등이 제공되며, 모두 훌륭하다.
 
ⓒBrad Chacos/IDG

현재 테스트 중인 엔비디아 지포스 RTX 4060 Ti 파운더스 에디션(Founders Edition)은 2-슬롯으로 구성돼 있으며, 엔비디아의 자체 디자인이 적용됐다. 상위 모델에 비해 은색이 많으며, 하나의 HDMI 슬롯과 3개의 디스플레이포트(DP)가 제공된다. 한 가지 아쉬운 점은, 여전히 12VHPWR 케이블이 장착돼 있어서 제품에 동봉된 짧은 어댑터를 사용해야 한다는 것이다. 측면이 창문으로 된 케이스를 사용할 경우, 어색하고 아주 못생겨 보인다. 팬 날개 역시 이전 FE 모델보다 훨씬 덜 촘촘하게 배치돼 있다. 계속 살펴봐야겠지만 현재는 냉각 성능에 영향을 미치진 않았다. 
 
ⓒBrad Chacos/IDG
 

엔비디아 지포스 RTX 4060 Ti 1,080p 게이밍 성능

엔비디아가 RTX 4060 Ti를 ‘1,080p 성능 챔피언’이라고 평가하고 있으니, 그 부분부터 시작하자. 이 그래픽 카드는 뛰어난 1,080p 그래픽 성능을 제공한다. 심지어 요즘 200달러 안팎에 구할 수 있는 지난 세대 라데온 RX 6600도 마찬가지다. 라데온 RX 6700 XT의 결과도 포함시켰다. 이 AMD GPU는 12GB의 VRAM과 256비트 버스를 갖춰 RTX 4060 Ti의 메모리 구성에서 우려되는 점을 피해 간다. 요즘에는 대략 350달러에 구매할 수 있다.
 
ⓒBrad Chacos/IDG

새로운 RTX 4060 Ti는 전작인 RTX 3060 Ti를 앞서긴 하지만, 그 차이는 대부분 게임에서 근소하거나 무시할 만하다. 차트 끝에 표시된 평균 FPS가 그 증거다. 예외가 하나 있다면 지구상에서 가장 많이 플레이되는 게임인 <카운터스트라이크: 글로벌 오펜시브(Counter-Strike: Global Offensive)(CSGO)>다. 지포스 RTX 40시리즈 GPU는 메모리 버스 폭이 훨씬 더 좁아졌기 때문에 CSGO에서 이전 세대를 이기지 못했다. 평균 결과에서 CSGO와 그 초고속 프레임 속도를 제외하면 RTX 4060 Ti는 평균 130fps인 반면 RTX 360 Ti는 119로, 9% 차이에 불과하다.
 

엔비디아 지포스 RTX 4060 Ti 1,440p 게이밍 성능

1,440p 해상도에서도 테스트해 봤다. 하는 김에 이전 세대의 500달러짜리 RTX 3070과 새로운 599달러짜리 RTX 4070도 추가했다. 이번에도 모두 꽤 괜찮은 결과를 보여줬으며, 새로운 RTX 4060 Ti의 성능은 전작과 불편할 정도로 근접했다. CSGO의 높은 프레임 속도와 더 느린 RTX 40 시리즈 성능을 고려하면, 3060 Ti가 실제로 평균 프레임 속도에서 앞선다. 놀랍다! 하지만 약간 오해의 소지가 있다. 1,440p에서는 RTX 3060 Ti가 RTX 4060 Ti보다 훨씬 빨라서 전반적인 그림이 왜곡되기 때문이다. CSGO를 제외하면 RTX 4060 Ti가 RTX 3060 Ti보다 약 7% 더 빠르다. 여전히 놀랍다!
 
ⓒBrad Chacos/IDG

RTX 3070의 성능을 고려하면 그 놀라움은 더욱 커진다. CSGO를 포함하면 RTX 3070은 RTX 4060 Ti를 무려 평균 13.7% 앞서고, CSGO를 제외하면 5% 앞선다. 2.5년 전에 겨우 100달러 더 비쌌던 카드를 이기지 못한다는 것은 엔비디아의 새 GPU에는 심하게 당혹스러운 일이며, RTX 4060 Ti의 새로운 기술 구성이 1,440p 게이밍 성능에 적합하지 않은 이유를 잘 보여준다.

말 나온 김에, 라데온 RX 6700 XT를 두 해상도에서 살펴봤다. 평균적으로 RTX 3060 Ti와 비슷한 성능을 보였다. RTX 3060 Ti는 12GB의 메모리와 더 넓은 256비트 버스가 탑재돼 있으며, 가격은 350달러다. 최신 게임을 즐기기에는 8GB의 VRAM이 부족하다고 생각되거나, 1,440p 게임을 해보고 싶고 DLSS 및 기타 엔비디아 기능은 포기해도 상관없다면 고려할 만하다. 특히 엔비디아의 새로운 GPU보다 50달러 저렴하기까지 하다. VRAM 용량은 충분하거나 부족할 수 있다.
 

엔비디아 지포스 RTX 4060 Ti 레이 트레이싱, DLSS, DLSS 3 성능

RTX 4060 Ti는 게임 성능에 있어서는 평범한 세대 업그레이드다. 이 GPU의 전력 효율성, 레이 트레이싱, 그리고 엔비디아가 이 카드를 발표할 때 공개했던 성능 지표를 감안할 때, 엔비디아는 AI로 강화된 DLSS 성능 개선을 강조하는 것 같다. 다행스럽게도 엄선된 테스트용 게임 중에 레이 트레이싱과 이미지 업스케일링(엔비디아 DLSS/AMD FSR) 옵션이 포함된 게임이 많았다. 게임을 기본 해상도에서, RT를 최고 설정으로 한 상태로 기본 해상도에서, 그리고 RT를 최고 설정과 DLSS/FSR 균형 설정으로 한 상태로 각각 테스트하여 평가했다.
 
하지만! 이 그래픽 카드의 1,080p 해상도에서는 DLSS/FSR 이미지 업스케일링이 형편없어 보인다는 개인적인 의견을 밝힌다. 이미지 업스케일링은 더 낮은 해상도에서 내부적으로 프레임을 렌더링한 다음, AI 및 소프트웨어 트릭을 사용해 최종 이미지를 선택한 해상도와 일치하도록 업스케일링하는 방식이다. 이미지 업스케일링을 사용하면 적어도 픽셀 수가 많은 1,440p 및 4K 해상도에서는 이미지 품질 손실을 최소화하거나 전혀 없이 더 빠른 성능을 얻을 수 있다. 

1,080p에서는 이미지 업스케일링 활성화가 간단하지 않다. 낮은 해상도에서는 이미지 업스케일링 기술이 활용하는 픽셀 수가 훨씬 줄어들기 때문에, 화면에 나타나는 비주얼이 흐릿하고 들쭉날쭉해 보일 수 있다. 더 높은 품질의 DLSS/FSR 사전 설정을 사용해도 마찬가지다. DLSS 균형 설정을 켠 상태에서 1,080p 해상도로 게임을 렌더링하는 데 사용되는 내부 이미지는 720p 미만이다.  

개인적으로는 업스케일링을 염두에 두고 1,080p 그래픽 카드를 사지 않을 것이다. 안타깝게도 더 낮은 업스케일 이미지 충실도로 인해 1,080p에서 레이 트레이싱을 실행하기도 더 어렵다. 레이 트레이싱이 제공하는 향상된 비주얼이 사라지기 때문이다. 유감스럽지만 제아무리 조명이 좋아도 들쭉날쭉하고 흐린 모델과 함께 사용하면 그다지 멋져 보이지 않는다. 단, 대안이 없다면 그럭저럭 괜찮다.

하지만 이미지 업스케일링은 RTX 40 시리즈가 제공하는 DLSS 가치 제안의 일부일 뿐이다. 이 세대의 또 다른 특징은 DLSS 3 프레임 생성 기능이다. 이 기능은 엔비디아의 러브레이스 GPU 내의 텐서 코어와 개선된 광학 흐름 가속기를 활용해 기존에 렌더링된 모든 프레임 사이 사이마다 완전히 AI로 생성된 프레임을 삽입한다. 

이것은 RTX 4060 Ti를 돋보이게 할 인상적인 기능이다. DLSS 3을 실행하기 위해 DLSS 2 이미지 업샘플링을 활성화하고 이미지 충실도를 다운그레이드할 필요 없이 프레임 생성 기능을 켜기만 하면 특히 마이크로소프트 플라이트 시뮬레이터(Microsoft Flight Simulator) 같이 CPU를 많이 쓰는 게임에서 프레임 속도가 급증하는 것을 볼 수 있다. 환상적이다.

하지만 AI 프레임을 삽입하면 일부 게임, 특히 UI 요소 주변에서 시각적 문제가 발생할 수 있다. 또 AI가 프레임을 생성하는 동안 실제로 입력을 제어할 수 없기 때문에 지연 시간이 추가된다. DLSS 3에서는 개발자가 이런 문제를 해결하기 위해 엔비디아 리플렉스를 통합해야 하는데, 이는 게임의 반응성을 네이티브 렌더링할 때보다 약간 더 향상시키는 데 도움이 되지만, 프레임 속도를 높일 때 일반적으로 기대하는 만큼의 반응성 개선을 가져오지는 못한다. 즉, 프레임 생성을 켜면 게임이 50% 이상 빠르게 실행되지만 반응 속도는 10~20% 정도만 빨라진다. 게임의 느낌이 사용자의 두뇌와 손이 기대하는 것과 일치하지 않을 수 있다. 
 
ⓒBrad Chacos/IDG

1,440p 해상도와 1,080p 해상도에서 레이 트레이싱과 DLSS를 모두 테스트했다. 하지만 시간이 부족하다는 점과 1,080p 게이밍용으로만 RTX 4060 Ti를 고려해야 한다는 점을 감안해 1,080p 결과만 위에 공개한다. 수치에서 알 수 있듯이 RTX 4060 Ti는 레이 트레이싱 부문에서 엔비디아의 선두 위치를 유지시켜 준다. 단, 기능상으로는 3060 Ti가 이미 몇 년 전에 같은 가격으로 가능했던 수준을 넘어서진 않는다. 최고 설정으로 테스트했지만 일부 그래픽 설정을 높음 또는 중간으로 낮춘다면 레이 트레이싱을 활성화하고 DLSS를 끈 상태에서도 1,080p에서 60fps에 가까운 성능을 얻을 수 있었다. DLSS 3을 사용할 수 있다면 게임의 판도를 바꿀 기능이지만, 현재는 약 50개의 게임에서만 쓸 수 있다는 점에 유의하라.
 

RTX 4060 Ti의 전력 효율과 발열

탁월하다! 전력 소비를 테스트하기 위해 다른 모든 벤치마킹을 마친 후(GPU 예열 목적), 4K에서 F1 22 벤치마크를 약 20분간 반복하고, 전체 테스트 시스템의 전력 소비를 측정하는 왓츠 업 프로(Watts Up Pro) 미터의 최고 기록을 살펴봤다. 모든 자동차가 동시에 나타나는 부분이 전력 수요가 가장 높은 부분이다. 이는 최악의 상황을 상정한 테스트가 아니라 그래픽 카드가 힘들게 일하고 있을 때의 성능을 측정하기 위해 GPU로 제한되는 해상도에서 실행되는 게임이다. CPU에도 부하가 심한 게임을 할 경우 전체적인 시스템 전력 소비가 높아질 수 있음을 경고해 둔다.

지포스 RTX 4060 Ti는 빠른 프레임 속도를 제공하면서도 확실히 전력 소비가 적다. RTX 3060 Ti보다 성능이 7~9% 빠르지만 전력 소비도 83와트 더 적다. 그리고 대기 전력은 완전히 미친 수준이다. 
 
ⓒBrad Chacos/IDG
 

지포스 RTX 4060 Ti를 구매할 만한 가치가 있을까?

엔비디아는 지포스 RTX 4060 Ti를 ‘1,080p 성능 챔피언’이라고 홍보하는데, 기술 분석 및 벤치마크와 정확히 일치한다. 하지만 메모리와 GPU 구성으로 인해 이 GPU는 1,440p에서 성능을 발휘할 수 없다(그래픽 설정을 변경해도 상관없다면 1,440p에서 게임을 할 수는 있다). 그 상황은 8GB의 내장 메모리로 더욱 악화된다.

최근 <하드웨어 언박스드(Hardware Unboxed)>에서 다룬 바와 같이, 이제 개발자가 엑스박스 시리즈 X와 플레이스테이션 5의 16GB 공유 메모리 풀을 활용하는 상황에서 8GB 메모리는 모든 최신 게임을 최대로 실행하기에 충분하지 않다. 엔비디아의 자체 RTX 4060 Ti 성능 테스트에서 1,080p에서도 <플레이그 테일: 레퀴엠(A Plague Tale: Requiem)>과 <레지던트 이블 리메이크(Resident Evil Remake)>의 그래픽 설정을 낮춰야 했으며, <라스트 오브 어스(The Last of Us)>와 <호그와츠 레거시(Hogwarts Legacy)> 같은 최신 게임 역시 설정을 낮추지 않는 이상 저해상도에서 8GB로 플레이하는 데 어려움을 겪었다.

프레임 생성 기술은 매우 멋지지만, 1,080p에서 사용할 수 있는 픽셀 수가 제한돼 있기 때문에 엔비디아가 자랑하는 DLSS 업샘플링은 1,080p에서 매력이 많이 사라진다(AMD의 경쟁 기술인 FSR도 마찬가지다). 특정 DLSS 3프레임 생성 기능을 제외하고는, DLSS 또는 FSR를 활성화한 상태로 1,080p 게임을 실행하지 않을 것이다. DLSS 3은 시작은 좋았지만 현재 약 50개의 게임에서만 사용할 수 있다. RTX 4060 Ti는 순수 GPU 성능 측면에서도 세대 간 업그레이드가 크게 이뤄지지 않았으며, 1,080p 해상도에서는 RTX 3060 Ti보다 9%, 1,440p에서는 7% 앞서는 것에 그친다. 전작에 비해 쿠다, RT, 텐서 코어 수가 적다는 점도 실망스럽다. 1,440p에서는 RTX 3070에게 완패한다는 점도 더욱 실망스럽다.

게다가 엔비디아가 예고한 대로 DLSS 3, AV1, 그리고 극한의 전력 효율성을 갖춘 299달러짜리 RTX 4060이 오는 7월 출시될 예정이다. 아울러 AMD가 조만간 300달러짜리 라데온 RX 7600을 출시할 수 있다는 소문이 터져 나오고 있다. 8GB에서 1,080p 게임을 즐기기에 훨씬 더 적합한 가격대다. 엔비디아의 고급 기능이 필요 없다면 더할 나위 없이 좋다. 

가령 지포스 RTX 4060 Ti가 399달러에 16GB 메모리를 제공하거나, 8GB 메모리를 제공하되 동일한 수준의 성능을 300달러 내지 325달러에 제공했더라면 매력적이었을 것이다. 하지만 현재로서는 엔비디아의 RTX 4- 시리즈 업그레이드는 잘해도 시시한 수준에 머물러 있으며, 이 GPU는 애석하게도 어중간한 위치에 속한다. 다른 제품을 알아보는 것이 좋겠다.
editor@itworld.co.kr
 

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.