퍼스널 컴퓨팅

“RAM 클럭 높으면 게임도 빨라질까” 실제로 테스트해 보니⋯

Sebastian Schenzinger | PCWorld 2023.08.22
AMD와 인텔의 최신 CPU는 RAM에서 꽤 빠른 클럭 속도로 지원한다. DDR4 RAM은 최대 3200MHz, DDR 5 RAM은 최대 5600MHz다. 더 높은 클럭 속도도 사용할 수 있는데 특수 프로파일을 사용하면 RAM을 정확히 제어할 수 있다. 단, 이처럼 높은 클럭 속도를 얻으려면 BIOS에서 설정을 조절해야 한다. 그렇다면 RAM의 클럭 속도와 지연 시간이 사용자 컴퓨터의 게이밍 성능에 미치는 영향은 얼마나 될까? 이를 확인하기 위해 직접 테스트해 봤다.
 

최대 RAM 클럭 속도 결정 방식

최대 RAM 클럭 속도는 프로세서 제공업체와 마더보드 제조업체 사이에 크게 차이나는 경우가 많다. 장기적이고 안정적인 컴퓨터 사용을 위한 국제반도체표준협의기구(JEDEC)의 RAM 사양이 있다. 단, 이 RAM 사양은 메모리 클럭, 공급 전압 등과 관련된다. CPU 개발자는 최대의 안정성을 위해 이런 지침을 따른다. <표 1>은 AMD와 인텔의 최신 CPU 세대와 각 제조사에서 명시한 RAM 클럭 속도다. 그런데, 시중의 여러 마더보드는 최대 RAM 클럭 속도가 <표 1>보다 상당히 높다. RAM 클럭 속도를 높이려면 인텔 제품에는 소위 XMP(Extreme Memory Profile)을, AMD 제품에는 EXPO(Extended Profiles for Overclocking)를 사용하는 것이 가장 쉽다.
 
<표 1> 주요 RAM 사양

메모리 스틱과 마더보드의 제조업체는 이 프로파일에 더 높은 최대 RAM 클럭 속도를 명시한다. 이런 높은 RAM 클럭 속도를 사용하며 공급 전압이 증가하는 경우가 많다. 설령 제조업체에서 이에 대한 광범위한 테스트를 했더라도 사용자에게 호환성과 안정성이 절대적으로 보장되는 것은 아니다. 즉, PC를 24시간 내내 사용할 계획이라면 이런 프로파일을 활성화하지 않는 것이 좋다. AMD 마더보드에서는 DDR4 모듈의 경우 XMP 대신 DOCP(Direct Over Clock Profile)라는 이름을 쓰기도 한다.

데이터 처리량을 극대화하려면 사용 중인 마더보드가 지원하는 메모리 채널 수를 유심히 봐야 한다. 이는 프로세서, 더 정확히는 메모리 컨트롤러가 동시에 처리 가능한 작업 메모리 블록의 개수를 나타낸다. 대부분 마더보드는 듀얼 채널 아키텍처를 사용한다. 이 경우 하나의 메모리 바가 아닌 2개의 RAM 모듈이 사용되므로 성능이 크게 증가한다. 
 

RAM, 주파수와 지연 시간 설명 

참고로 RAM(Random Access Memory)에 대해서도 알아보자. RAM은 PC의 단기 메모리 같은 것이다. CPU가 프로그램을 실행하기 위해 필요로 하는 모든 데이터와 명령이 RAM에 임시 저장된다. HDD나 SSD 같은 시스템 메모리에서 직접 데이터를 검색하는 것과 비교해 장점은 상당히 짧은 접근 시간과 더 빠른 전송 속도다.  

메모리 바는 여러 개의 메모리 칩으로 구성되어 있고 메모리 칩은 다시 수백만 개의 작은 축전기와 트랜지스터로 구성된다. 각각의 메모리 셀은 1비트에 해당하고 상태 1(충전) 아니면 상태 0(방전)이다. 축전기가 다시 방전되므로 상태는 지속적으로 갱신된다. 트랜지스터는 축전기 상태의 저장 또는 변경을 담당한다. 

메모리 셀은 엑셀 스프레드시트와 같이 열과 행으로 구성된 격자 형태로 배열되어 있다. 따라서, 메모리 컨트롤러가 각 셀을 정확히 접근할 수 있다. 이 부분에서 '랜덤 액세스 메모리'라는 명칭이 유래했다. 하나의 메모리 셀에 접근할 때 다양한 지연 시간이 발생한다. 각각의 지연 시간은 클럭 주기에 지정되므로 메인 메모리의 주파수에 달려 있다. 

먼저, 메모리 컨트롤러는 원하는 행을 활성화한 후에 읽기 명령을 보낸다. 이 지연 시간을 tRCD(Row-to-Column Delay, 행렬 지연)라고 한다. 하나의 행에서 하나의 열에 대한 접근 시간에 해당한다. 그 다음은 실제 접근 시간(CL, CAS Latency)이다. 읽기 명령을 내린 후 원하는 데이터가 도착하기까지의 시간, 다시 말하면 열에 대한 접근 시간을 나타낸다. 읽기 행은 그 후에 비활성화된다. 활성화부터 읽기와 데이터 출력, 그리고 비활성화까지의 전체 주기는 tRAS(Active-to-Precharge Time) 시간, 활성-사전 충전 시간이라고 부른다. 해당 행을 재활성화하기 위해 tRP(Row Precharge Time) 시간, 행 사전 충전 시간이 경과한다. 이는 동일한 행이 다시 접근 가능해기 전까지의 주기 횟수를 나타낸다. 

실제 경과 시간은 메모리 모듈의 주파수를 통해 계산할 수 있다. 주파수가 4000MHz이고 지연 시간이 CL17-17-17-37인 DDR4 RAM 모듈을 예로 들어 보자. 먼저, 유효 클럭 주파수의 역수를 계산한다. 즉, 1을 4000MHz로 나눈 값이다. 이 값에 2를 곱하고(DDR, Double Data Rate, 이중 데이터 전송률이므로 2배) 이전 클럭 주기 수, 즉, CAS 지연시간 17을 곱한다. 그 결과 얻어지는 실제 지연 시간은 0.0085마이크로초, 즉, 8.5나노초다. 반면, tRP 값은 18.5 나노초다. 

2를 곱한 이유는 DDR(이중 데이터 전송률)이라는 명칭에 있다. 여기에서 데이터 비트의 전송은 상승 엣지와 하강 엣지 둘 다에서 발생한다. 즉, 클럭 주기 당 두 번이다. DDR SDRAM의 데이터 처리량은 소위 버스트 모드(burst mode)에 의해 더욱 증가한다. 이를 통해 메모리 컨트롤러는 한 줄에서 연속된 여러 셀을 읽거나 변경할 수 있다. 이로써 첫 번째 단계, 즉, 이후 읽기 명령으로 해당 행을 활성화하는 단계가 없어진다. 또한, DDR4 RAM에는 버스트 접근으로 가져온 데이터가 임시 저장되는 데이터 버퍼(미리 가져오기 요소)가 8개 있다. 

DDR4 메모리 모듈에는 하나의 64비트(여기에 ECC도 고려하면 72비트) 채널이 있다. 반면, DDR5 메모리 모듈에는 2개의 독립적인 32비트(ECC 포함 시 40비트) 채널이 갖춰져 있다. JEDEC도 소위 버스트 길이를 8바이트(BL8)에서 16바이트(BL16)로 2배 늘렸다. 이러한 변화는 데이터 접근 시 효율성 향상 및 지연 시간 단축의 효과를 가져온다. 따라서 듀얼 DIMM 구성에서는 사실상 DDR5가 전통적인 DDR4의 2배 구성이 아닌 32비트 구성의 4배가 된다. 
 

DDR5, XMP나 EXPO는 게임에서 어느 정도의 추가 성능을 제공할까

높은 RAM 클럭 속도가 실제로 장점을 발휘하는 것은 특정 응용 사례에서 뿐이다. 예를 들면, 파일 암호화, 패킹 프로그램을 사용한 압축과 해제, 동영상 편집 등이다. 그 이유는 여기에서 메모리 접근은 순차적이므로 RAM이 버스트 모드와 데이터 미리 가져오기의 도움을 받을 수 있기 때문이다. 그러나, 만일 작은 데이터 패킷의 명령이 단시간 내에 많이 발생한다면 더 높은 RAM 클럭 속도보다 저지연이 더 중요하다. PC 게임에서 중요한 것은 주로 그래픽 카드의 성능인데 이것이 대부분의 경우에 제한 요소이기 때문이다. PC가 프로세서 한계 상태인 경우에만 더 빠른 RAM이 상당한 도움이 될 수 있다. 

유튜버 하드웨어 언박스드(Hardware Unboxed)를 보면 7가지 게임에서 더 빠른 DDR5 RAM이 인텔 코어(Core) i9-13900K, AMD 라이젠(Ryzen) 7 7700X, 라이젠 7 7950X3D 등 3가지 최신 프로세서에 미치는 영향을 살펴본 내용이 올라왔다. 테스트를 위해 2개의 16GB 모듈이 RTX 4090과 함께 사용되었으며, 모든 테스트는 최대한의 CPU 한계에서 테스트하기 위해 1080p에서 수행됐다. 두 AMD 프로세서의 경우, RAM은 최대 6000MHz에서 가동되었다. 라이젠 7000 프로세서에서는 처음으로 RAM에 상당히 더 높은 클럭 속도가 가능한 새로운 AM5 펌웨어 AGESA 1.0.0.7이 테스트 시점에는 아직 이용할 수 없었기 때문이다. 인텔 CPU의 경우에 7200MHz에서의 측정 결과가 나오기도 했다.
 
ⓒ Hardware Unboxed

이 유튜브 동영상을 보면 성능 향상이 게임에 따라 크게 좌우된다는 사실을 알 수 있다. 예를 들어 <와치 독스 리전(Watch Dogs Legion)>에서는 3가지 프로세서 모두 DDR5-4800 CL40에서 DDR5-6000 CL40으로의 변경을 통해 성능이 10~12% 향상됐다. 그 다음 게임인 <호라이즌 제로 던(Horizon Zero Dawn)>에서는 코어 i9-13900K와 라이젠 7 7950X3D에서의 FPS 향상 폭이 거의 측정 허용 범위 내로 떨어졌다. 가장 약한 CPU인 라이젠 7 7700X만이 더 빠른 RAM이 어느 정도 도움이 될 수 있다. 모든 CPU가 더 빠른 RAM으로 성능 향상을 나타낼 수 있는 또 다른 게임은 <쉐도우 오브 더 툼레이더(Shadow of the Tomb Raider)>다. 우리가 직접 경험한 바에 따르면 이 게임은 더 빠른 RAM 또는 더 빠른 CPU를 사용할 때 성능 향상이 잘 된다. 

7가지 게임 전반에 걸쳐 평균적으로, 더 높은 RAM 클럭 속도는 가장 약한 프로세서에 가장 큰 도움이 된다는 것을 알 수 있다. 4800MHz에서 6000MHz로 변경하는 것만으로 FPS가 평균 11% 늘어나며, 지연 시간을 CL40에서 CL30으로 최적화하면 성능이 9~12% 추가로 향상된다. 라이젠 9 7950X3D의 경우에는 가장 빠른 구성과 가장 느린 구성 간의 차이가 7~11%에 불과하다. 첫 번째 이유는 CPU가 GPU 한계에 꽤 자주 부딪히기 때문이다. 두 번째 이유는 라이젠 9 7950X3D 프로세서는 예를 들어 7700X보다 상당히 더 큰 L3 캐시가 있으므로 메인 메모리로의 접근 수가 더 적기 때문이다. 

인텔 코어 i9-13900K는 AMD 라이젠 9 7950X3D와 비슷하다. DR5-4800 CL40에서 DDR5-6000 CL30으로 변경 시 FPS 증가는 평균 8~9%에 불과하다. 7200MHz로 더 빠른 RAM도 CL32에서의 추가 성능 증가는 3%다. 측정은 되지만 실제로 눈에 띄지는 않는 차이다. 
 

DDR4, XMP나 EXPO는 게임에서 어느 정도의 추가 성능을 제공할까

몇 년 전 필자는 DDR4 RAM으로, 특히 지연 시간의 영향을 검증한 바 있다. 그 결과가 <표 2>다. 필자가 테스트한 모든 RAM 속도와 지연 시간이다.
 
<표 2> DDR4 RAM 지연 시간

실제 게임을 보면 <어쌔신 크리드 오디세이(Assassin’s Creed Odyssey)>의 사례는 GPU 한계에 빠르게 부딪히므로 더 빠른 RAM은 약간만 도움이 되는 게임이 있다는 사실을 보여 준다. CL14에서 RAM 클럭 속도 3000MHz의 경우에도 RAM 클럭 속도 3600MHz나 심지어 4000MHz와 측정 허용 범위 내에서 거의 같은 FPS를 두 테스트 CPU 모두에서 측정할 수 있었다. 
 
ⓒ IDG

반면, <F1 2019>는 RAM 클럭 속도만이 아니라 낮은 지연 시간도 중요한 사례다. 특히 인텔 CPU는 최적화된 타이밍이 상당한 도움이 된다. AMD의 경우에는 3800MHz부터 FPS 값 하락이 눈에 띈다. 이 RAM 클럭 속도부터는 RAM(실제 클럭), 메모리 컨트롤러, 그리고 인피니티 패브릭(Infinity Fabric)이 더 이상 1:1:1 비율이 아닌 2:1:1 비율로 작동하며 이로 인해 성능이 급락한다. <쉐도우 오브 더 툼레이더>는 빠른 RAM이 성능을 크게 높이는 것을 보여주는 또다른 사례다.
 
ⓒ IDG
 

코어 i9-12900K와 사용 시 DDR4 메모리와 DDR5 메모리 비교 

DDR4 RAM과 DDR5 RAM 중 택일 문제는 인텔의 12세대 및 13세대 코어 프로세서에서만 의미가 있다. AMD 프로세서는 메모리 컨트롤러가 2가지 메모리 종류를 지원하지 않는다. 필자는 인텔 코어 i9-12900K를 12가지 게임에서 다양한 클럭 속도로 테스트했다. CPU 한계에서 테스트를 진행하는 동안 DDR 4 메모리와 DDR5 메모리의 차이를 알아낼 수 있었으나 그 차이가 크지는 않았다. 반면, 새로운 DDR5 모듈을 사용하면서 기존보다 상당히 좋은 타이밍이 제공된다. 
 
ⓒ Sebastian Schenzinger
 

클럭 속도를 알아내고 BIOS에서 변경하는 방법

윈도우 10 또는 윈도우 11의 최신 버전에서는 현재의 RAM 클럭 속도를 알아내기가 매우 쉽다. 먼저, 작업 관리자를 열고(Ctrl+Shift+Esc) 성능 탭으로 이동한다. 창을 최대화하고 RAM(메모리)을 선택하면 속도를 쉽게 읽어낼 수 있다. 설치된 RAM 모듈의 개수와 사용 가능한 슬롯의 개수도 보인다. 여기에서 RAM이 듀얼 채널에서 작동하고 있는지를 판단할 수 있다. 
 
ⓒ Foundry

XMP나 EXPO를 활성화하는 것은 BIOS에서 빠르게 설정할 수 있다. 맞는 메모리 프로파일을 활성화하기만 하면 된다. 참고로 AMD의 AM4 마더보드의 경우에는 'DOCP라는 용어가 더 일반적이다. 

먼저 PC를 시작한 후 시동 중에 F2 또는 Del 키를 눌러 BIOS에 진입한다. BIOS의 ‘오버클럭 설정’ 아래에 있는 XMP를 활성화한다. 메인 메모리에 여러 개의 프로파일이 있는 경우도 있다. 그런 경우에는 당연히 선택권이 있다. 선택한 내용을 확인한 후 PC를 다시 시작한다. 그 후 작업 관리자에서 설정된 클럭의 존재 여부를 확인할 수 있다. BIOS에서 XMP, EXPO 또는 DOCP를 선택할 수 없다면, 해당 RAM 또는 마더보드가 이 기능을 지원하지 않는 것이다. 
editor@itworld.co.kr
 Tags RAM 클럭 CPU GPU

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2023 International Data Group. All rights reserved.