2020.09.07

"로딩 시간 없애라" MS와 엔비디아의 게임 체인저 전략

Brad Chacos | PCWorld
차세대 게임 콘솔의 눈부시게 빠른 스토리지 기술이 PC에도 도입될 전망이다. 엔비디아의 최신 지포스 RTX 30 시리즈 그래픽 카드에 내장된 RTX IO 기술이 로딩 시간 단축을 뒷받침한다. 최근 마이크로소프트도 스토리지의 작동 방식 정보를 조금 더 공개했다.

그렇다. 마이크로소프트는 그래픽 카드에서 SSD 기술이 작용하는 방식을 설명하고 있다. 잘 살펴보면 생각만큼 이상한 것이 아니다.

엑스박스 시리즈 X와 엔비디아의 RTX IO는 마이크로소프트의 최신 다이렉트X API인 다이렉트스토리지를 이용한다. 마이크로소프트는 엑스박스 시리즈 X 발표 후 이 기술이 PC에도 도입될 것임을 시사했다. 이번 주 마이크로소프트는 이 기술이 어떻게 SSD와 GPU를 더 긴밀하게 연동시켜 로딩 시간을 단축하는지(아니면 아예 없앨 수도?)에 대해 약간의 정보를 공개했다. 여기에는 고속의 NVMe 드라이브가 필수적이다.

엔비디아의 CEO인 젠슨 황은 이 기술을 발표하는 자리에서 “엔비디아 RTX IO에 의해 광대한 세계가 순식간에 펼쳐질 것이다. 중단한 곳에서 즉시 다시 게임을 시작할 수 있다. 차세대 게이밍에서 대단히 중요한 점”이라고 설명했다. 즉시 로딩은 올해 후반 출시될 엑스박스 시리즈 X와 플레이스테이션 5의 핵심 판매 포인트이기도 하다. 
 

마이크로소프트 다이렉트스토리지와 RTX IO가 작용하는 방식 

ⓒ NVIDIA

황은 “게임은 PC IO와 파일 시스템을 한계 지점까지 몰아붙였다”라고 말했다. 다이렉트스토리지는 이 문제를 하기 위해 개발되었다. 전통적으로 CPU는 게임 자산을 스토리지로부터 호출하고 압축을 해제한다. 그 후 데이터를 시스템 메모리를 거쳐 그래픽 카드로 이동한다. 마이크로소프트의 앤드류 융은 과거와 달리 눈부시게 빠른 PCIe 4.0 NVMe 드라이브의 시대에 기존 방식이 통하지 않는 이유를 아래와 같이 설명했다. 

“이전 세대 게임의 스트리밍 가용 속도는 50MB/s가량이었다. 따라서 소량의 64k 블록 크기에서도 초당 IO 요청이 수백 회에 불과했다. 초당 멀티 기가바이트를 처리할 수 있는 NVMe 드라이브에서는 대역을 최대한 이용하기 위해 IO 요청이 초당 수만 회로 폭증한다. 시리즈 X의 2.4GB/s 드라이브와 64k 블록 크기를 예로 들어보자. 이 블록을 채우는 데에만 초당 35,000회 이상의 요청이 필요하다. 

기존의 API는 게임이 이 요청을 일일이 관리하고 처리하도록 요구한다. 먼저 요청을 제출하고 요청이 완수되기를 기다린 후 요청 완료를 처리하는 식이다. 느린 하드 드라이브에서 실행되는 구식 게임의 경우 요청의 오버헤드는 그렇게 크지 않고, 정체 지점이 아니었다. 그러나 초당 수만 회로 급증한다면 IO 오버헤드가 지나치게 과다해져 증가한 NVMe 드라이브 대역의 이점을 누릴 수 없다.”

거대한 파일 텍스처와 경이롭게 빠른 PCIe 4.0 SSD와 함께 용량이 100GB를 넘어서는 오늘날의 게임 세계에서 이러한 전통적인 CPU 이관은 정체를 낳는다. 

한편, CPU 쓰레드는 한 작업을 완수한 후 다음 작업으로 넘어가야 하지만, GPU는 여러 작업의 병렬 실행에 탁월하다. 다이렉트스토리지는 초고속 NVMe SSD가 그래픽 카드 상의 초고속 전용 VRAM에 데이터를 직접 전송하면서 이 이점을 활용한다. 이는 기본적으로 느린 중간 단계를 배제하는 것이고, 동시에 CPU를 자유롭게 해 다른 작업을 할 수 있다.
 
ⓒ NVIDIA

융은 다이렉트스토리지가 스토리지 성능을 극대화할 수 있도록 개발자를 위한 여러 툴을 제공한다고 말했다. 그는 “요청 당 NVMe 오버헤드를 줄이고, 한번에 다수의 병렬 IO 요청을 일괄 처리할 수 있고(이는 GPU로 효율적으로 공급될 수 있음), 소소한 IO 완료에 일일이 대응해야 할 필요 없이 IO 요청 완료를 통지 받았을 때 미시적인 제어를 할 수 있다”라고 말했다.
 

NVMe 속도와 지능, 더 높아져야 한다

그러나 마이크로소프트의 게시물에 따르면 다이렉트스토리지의 혜택을 보려면 NVMe 드라이브가 있어야 한다. NVMe 드라이브가 전통적인 SATA 스토리지에 비해 극히 높은 대역을 제공하고, 또한 다수의 IO 요청을 수용할 수 있는 다수의 ‘NVMe 큐’를 제공하기 때문이다. 따라서 현대 게이밍 워크로드의 병렬 및 일괄 처리 특성, 그리고 GPU 성능에 완벽히 부합한다. 
 
ⓒ CORSAIR

PC애호가에게는 반가운 소식이다. 지금까지 경이로운 NVMe 드라이브의 혜택은 대개 대형 파일 전송이나 4K/8K 영상의 편집 용도로 제한되었기 때문이다. 게임은 표준적인 2.5인치 SATA SSD보다 NVMe 드라이브에서 확연히 빠르지 않았다. 심지어 커세어 포스 MP 600 같은 눈부신 성능의 PCIe 4.0 SSD에서도 마찬가지였다. 

다이렉트스토리지가 PC에 도입될 경우 이 모든 것이 변할 것이다. 이 기술은 이번 가을 엑스박스 시리즈 X 내의 벨로시티 아키텍처의 일부일 것이지만, 마이크로소프트는 2021년쯤에 다이렉트스토리지 프리뷰를 PC 개발자에게 제공하기를 희망하고 있다. 즉시 로딩 세계라는 꿈이 콘솔 게임에서 현실이 된다면 다음은 PC의 차례다. editor@itworld.co.kr 


2020.09.07

"로딩 시간 없애라" MS와 엔비디아의 게임 체인저 전략

Brad Chacos | PCWorld
차세대 게임 콘솔의 눈부시게 빠른 스토리지 기술이 PC에도 도입될 전망이다. 엔비디아의 최신 지포스 RTX 30 시리즈 그래픽 카드에 내장된 RTX IO 기술이 로딩 시간 단축을 뒷받침한다. 최근 마이크로소프트도 스토리지의 작동 방식 정보를 조금 더 공개했다.

그렇다. 마이크로소프트는 그래픽 카드에서 SSD 기술이 작용하는 방식을 설명하고 있다. 잘 살펴보면 생각만큼 이상한 것이 아니다.

엑스박스 시리즈 X와 엔비디아의 RTX IO는 마이크로소프트의 최신 다이렉트X API인 다이렉트스토리지를 이용한다. 마이크로소프트는 엑스박스 시리즈 X 발표 후 이 기술이 PC에도 도입될 것임을 시사했다. 이번 주 마이크로소프트는 이 기술이 어떻게 SSD와 GPU를 더 긴밀하게 연동시켜 로딩 시간을 단축하는지(아니면 아예 없앨 수도?)에 대해 약간의 정보를 공개했다. 여기에는 고속의 NVMe 드라이브가 필수적이다.

엔비디아의 CEO인 젠슨 황은 이 기술을 발표하는 자리에서 “엔비디아 RTX IO에 의해 광대한 세계가 순식간에 펼쳐질 것이다. 중단한 곳에서 즉시 다시 게임을 시작할 수 있다. 차세대 게이밍에서 대단히 중요한 점”이라고 설명했다. 즉시 로딩은 올해 후반 출시될 엑스박스 시리즈 X와 플레이스테이션 5의 핵심 판매 포인트이기도 하다. 
 

마이크로소프트 다이렉트스토리지와 RTX IO가 작용하는 방식 

ⓒ NVIDIA

황은 “게임은 PC IO와 파일 시스템을 한계 지점까지 몰아붙였다”라고 말했다. 다이렉트스토리지는 이 문제를 하기 위해 개발되었다. 전통적으로 CPU는 게임 자산을 스토리지로부터 호출하고 압축을 해제한다. 그 후 데이터를 시스템 메모리를 거쳐 그래픽 카드로 이동한다. 마이크로소프트의 앤드류 융은 과거와 달리 눈부시게 빠른 PCIe 4.0 NVMe 드라이브의 시대에 기존 방식이 통하지 않는 이유를 아래와 같이 설명했다. 

“이전 세대 게임의 스트리밍 가용 속도는 50MB/s가량이었다. 따라서 소량의 64k 블록 크기에서도 초당 IO 요청이 수백 회에 불과했다. 초당 멀티 기가바이트를 처리할 수 있는 NVMe 드라이브에서는 대역을 최대한 이용하기 위해 IO 요청이 초당 수만 회로 폭증한다. 시리즈 X의 2.4GB/s 드라이브와 64k 블록 크기를 예로 들어보자. 이 블록을 채우는 데에만 초당 35,000회 이상의 요청이 필요하다. 

기존의 API는 게임이 이 요청을 일일이 관리하고 처리하도록 요구한다. 먼저 요청을 제출하고 요청이 완수되기를 기다린 후 요청 완료를 처리하는 식이다. 느린 하드 드라이브에서 실행되는 구식 게임의 경우 요청의 오버헤드는 그렇게 크지 않고, 정체 지점이 아니었다. 그러나 초당 수만 회로 급증한다면 IO 오버헤드가 지나치게 과다해져 증가한 NVMe 드라이브 대역의 이점을 누릴 수 없다.”

거대한 파일 텍스처와 경이롭게 빠른 PCIe 4.0 SSD와 함께 용량이 100GB를 넘어서는 오늘날의 게임 세계에서 이러한 전통적인 CPU 이관은 정체를 낳는다. 

한편, CPU 쓰레드는 한 작업을 완수한 후 다음 작업으로 넘어가야 하지만, GPU는 여러 작업의 병렬 실행에 탁월하다. 다이렉트스토리지는 초고속 NVMe SSD가 그래픽 카드 상의 초고속 전용 VRAM에 데이터를 직접 전송하면서 이 이점을 활용한다. 이는 기본적으로 느린 중간 단계를 배제하는 것이고, 동시에 CPU를 자유롭게 해 다른 작업을 할 수 있다.
 
ⓒ NVIDIA

융은 다이렉트스토리지가 스토리지 성능을 극대화할 수 있도록 개발자를 위한 여러 툴을 제공한다고 말했다. 그는 “요청 당 NVMe 오버헤드를 줄이고, 한번에 다수의 병렬 IO 요청을 일괄 처리할 수 있고(이는 GPU로 효율적으로 공급될 수 있음), 소소한 IO 완료에 일일이 대응해야 할 필요 없이 IO 요청 완료를 통지 받았을 때 미시적인 제어를 할 수 있다”라고 말했다.
 

NVMe 속도와 지능, 더 높아져야 한다

그러나 마이크로소프트의 게시물에 따르면 다이렉트스토리지의 혜택을 보려면 NVMe 드라이브가 있어야 한다. NVMe 드라이브가 전통적인 SATA 스토리지에 비해 극히 높은 대역을 제공하고, 또한 다수의 IO 요청을 수용할 수 있는 다수의 ‘NVMe 큐’를 제공하기 때문이다. 따라서 현대 게이밍 워크로드의 병렬 및 일괄 처리 특성, 그리고 GPU 성능에 완벽히 부합한다. 
 
ⓒ CORSAIR

PC애호가에게는 반가운 소식이다. 지금까지 경이로운 NVMe 드라이브의 혜택은 대개 대형 파일 전송이나 4K/8K 영상의 편집 용도로 제한되었기 때문이다. 게임은 표준적인 2.5인치 SATA SSD보다 NVMe 드라이브에서 확연히 빠르지 않았다. 심지어 커세어 포스 MP 600 같은 눈부신 성능의 PCIe 4.0 SSD에서도 마찬가지였다. 

다이렉트스토리지가 PC에 도입될 경우 이 모든 것이 변할 것이다. 이 기술은 이번 가을 엑스박스 시리즈 X 내의 벨로시티 아키텍처의 일부일 것이지만, 마이크로소프트는 2021년쯤에 다이렉트스토리지 프리뷰를 PC 개발자에게 제공하기를 희망하고 있다. 즉시 로딩 세계라는 꿈이 콘솔 게임에서 현실이 된다면 다음은 PC의 차례다. editor@itworld.co.kr 


X