2020.03.26

다이렉트X 12 얼티밋 집중 분석 : 레이트레이싱과 속도 향상 "PC·엑스박스 같이 간다"

Brad Chacos | PCWorld
마이크로소프트는 출시를 앞둔 엑스박스 시리즈 X와 윈도우를 모두 지원할 그래픽 기술의 새 버전인 다이렉트X 12 얼티밋을 발표했다. 지난 20일(현지 시간), 지금은 취소된 GDC 2020에 발표하기로 계획했던 새 소식 중 하나다.

마이크로소프트의 공식 발표에 앞서 엔비디아는 다이렉트X 12에 기대할 수 있는 세부 내용을 공유했다. 여기에는 이유가 있다. 마이크로소프트의 차세대 콘솔에 AMD가 탑재되기는 하지만, 다이렉트X 12 얼티밋은 업계의 새로운 기준이 되고, 먼저 지포스 RTX 20 시리즈 그래픽 카드에 도입될 혁신 기술을 지원하기 때문이다. 이 장점 중 하나가 PC와 콘솔 모두를 통합해 지원하는 것이고, 이런 이유로 ‘얼티밋’이라는 명칭이 붙었다.

마이크로소프트는 다이렉트X 12 발표에 관한 게시글에서 “DX12 얼티밋은 PC와 엑스박스 시리즈 X의 그래픽 플랫폼을 통합하면서 전체 게임 생태계의 전력 승수 역할을 한다. 이제 더 이상 별개의 사이클은 존재하지 않는다. 대신 결합되어 시너지를 발휘한다. 엑스박스 시리즈 X가 출시될 시점에 동일한 기능 세트를 가진 수많은 DX12 얼티밋 PC그래픽 카드가 출시되어 있는 상태로 새로운 기능의 도입에 촉매 역할을 할 것이다. 엑스박스 시리즈 X가 새 콘솔 게이머를 유치하면 PC 또한 새로 등장한 많은 DX12 얼티밋 지원 하드웨어를 통해 유사한 혜택을 누리게 될 것이다. 그 결과가 무엇일까? 새로운 기능 도입에 속도가 붙는다. 과거 어느 때보다 빠른 속도로 게이머에게 혁신적인 그래픽 기술이 제공할 수 있을 것”이라고 설명했다.

다이렉트X 12 얼티밋은 첫 버전이 점진적으로 업데이트되고 있는 다이렉트X 레이트레이싱(DXR) 티어 1.1을 지원한다. 지포스 RTX 20 시리즈 GPU에서 첨단 광원 그래픽 기술이 조명을 받으면서, 엔비디아는 GTX라는 브랜딩을 ‘RTX’로 바꿨다. 레이트레이싱은 차세대 엑스박스 시리즈 X의 핵심 기능이다(플레이스테이션 5 또한 하드웨어 기반 레이트레이싱을 지원하지만, 소니 시스템은 다이렉트X 기술을 이용하지 않는다). DXR 1.1에 추가된 가장 주목할 기술은 인라인 레이트레이싱이다. 마이크로소프트에 따르면, 전적으로 시스템에 대한 작업 일정을 처리하는 대신 더 많은 레이트레이싱 프로세스를 구동할 수 있는 옵션을 주는 새로운 기법이다.

레이트레이싱이 잘 활용될 때 뛰어난 효과를 낸다는 것은 컨트롤(Control)과 메트로 엑소더스(Metro Exodus) 게임에서 이미 증명되었다. 지금은 도입이 많지 않지만, 콘솔에서 지원하기 시작하면 레이트레이싱의 인기가 급증할 전망이다.
 

AMD가 출시할 예정인 RDNA2 기반 라데온 그래픽 카드 또한 하드웨어 레이트레이싱과 다이렉트X 12 얼티밋을 지원할 예정이다. AMD는 위 영상에서 이 사실을 공식 확인했다. 

그러나 레이트레이싱이 다이렉트X 12 얼티밋에 기반을 둘 엔비디아 튜링 아키텍처로 도입될 유일한 기술은 아니다. GPU의 스마트한 동작을 보장하는 지능형 렌더링 기능이 더 있다. 개발자들이 이를 수용하면 그래픽 카드나 엑스박스의 성능이 크게 강화될 것이다.
 
ⓒNVIDIA

DX12 얼티밋 하드웨어는 VRS(Variable Rate Shading) 티어 2 또한 지원해야 한다. PCWorld는 엔비디아 튜링 GPU를 상세히 다루면서 VRS에 대해 설명한 바 있다. 

“VRS는 엔비디아가 몇 년 전부터 지원하고 있는 멀티 레졸루션 쉐이딩을 크게 강화한 버전이라고 말할 수 있다. 사람의 눈은 시야에 있는 것만 완전하게 초점을 맞춰 볼 수 있다. 주변 객체나 움직이는 객체는 이렇게 선명하게 보지 못한다. VRS는 이러한 점을 이용, 주 객체는 완전한 해상도로 쉐이딩을 처리하고, 부수적인 객체는 더 낮은 비율로 처리해 성능을 향상할 수 있다.

유망한 사용례로 움직이는 장면에서 중요하지 않은 부분을 덜 상세하게 렌더링하는 모션 어댑티브 쉐이딩(Motion Adaptive Shading)을 들 수 있다. 위 이미지는 포르자 호라이즌(Forza Horizon)에서의 처리 방식을 보여준다. 전통적인 방식은 장면의 모든 부분을 완전한 상세도로 렌더링한다. 그러나 모션 어댑티브 쉐이딩의 경우, 장면에서 푸른색 부분만 이렇게 처리한다.”

VRS는 다른 방식으로도 사용될 수 있다. 울펜슈타인(Wolfenstein) II에 도입된 콘텐츠 어댑티브 쉐이딩(Content Adaptive Shading) 기술을 예로 들 수 있다. 콘텐츠 어댑티브 쉐이딩에는 모션 어댑티브 쉐이딩과 동일한 기본 원칙이 적용된다. 그러나 시각적으로 인지되는 품질을 최소한만 포기한 상태에서 전반적인 성능을 높이기 위해 (움직이는 장면을 중심으로)상세도를 낮출 화면의 부분, 유사한 색상 부분을 동적으로 파악한다.

필자는 높은 프레임율을 선호하는 매니아로 이런 스마트 렌더링 기법을 아주 좋아한다. 이제 VRS가 DX12 얼티밋과 차세대 콘솔의 일부가 되면서, 개발자들이 이런 도구를 더 자주 지원하기 시작할 전망이다.
 
ⓒNVIDIA
ⓒNVIDIA

엔비디아에 따르면, 마이크로소프트의 최신 API 버전에도 메시 쉐이더(Mesh Shaders) 지원이 필요하다. 엔비디아 튜링 GPU에 이런 메시 쉐이딩 개념이 도입되어 있다. 당시 PCWorld는 다음과 같이 설명했다.

“메쉬 쉐이더는 객체가 아주 많은 시각적으로 아주 복잡한 장면에서 CPU의 ‘부담’ 가운데 일부를 덜어주는 방식으로 도움을 준다. 이는 새로운 2가지 쉐이더 단계로 구성되어 있다. 태스크 쉐이더는 객체 컬링 작업을 통해 렌더링이 필요한 장면의 요소를 파악한다. 요소가 파악되면, 메시 쉐이더가 렌더링할 시각적 객체에 적용할 상세한 정도를 결정한다. 멀리 떨어진 객체는 상세도가 더 낮고, 가까운 객체는 가능한 선명하게 보이도록 처리한다. 엔비디아는 플레이가 가능한 인상적인 데모에서 메시 쉐이딩의 강점을 증명해 보였다. 우주선이 30만 개의 소행성을 통과하는 장면의 데모이다. 수많은 객체에도 불구하고 초당 50 프레임 정도로 데모가 실행되었다. 메시 쉐이딩이 최대 3조 개가 될 수도 있는 그려진 삼각형의 수를 약 1만 3,000개로 줄였기 때문이다.”

이 기술은 데모에서 아주 인상적으로 보였다. 다음 영상은 엔비디아의 소행성 관련 데모다. 링크된 ‘작동 방식’에 대한 글도 읽어 보기 바란다. 1년 전 지포스 RTX 20 시리즈 GPU가 출시되었지만, 아직은 메시 쉐이딩의 이점을 이용할 수 있는 게임은 존재하지 않는다. 엔비디아는 이제 이 기술이 추진력을 받을 것으로 내다보고 있다. DX12 얼티밋의 일부로 도입되었기 때문이다.
 

VRS 구현 방식에 대한 더 자세한 정보는 지포스의 ‘울펜스타인-영블러드의 엔비디아 어댑티브 쉐이딩(Nvidia Adaptive Shading in Wolfenstein: Youngblood)’이라는 블로그 게시글을 확인할 수 있다. 영블러드의 NAS는 2개 VRS(콘텐츠 어댑티브 쉐이딩과 모션 어댑티브 쉐이딩)을 결합, 시각적으로 인지할 수 있는 품질 저하 없이 성능을 최대 15% 향상한다.

마지막으로, 디렉트X 12 얼티밋에는 샘플러 피드백(Sampler Feedback)이라는 기술에 대한 지원도 요구된다. 마이크로소프트에 따르면, 샘플러 피드백은 시각적 품질을 향상하고, 로드 시간을 줄이고, 스터터링을 경감한다.
 
ⓒNVIDIA

엔비디아의 토니 타마시는 기자회견에서 “기본적으로 텍스처 하위시스템이 쉐이딩 하위시스템에 커뮤니케이션 수단을 제공해, 개발자가 더 지능적으로 샘플링과 필터링, LOD(Levels of Detail)를 관리하는 방식에 대해 선택할 수 있다. 우리는 텍스처 공간 쉐이딩으로 이를 구현했다. 특정 쉐이딩은 공간이나 시간에 대해 공간적으로, 또는 시간적으로 재사할 수 있다. 이를 통해 쉐이딩을 다시 할 필요가 없는 성능, 불필요한 시간을 절약해준다”고 설명했다.

VR워크로드의 경우, 샘플러 피드백을 사용해 장면의 모든 픽셀을 한 번 렌더링한 후, 이를 두 번째 눈에 다시 투사하는 방법으로 쉐이딩 연산을 절반으로 줄인다.

타마시는 “시간적으로 동일한 일을 할 수 있다. 먼 거리에 산이 있는데, 이 산에 역동적인 조명 변화가 많지 않다고 가정하자. 플레이하는 게임에 적절하다고 판단되는 기준에 맞춰 2개 프레임, 또는 10개 프레임마다 산의 쉐이딩을 업데이트하는 방법으로 쉐이딩 연산을 절약할 수 있다. 그러면 개발자는 사용자가 보게 될 장소, 중요한 장소의 이미지 품질을 강화하고, 중요하지 않은 장소에서는 성능을 절약할 수 있다”고 설명했다.

멋진 방법이다.
 
ⓒNVIDIA

이 기술 중 상당수가 1년 전 엔비디아 튜링 지포스 그래픽 카드에 도입되었다. 레이트레이싱 말고도, 다이렉트X 12 얼티밋에는 다른 기술이 도입되어 있는데. 이는 GPU가 더 스마트하게 작동해 성능을 높이는 데 초점이 맞춰져 있다. 실시간 레이트레이싱은 전용 처리 하드웨어가 있는 경우에도 그래픽 칩에 큰 부담을 준다. 따라서 성능을 향상시킬 수 있는 소프트웨어 기법으로 보강하는 것이 좋다(PC의 경우, 엔비디아 DLSS).

다이렉트X 12 얼티밋 인증을 받기 위해서는, PC 하드웨어가 이런 기술들을 모두 지원해야 한다. 엔비디아 지포스 RTX 그래픽 카드는 이미 이를 지원하고 있다. 엑스박스 시리즈 X, 올해 출시될 예정인 차세대 RDNA2 라데온 그래픽 카드도 마찬가지다. 다이렉트X 12 얼티밋 기능에 대한 더 자세한 기술적 설명은 마이크로소프트 다이렉트X 팀의 게시글을 참조하자. editor@itworld.co.kr 


2020.03.26

다이렉트X 12 얼티밋 집중 분석 : 레이트레이싱과 속도 향상 "PC·엑스박스 같이 간다"

Brad Chacos | PCWorld
마이크로소프트는 출시를 앞둔 엑스박스 시리즈 X와 윈도우를 모두 지원할 그래픽 기술의 새 버전인 다이렉트X 12 얼티밋을 발표했다. 지난 20일(현지 시간), 지금은 취소된 GDC 2020에 발표하기로 계획했던 새 소식 중 하나다.

마이크로소프트의 공식 발표에 앞서 엔비디아는 다이렉트X 12에 기대할 수 있는 세부 내용을 공유했다. 여기에는 이유가 있다. 마이크로소프트의 차세대 콘솔에 AMD가 탑재되기는 하지만, 다이렉트X 12 얼티밋은 업계의 새로운 기준이 되고, 먼저 지포스 RTX 20 시리즈 그래픽 카드에 도입될 혁신 기술을 지원하기 때문이다. 이 장점 중 하나가 PC와 콘솔 모두를 통합해 지원하는 것이고, 이런 이유로 ‘얼티밋’이라는 명칭이 붙었다.

마이크로소프트는 다이렉트X 12 발표에 관한 게시글에서 “DX12 얼티밋은 PC와 엑스박스 시리즈 X의 그래픽 플랫폼을 통합하면서 전체 게임 생태계의 전력 승수 역할을 한다. 이제 더 이상 별개의 사이클은 존재하지 않는다. 대신 결합되어 시너지를 발휘한다. 엑스박스 시리즈 X가 출시될 시점에 동일한 기능 세트를 가진 수많은 DX12 얼티밋 PC그래픽 카드가 출시되어 있는 상태로 새로운 기능의 도입에 촉매 역할을 할 것이다. 엑스박스 시리즈 X가 새 콘솔 게이머를 유치하면 PC 또한 새로 등장한 많은 DX12 얼티밋 지원 하드웨어를 통해 유사한 혜택을 누리게 될 것이다. 그 결과가 무엇일까? 새로운 기능 도입에 속도가 붙는다. 과거 어느 때보다 빠른 속도로 게이머에게 혁신적인 그래픽 기술이 제공할 수 있을 것”이라고 설명했다.

다이렉트X 12 얼티밋은 첫 버전이 점진적으로 업데이트되고 있는 다이렉트X 레이트레이싱(DXR) 티어 1.1을 지원한다. 지포스 RTX 20 시리즈 GPU에서 첨단 광원 그래픽 기술이 조명을 받으면서, 엔비디아는 GTX라는 브랜딩을 ‘RTX’로 바꿨다. 레이트레이싱은 차세대 엑스박스 시리즈 X의 핵심 기능이다(플레이스테이션 5 또한 하드웨어 기반 레이트레이싱을 지원하지만, 소니 시스템은 다이렉트X 기술을 이용하지 않는다). DXR 1.1에 추가된 가장 주목할 기술은 인라인 레이트레이싱이다. 마이크로소프트에 따르면, 전적으로 시스템에 대한 작업 일정을 처리하는 대신 더 많은 레이트레이싱 프로세스를 구동할 수 있는 옵션을 주는 새로운 기법이다.

레이트레이싱이 잘 활용될 때 뛰어난 효과를 낸다는 것은 컨트롤(Control)과 메트로 엑소더스(Metro Exodus) 게임에서 이미 증명되었다. 지금은 도입이 많지 않지만, 콘솔에서 지원하기 시작하면 레이트레이싱의 인기가 급증할 전망이다.
 

AMD가 출시할 예정인 RDNA2 기반 라데온 그래픽 카드 또한 하드웨어 레이트레이싱과 다이렉트X 12 얼티밋을 지원할 예정이다. AMD는 위 영상에서 이 사실을 공식 확인했다. 

그러나 레이트레이싱이 다이렉트X 12 얼티밋에 기반을 둘 엔비디아 튜링 아키텍처로 도입될 유일한 기술은 아니다. GPU의 스마트한 동작을 보장하는 지능형 렌더링 기능이 더 있다. 개발자들이 이를 수용하면 그래픽 카드나 엑스박스의 성능이 크게 강화될 것이다.
 
ⓒNVIDIA

DX12 얼티밋 하드웨어는 VRS(Variable Rate Shading) 티어 2 또한 지원해야 한다. PCWorld는 엔비디아 튜링 GPU를 상세히 다루면서 VRS에 대해 설명한 바 있다. 

“VRS는 엔비디아가 몇 년 전부터 지원하고 있는 멀티 레졸루션 쉐이딩을 크게 강화한 버전이라고 말할 수 있다. 사람의 눈은 시야에 있는 것만 완전하게 초점을 맞춰 볼 수 있다. 주변 객체나 움직이는 객체는 이렇게 선명하게 보지 못한다. VRS는 이러한 점을 이용, 주 객체는 완전한 해상도로 쉐이딩을 처리하고, 부수적인 객체는 더 낮은 비율로 처리해 성능을 향상할 수 있다.

유망한 사용례로 움직이는 장면에서 중요하지 않은 부분을 덜 상세하게 렌더링하는 모션 어댑티브 쉐이딩(Motion Adaptive Shading)을 들 수 있다. 위 이미지는 포르자 호라이즌(Forza Horizon)에서의 처리 방식을 보여준다. 전통적인 방식은 장면의 모든 부분을 완전한 상세도로 렌더링한다. 그러나 모션 어댑티브 쉐이딩의 경우, 장면에서 푸른색 부분만 이렇게 처리한다.”

VRS는 다른 방식으로도 사용될 수 있다. 울펜슈타인(Wolfenstein) II에 도입된 콘텐츠 어댑티브 쉐이딩(Content Adaptive Shading) 기술을 예로 들 수 있다. 콘텐츠 어댑티브 쉐이딩에는 모션 어댑티브 쉐이딩과 동일한 기본 원칙이 적용된다. 그러나 시각적으로 인지되는 품질을 최소한만 포기한 상태에서 전반적인 성능을 높이기 위해 (움직이는 장면을 중심으로)상세도를 낮출 화면의 부분, 유사한 색상 부분을 동적으로 파악한다.

필자는 높은 프레임율을 선호하는 매니아로 이런 스마트 렌더링 기법을 아주 좋아한다. 이제 VRS가 DX12 얼티밋과 차세대 콘솔의 일부가 되면서, 개발자들이 이런 도구를 더 자주 지원하기 시작할 전망이다.
 
ⓒNVIDIA
ⓒNVIDIA

엔비디아에 따르면, 마이크로소프트의 최신 API 버전에도 메시 쉐이더(Mesh Shaders) 지원이 필요하다. 엔비디아 튜링 GPU에 이런 메시 쉐이딩 개념이 도입되어 있다. 당시 PCWorld는 다음과 같이 설명했다.

“메쉬 쉐이더는 객체가 아주 많은 시각적으로 아주 복잡한 장면에서 CPU의 ‘부담’ 가운데 일부를 덜어주는 방식으로 도움을 준다. 이는 새로운 2가지 쉐이더 단계로 구성되어 있다. 태스크 쉐이더는 객체 컬링 작업을 통해 렌더링이 필요한 장면의 요소를 파악한다. 요소가 파악되면, 메시 쉐이더가 렌더링할 시각적 객체에 적용할 상세한 정도를 결정한다. 멀리 떨어진 객체는 상세도가 더 낮고, 가까운 객체는 가능한 선명하게 보이도록 처리한다. 엔비디아는 플레이가 가능한 인상적인 데모에서 메시 쉐이딩의 강점을 증명해 보였다. 우주선이 30만 개의 소행성을 통과하는 장면의 데모이다. 수많은 객체에도 불구하고 초당 50 프레임 정도로 데모가 실행되었다. 메시 쉐이딩이 최대 3조 개가 될 수도 있는 그려진 삼각형의 수를 약 1만 3,000개로 줄였기 때문이다.”

이 기술은 데모에서 아주 인상적으로 보였다. 다음 영상은 엔비디아의 소행성 관련 데모다. 링크된 ‘작동 방식’에 대한 글도 읽어 보기 바란다. 1년 전 지포스 RTX 20 시리즈 GPU가 출시되었지만, 아직은 메시 쉐이딩의 이점을 이용할 수 있는 게임은 존재하지 않는다. 엔비디아는 이제 이 기술이 추진력을 받을 것으로 내다보고 있다. DX12 얼티밋의 일부로 도입되었기 때문이다.
 

VRS 구현 방식에 대한 더 자세한 정보는 지포스의 ‘울펜스타인-영블러드의 엔비디아 어댑티브 쉐이딩(Nvidia Adaptive Shading in Wolfenstein: Youngblood)’이라는 블로그 게시글을 확인할 수 있다. 영블러드의 NAS는 2개 VRS(콘텐츠 어댑티브 쉐이딩과 모션 어댑티브 쉐이딩)을 결합, 시각적으로 인지할 수 있는 품질 저하 없이 성능을 최대 15% 향상한다.

마지막으로, 디렉트X 12 얼티밋에는 샘플러 피드백(Sampler Feedback)이라는 기술에 대한 지원도 요구된다. 마이크로소프트에 따르면, 샘플러 피드백은 시각적 품질을 향상하고, 로드 시간을 줄이고, 스터터링을 경감한다.
 
ⓒNVIDIA

엔비디아의 토니 타마시는 기자회견에서 “기본적으로 텍스처 하위시스템이 쉐이딩 하위시스템에 커뮤니케이션 수단을 제공해, 개발자가 더 지능적으로 샘플링과 필터링, LOD(Levels of Detail)를 관리하는 방식에 대해 선택할 수 있다. 우리는 텍스처 공간 쉐이딩으로 이를 구현했다. 특정 쉐이딩은 공간이나 시간에 대해 공간적으로, 또는 시간적으로 재사할 수 있다. 이를 통해 쉐이딩을 다시 할 필요가 없는 성능, 불필요한 시간을 절약해준다”고 설명했다.

VR워크로드의 경우, 샘플러 피드백을 사용해 장면의 모든 픽셀을 한 번 렌더링한 후, 이를 두 번째 눈에 다시 투사하는 방법으로 쉐이딩 연산을 절반으로 줄인다.

타마시는 “시간적으로 동일한 일을 할 수 있다. 먼 거리에 산이 있는데, 이 산에 역동적인 조명 변화가 많지 않다고 가정하자. 플레이하는 게임에 적절하다고 판단되는 기준에 맞춰 2개 프레임, 또는 10개 프레임마다 산의 쉐이딩을 업데이트하는 방법으로 쉐이딩 연산을 절약할 수 있다. 그러면 개발자는 사용자가 보게 될 장소, 중요한 장소의 이미지 품질을 강화하고, 중요하지 않은 장소에서는 성능을 절약할 수 있다”고 설명했다.

멋진 방법이다.
 
ⓒNVIDIA

이 기술 중 상당수가 1년 전 엔비디아 튜링 지포스 그래픽 카드에 도입되었다. 레이트레이싱 말고도, 다이렉트X 12 얼티밋에는 다른 기술이 도입되어 있는데. 이는 GPU가 더 스마트하게 작동해 성능을 높이는 데 초점이 맞춰져 있다. 실시간 레이트레이싱은 전용 처리 하드웨어가 있는 경우에도 그래픽 칩에 큰 부담을 준다. 따라서 성능을 향상시킬 수 있는 소프트웨어 기법으로 보강하는 것이 좋다(PC의 경우, 엔비디아 DLSS).

다이렉트X 12 얼티밋 인증을 받기 위해서는, PC 하드웨어가 이런 기술들을 모두 지원해야 한다. 엔비디아 지포스 RTX 그래픽 카드는 이미 이를 지원하고 있다. 엑스박스 시리즈 X, 올해 출시될 예정인 차세대 RDNA2 라데온 그래픽 카드도 마찬가지다. 다이렉트X 12 얼티밋 기능에 대한 더 자세한 기술적 설명은 마이크로소프트 다이렉트X 팀의 게시글을 참조하자. editor@itworld.co.kr 


X