2018.10.08

AMD DLM, 2세대 32코어·24코어 라이젠 쓰레드리퍼 성능 대폭 향상

Gordon Mah Ung | PCWorld
AMD의 하이엔드 CPU 라이젠 쓰레드리퍼 2990WX, 혹은 곧 출시될 2990WX를 구입할 사용자는 아이스크림의 가장 맛있는 부분을 떠 먹을 수 있게 된다. AMD는 다이내믹 로컬 모드(Dynamic Local Mode, DLM)라는 새로운 소프트웨어를 발표했다. DLM은 윈도우에서 로드를 재라우팅해서 일부 작업에서의 성능을 한층 더 끌어올린다. AMD의 로버트 할록이 지난주 금요일 블로그를 통해 DLM을 자세히 소개했다.

DLM은 라이젠 쓰레드리퍼의 특징적인 성능을 뒷받침하기 위해 개발됐다. 쓰레드리퍼 32코어, 24코어 CPU는 단일 칩이 아니라 고속 패브릭 인터페이스로 4개의 다이를 연결한다. 다이 2개에는 자체 메모리 컨트롤러가, 다른 다이 2개는 인접한 다이를 통해 메모리에 접근하는 순수한 컴퓨터 칩이다.


이러한 CPU 설계상의 특징으로 대부분의 워크로드는 문제 없이 처리하지만, 메모리 대기 시간이 긴 워크로드는 문제가 될 수 있다. 설계 상의 특징이 성능 저하로 이어질 가능성이 있었지만, 이제 DLM이 이러한 특징을 보완하게 된다.

블로그에서 할록은 소프트웨어의 작동 방식을 설명했다. 할록은 “DLM은 시스템에서 각 쓰레드의 CPU가 얼마나 시간을 쓰는지를 측정할 수 있는 윈도우 10 백그라운드 서비스로 실행된다. 그 후 쓰레드는 요구 사항이 가장 적은 것부터 순서대로 배열되며, 상위 쓰레드는 자동적으로 직접 메모리 액세스를 포함하는 CPU 코어로 넘어간다”고 말했다. 이 과정은 서비스가 진행되면서 가장 요구 사항이 많은 쓰레드가 우선으로 순서가 잡히는 과정이다. 별달리 중요하지 않은 쓰레드는 다른 다이로 옮겨진다.

AMD는 DLM이 자체 테스트 결과 업무 종류에 따라 10%에서 47%까지의 성능 향상을 보였다고 밝혔다. AMD 워크로드는 대부분 게임인 반면, 로디니아(Rodinia) HPC 벤치마크는 DLM로 21% 향상됐다.

AMD 관계자들은 모든 앱의 성능이 향상되는 것이 아니라고 강조했다.

 


AMD의 공식적인 입장 표명은 없지만, DLM은 윈도우 10의 결함을 해결할 때도 도움될 것으로 보인다.

할록은 “쓰레드가 항상 로컬 메모리를 최우선으로 노드에 배정한다. 윈도우 환경에서는 처음 등장하는 해결 방식이므로 메모리 풋프린트에서 원격으로 실행되는 쓰레드를 낳는다. 이런 시스템에서는 몇 가지 다른 메커니즘이 필요하다. DLM은 기본적으로 쓰레드와 메모리 콘텐츠를 함께 묶는 점에서 1세대 라이젠 쓰레드리퍼용으로 개발된 라이젠 마스터 기능인 로컬 모드(Local Mode)과 비슷하다.

너무 기뻐하기 전에 DLM 소프트웨어는 출시 예정인 24코어 라이젠 쓰레드리퍼 2970WX와 현재 판매 중인 32코어 라이젠 쓰레드리퍼 2990WX에서만 작동한다는 점을 명심하자.


2세대 32코어나 24코어 쓰레드리퍼를 위해 라이젠 마스터(Ryzen Master) 버전을 다운로드 받을 때는 새로 생긴 옵션 항목을 확인한다. 16코어, 12코어 쓰레드리퍼에는 이 옵션이 필요하지 않기 때문에 나타날 일이 없기 때문이다. editor@itworld.co.kr  

2018.10.08

AMD DLM, 2세대 32코어·24코어 라이젠 쓰레드리퍼 성능 대폭 향상

Gordon Mah Ung | PCWorld
AMD의 하이엔드 CPU 라이젠 쓰레드리퍼 2990WX, 혹은 곧 출시될 2990WX를 구입할 사용자는 아이스크림의 가장 맛있는 부분을 떠 먹을 수 있게 된다. AMD는 다이내믹 로컬 모드(Dynamic Local Mode, DLM)라는 새로운 소프트웨어를 발표했다. DLM은 윈도우에서 로드를 재라우팅해서 일부 작업에서의 성능을 한층 더 끌어올린다. AMD의 로버트 할록이 지난주 금요일 블로그를 통해 DLM을 자세히 소개했다.

DLM은 라이젠 쓰레드리퍼의 특징적인 성능을 뒷받침하기 위해 개발됐다. 쓰레드리퍼 32코어, 24코어 CPU는 단일 칩이 아니라 고속 패브릭 인터페이스로 4개의 다이를 연결한다. 다이 2개에는 자체 메모리 컨트롤러가, 다른 다이 2개는 인접한 다이를 통해 메모리에 접근하는 순수한 컴퓨터 칩이다.


이러한 CPU 설계상의 특징으로 대부분의 워크로드는 문제 없이 처리하지만, 메모리 대기 시간이 긴 워크로드는 문제가 될 수 있다. 설계 상의 특징이 성능 저하로 이어질 가능성이 있었지만, 이제 DLM이 이러한 특징을 보완하게 된다.

블로그에서 할록은 소프트웨어의 작동 방식을 설명했다. 할록은 “DLM은 시스템에서 각 쓰레드의 CPU가 얼마나 시간을 쓰는지를 측정할 수 있는 윈도우 10 백그라운드 서비스로 실행된다. 그 후 쓰레드는 요구 사항이 가장 적은 것부터 순서대로 배열되며, 상위 쓰레드는 자동적으로 직접 메모리 액세스를 포함하는 CPU 코어로 넘어간다”고 말했다. 이 과정은 서비스가 진행되면서 가장 요구 사항이 많은 쓰레드가 우선으로 순서가 잡히는 과정이다. 별달리 중요하지 않은 쓰레드는 다른 다이로 옮겨진다.

AMD는 DLM이 자체 테스트 결과 업무 종류에 따라 10%에서 47%까지의 성능 향상을 보였다고 밝혔다. AMD 워크로드는 대부분 게임인 반면, 로디니아(Rodinia) HPC 벤치마크는 DLM로 21% 향상됐다.

AMD 관계자들은 모든 앱의 성능이 향상되는 것이 아니라고 강조했다.

 


AMD의 공식적인 입장 표명은 없지만, DLM은 윈도우 10의 결함을 해결할 때도 도움될 것으로 보인다.

할록은 “쓰레드가 항상 로컬 메모리를 최우선으로 노드에 배정한다. 윈도우 환경에서는 처음 등장하는 해결 방식이므로 메모리 풋프린트에서 원격으로 실행되는 쓰레드를 낳는다. 이런 시스템에서는 몇 가지 다른 메커니즘이 필요하다. DLM은 기본적으로 쓰레드와 메모리 콘텐츠를 함께 묶는 점에서 1세대 라이젠 쓰레드리퍼용으로 개발된 라이젠 마스터 기능인 로컬 모드(Local Mode)과 비슷하다.

너무 기뻐하기 전에 DLM 소프트웨어는 출시 예정인 24코어 라이젠 쓰레드리퍼 2970WX와 현재 판매 중인 32코어 라이젠 쓰레드리퍼 2990WX에서만 작동한다는 점을 명심하자.


2세대 32코어나 24코어 쓰레드리퍼를 위해 라이젠 마스터(Ryzen Master) 버전을 다운로드 받을 때는 새로 생긴 옵션 항목을 확인한다. 16코어, 12코어 쓰레드리퍼에는 이 옵션이 필요하지 않기 때문에 나타날 일이 없기 때문이다. editor@itworld.co.kr  

X