2018.08.16

2세대 쓰레드리퍼 2990WX 심층 리뷰 : 미친듯이 빠른 AMD 32코어 CPU

Gordon Mah Ung | PCWorld

AMD가 무려 32코어, 64쓰레드의 라이젠 쓰레드리퍼(Ryzen Threadripper) 2990WX CPU를 내놨다. 게다가 이 흉포한 CPU의 가격은 1,799달러인데(뉴에그와 아마존에서 판매 중), 이 가격은 2년 전 인텔이 10코어 코어 i7-6950X를 출시하면서 내건 가격보다 겨우 76달러 더 높다.

밀레니엄 세대 언어로 표현하자면, 완전히 미친 CPU다.

그러나 32코어 CPU에 대한 욕심으로 큰 돈을 투자하기 전에 알아야 할 점이 여러 가지 있다. 요약하면, 이 CPU는 대부분의 사람들에게 과분할 만큼 고성능이다.

벤치마크 준비를 마친 라이젠 쓰레드리퍼 2990WX

라이젠 쓰레드리퍼 2990WX의 정체
AMD가 8코어 라이젠 7 1800X에서 16코어 라이젠 쓰레드리퍼 1950X를 거쳐 32코어 라이젠 쓰레드리퍼 2990WX에 이르는 데는 불과 16개월밖에 걸리지 않았다. 인텔이 6코어 코어 i7에서 10코어 코어 i7까지 가는 데 3년이 걸렸음을 생각하면 놀라운 속도다.

AMD는 신형 2세대 쓰레드리퍼 4종을 발표했다. 하지만 현재 구매할 수 있는 것은 1종류 뿐이다.

32코어 쓰레드리퍼가 가능한 것은 멀티 칩 설계 덕분이다. 인텔이 사용하는 하나의 인접 또는 모놀리식 다이 방식과 달리 AMD CPU는 여러 개의 칩이 AMD의 고속 인피니티 패브릭(Infinity Fabric)을 통해 결합된 형태다. 16코어 라이젠 쓰레드리퍼 1950X는 8코어 칩 2개, 32코어 라이젠 쓰레드리퍼 2990WX는 8코어 칩 4개를 이러한 방식을 결합한 것이다.

16코어 라이젠 쓰레드리퍼 2950X는 2개의 다이를 사용하고, 각 다이는 메모리와 PCIe 액세스가 있다.

다만 이 방법에는 단점도 있다. 쓰레드리퍼의 sTR4 소켓은 AMD 에픽(Epyc) CPU에 사용되는 서버 소켓과 물리적으로는 동일하지만 sTR4는 다이 4개를 사용해 8채널 메모리를 지원하는 것이 아니라 다이 2개를 사용해서 4채널 메모리를 지원하도록 설계됐다.

이 말은 2990WX의 다이 4개 중에서 2개는 메모리와 PCIe에 직접 액세스하지 않는, 순수한 연산 전용 다이임을 의미한다. 따라서 2개의 연산 다이는 PCIe와 메모리에 액세스할 수 있는 I/O 다이를 통해 통신해야 한다. 결과적으로 메모리 액세스가 가능한 I/O 다이의 메모리 지연은 64ns, 계산 전용 다이의 지연은 105ns가 된다.

신형 32코어 라이젠 쓰레드리퍼 2990WX는 인피니티 패브릭으로 연결된 4개의 다이를 사용한다. 넷 중 둘은 인접 다이를 통해 RAM과 스토리지에 액세스해야 한다.

인피니티 패브릭에서의 대역폭 감소도 있다. 2개의 다이만 사용하는 신형 16코어 라이젠 쓰레드리퍼 2950X의 양방향 다이 대 다이 대역폭은 50GBps인데, 4칩 32코어 2990WX의 양방향 다이 대 다이 대역폭은 그 절반인 25GBps다.

이는 7000 시리즈 서버 에픽 CPU의 42GBps에 비해 현저히 낮은 수치다. 다이 대 다이 대역폭의 감소 이유나 그로 인한 성능 측면의 영향은 확실하지 않다. CPU가 메인보드 자체에 연결되는 방식에 따른 현상일 수도 있다. 서버용 에픽 CPU는 8채널 메모리를 사용하며 각 채널은 쓰레드리퍼의 공유 방식과 달리 자체 RAM 세트에 액세스한다.

라이젠 효과
멀티 칩 설계가 나오면서 코어 수가 전례 없는 속도로 늘어나기 시작했다. 인텔의 모놀리식 설계에서는 18코어 CPU 하나를 만들려면 모든 다이가 거의 완벽해야 하고 모든 코어가 작동해야 한다. 그러나 쓰레드리퍼에서 32코어는 정상 작동하는 8코어 다이 4개만 있으면 된다. 덕분에 지금은 소비자용 CPU에서도 엄청난 수의 코어를 볼 수 있다.

AMD는 이를 “라이젠 효과”라고 표현한다. 인텔의 주요 CPU 출시 시기와 각각의 코어 수를 정리한 다음 표에서 그 효과를 실제 확인할 수 있다. 지난 1년 반 동안 코어 수의 급증을 불러온 요소는 무엇일까? 인텔이 6코어에서 10코어로 가는 데는 2008년부터 2016년까지 8년의 시간이 걸렸지만 AMD가 8코어에서 32코어로 가는 데는 18개월이 걸렸다.

라이젠 효과가 제대로 나타나고 있다. 2017년 라이젠 CPU 출시 이후 CPU의 코어수는 수직 상승했다.

대부분 기존 보드와 호환 가능
2세대 쓰레드리퍼와 관련해서 기존 X399 메인보드와 호환되지 않으리라는 우려가 많았다. AMD는 새 칩을 지원하도록 UEFI/BIOS를 업데이트만 하면 현재 판매되는 모든 X399 보드를 사용할 수 있다고 말했다. 모든 X399 메인보드는 기존 CPU 없이 USB를 통해 보드의 BIOS를 업데이트하는 “BIOS 백(BIOS Back)” 기능을 지원한다.

현존하는 메인보드는 모두 호환되지만 오버클럭 가능성은 각기 다를 수 있다. 다만 관련해서 들리는 소식은 대부분 긍정적이다. AMD에 따르면 가장 중요한 이슈는 32코어 및 24코어 버전 칩의 막대한 소비 전력이다. 그에 따라 일부 보드 업체는 냉각 키트를 추가해 기존 보드를 보완했다.

2세대 쓰레드리퍼의 세련된 포장



2018.08.16

2세대 쓰레드리퍼 2990WX 심층 리뷰 : 미친듯이 빠른 AMD 32코어 CPU

Gordon Mah Ung | PCWorld

AMD가 무려 32코어, 64쓰레드의 라이젠 쓰레드리퍼(Ryzen Threadripper) 2990WX CPU를 내놨다. 게다가 이 흉포한 CPU의 가격은 1,799달러인데(뉴에그와 아마존에서 판매 중), 이 가격은 2년 전 인텔이 10코어 코어 i7-6950X를 출시하면서 내건 가격보다 겨우 76달러 더 높다.

밀레니엄 세대 언어로 표현하자면, 완전히 미친 CPU다.

그러나 32코어 CPU에 대한 욕심으로 큰 돈을 투자하기 전에 알아야 할 점이 여러 가지 있다. 요약하면, 이 CPU는 대부분의 사람들에게 과분할 만큼 고성능이다.

벤치마크 준비를 마친 라이젠 쓰레드리퍼 2990WX

라이젠 쓰레드리퍼 2990WX의 정체
AMD가 8코어 라이젠 7 1800X에서 16코어 라이젠 쓰레드리퍼 1950X를 거쳐 32코어 라이젠 쓰레드리퍼 2990WX에 이르는 데는 불과 16개월밖에 걸리지 않았다. 인텔이 6코어 코어 i7에서 10코어 코어 i7까지 가는 데 3년이 걸렸음을 생각하면 놀라운 속도다.

AMD는 신형 2세대 쓰레드리퍼 4종을 발표했다. 하지만 현재 구매할 수 있는 것은 1종류 뿐이다.

32코어 쓰레드리퍼가 가능한 것은 멀티 칩 설계 덕분이다. 인텔이 사용하는 하나의 인접 또는 모놀리식 다이 방식과 달리 AMD CPU는 여러 개의 칩이 AMD의 고속 인피니티 패브릭(Infinity Fabric)을 통해 결합된 형태다. 16코어 라이젠 쓰레드리퍼 1950X는 8코어 칩 2개, 32코어 라이젠 쓰레드리퍼 2990WX는 8코어 칩 4개를 이러한 방식을 결합한 것이다.

16코어 라이젠 쓰레드리퍼 2950X는 2개의 다이를 사용하고, 각 다이는 메모리와 PCIe 액세스가 있다.

다만 이 방법에는 단점도 있다. 쓰레드리퍼의 sTR4 소켓은 AMD 에픽(Epyc) CPU에 사용되는 서버 소켓과 물리적으로는 동일하지만 sTR4는 다이 4개를 사용해 8채널 메모리를 지원하는 것이 아니라 다이 2개를 사용해서 4채널 메모리를 지원하도록 설계됐다.

이 말은 2990WX의 다이 4개 중에서 2개는 메모리와 PCIe에 직접 액세스하지 않는, 순수한 연산 전용 다이임을 의미한다. 따라서 2개의 연산 다이는 PCIe와 메모리에 액세스할 수 있는 I/O 다이를 통해 통신해야 한다. 결과적으로 메모리 액세스가 가능한 I/O 다이의 메모리 지연은 64ns, 계산 전용 다이의 지연은 105ns가 된다.

신형 32코어 라이젠 쓰레드리퍼 2990WX는 인피니티 패브릭으로 연결된 4개의 다이를 사용한다. 넷 중 둘은 인접 다이를 통해 RAM과 스토리지에 액세스해야 한다.

인피니티 패브릭에서의 대역폭 감소도 있다. 2개의 다이만 사용하는 신형 16코어 라이젠 쓰레드리퍼 2950X의 양방향 다이 대 다이 대역폭은 50GBps인데, 4칩 32코어 2990WX의 양방향 다이 대 다이 대역폭은 그 절반인 25GBps다.

이는 7000 시리즈 서버 에픽 CPU의 42GBps에 비해 현저히 낮은 수치다. 다이 대 다이 대역폭의 감소 이유나 그로 인한 성능 측면의 영향은 확실하지 않다. CPU가 메인보드 자체에 연결되는 방식에 따른 현상일 수도 있다. 서버용 에픽 CPU는 8채널 메모리를 사용하며 각 채널은 쓰레드리퍼의 공유 방식과 달리 자체 RAM 세트에 액세스한다.

라이젠 효과
멀티 칩 설계가 나오면서 코어 수가 전례 없는 속도로 늘어나기 시작했다. 인텔의 모놀리식 설계에서는 18코어 CPU 하나를 만들려면 모든 다이가 거의 완벽해야 하고 모든 코어가 작동해야 한다. 그러나 쓰레드리퍼에서 32코어는 정상 작동하는 8코어 다이 4개만 있으면 된다. 덕분에 지금은 소비자용 CPU에서도 엄청난 수의 코어를 볼 수 있다.

AMD는 이를 “라이젠 효과”라고 표현한다. 인텔의 주요 CPU 출시 시기와 각각의 코어 수를 정리한 다음 표에서 그 효과를 실제 확인할 수 있다. 지난 1년 반 동안 코어 수의 급증을 불러온 요소는 무엇일까? 인텔이 6코어에서 10코어로 가는 데는 2008년부터 2016년까지 8년의 시간이 걸렸지만 AMD가 8코어에서 32코어로 가는 데는 18개월이 걸렸다.

라이젠 효과가 제대로 나타나고 있다. 2017년 라이젠 CPU 출시 이후 CPU의 코어수는 수직 상승했다.

대부분 기존 보드와 호환 가능
2세대 쓰레드리퍼와 관련해서 기존 X399 메인보드와 호환되지 않으리라는 우려가 많았다. AMD는 새 칩을 지원하도록 UEFI/BIOS를 업데이트만 하면 현재 판매되는 모든 X399 보드를 사용할 수 있다고 말했다. 모든 X399 메인보드는 기존 CPU 없이 USB를 통해 보드의 BIOS를 업데이트하는 “BIOS 백(BIOS Back)” 기능을 지원한다.

현존하는 메인보드는 모두 호환되지만 오버클럭 가능성은 각기 다를 수 있다. 다만 관련해서 들리는 소식은 대부분 긍정적이다. AMD에 따르면 가장 중요한 이슈는 32코어 및 24코어 버전 칩의 막대한 소비 전력이다. 그에 따라 일부 보드 업체는 냉각 키트를 추가해 기존 보드를 보완했다.

2세대 쓰레드리퍼의 세련된 포장



X