디지털 디바이스 / 퍼스널 컴퓨팅

“저전력으로 얻는 워크스테이션 성능” M1 울트라 심층 분석

Jason Cross | Macworld 2022.03.11
지난 9일(현지시간) ‘피크 퍼포먼스(Peek Performance)’ 행사에서 애플은 신형 아이폰 SE와 두꺼워진 맥 미니인 일명 ‘맥 스튜디오(Mac Studio)’ 외에 다양한 것을 소개했다. 애플의 최신 데스크톱 맥이 맥 미니보다 큰 데는 그만한 이유가 있다. 새로운 고성능 칩인 M1 울트라(M1 Ultra)를 탑재하고 냉각하기 위함이다. M1 울트라는 이미 주목받는 M1 맥스보다 성능이 더 높다. 
 
ⓒ Apple

나머지 M1 제품군과 마찬가지로 M1 울트라는 애플의 새로운 멀티 칩 패키지의 인상적인 성능만을 보여주는 것이 아니다. 소모하는 전력 또한 훨씬 적다. M1 울트라로 애플은 100W 미만의 전력을 소모하면서 수백 와트의 전력을 사용하는 고성능 PC 하드웨어 제조업체와 경쟁할 것이다. AMD, 인텔, 엔비디아는 한동안 와트당 성능의 이점을 따라잡지 못할 가능성이 크다.


M1 맥스의 결합

인상적인 M1 맥스의 M1 아키텍처를 확장했다. 10개의 CPU 코어(성능 코어 8개, 효율 코어 2개), 32개의 GPU 코어, 2개의 미디어/비디오 엔진, 16개의 뉴럴 엔진(Neural Engine) 코어가 초당 400GB의 메모리 대역폭을 제공하는 넓은 인터페이스를 통해 32 또는 64GB 메모리와 연결돼 있다. 

M1 맥스는 570억 개의 트랜지스터로 구성돼 있다. 지포스 GTX 3090 같은 고성능 GPU보다 약 2배가량 되는 규모다. 더 큰 칩을 만들어 성능을 높이는 것은 경제적 재난이 될 수 있다. 애플이 570억 개 트랜지스터 칩을 출고가에, 심지어 높은 가격에 판매할 수 있다는 것은 놀라운 일이다. 

그래서 애플은 어떻게 M1 울트라를 만들었을까. 애플은 진정한 고속 연결로 M1 맥스를 설계했으므로 말 그대로 2개의 M1 맥스를 하나의 패키지로 통합하고 연결해 성능이 2배인 거대한 1,140억 개의 트랜지스터를 보유한 칩을 제작했다.
 
ⓒ Apple

물론 말처럼 간단하지는 않다. 애플의 연결 방식은 울트라퓨전(UltraFusion)이라고 부르는 것으로, 2개의 다이를 하나의 패키지에 넣고 초당 2.5TB의 엄청난 대역폭으로 연결했다. 애플은 울트라퓨전이 다른 기술의 연결 밀도보다 2배 높다고 주장했다. 이런 속도라면 소프트웨어가 하나의 거대한 칩처럼 인식하기에 충분하며, 칩의 모든 코어가 다른 칩에 연결된 메모리에 제한 없이 액세스할 수 있다. 

애플의 울트라퓨전 기술은 인피니티 패브릭(Infinity Fabric) 연결이 적용된 AMD의 최신 젠 프로세서의 칩릿 디자인과 유사하지만, 엄청나게 빠를 뿐이다. 


모든 코어와 메모리 대역폭이 2배

M1 울트라는 굉장한 고속 연결을 통해 2개의 M1 맥스 칩이 하나의 패키지로 연결돼 있다. 따라서 기본적으로 모든 것이 M1 맥스의 2배다. 20개의 CPU 코어(성능 코어 16개, 효율 코어 4개), 64개의 GPU 코어, 32개의 뉴럴 엔진 코어, 64GB 또는 128GB RAM과 초당 800GB의 엄청난 메모리 대역폭이 적용됐다. 이는 가장 빠른 데스크톱 CPU보다 몇 배나 높은 대역폭이며, 가장 비싼 수백만 원짜리 그래픽 카드보다 조금 낮은 수준이다. 
 
애플은 M1 울트라의 성능이 코어 i9-12900K를 크게 뛰어넘으며, 코어 i9-12900K와 동일한 성능에서 소모하는 전력이 100W도 되지 않을 것이라고 주장했다.  ⓒ Apple

미디어 엔진도 2개에서 4개로 2배 늘었다. 미디어 엔진은 프로레스(ProRes), H.264, AVC, 기타 보편적인 미디어 형식의 인코딩 및 디코딩을 처리한다. 생업으로 비디오를 제작하고 있다면 M1 울트라를 사용해 크고 복잡한 4K 비디오 내보내기 작업을 빠르게 처리할 수 있다. 사실 애플은 M1 울트라가 18개의 8K 프로레스 422 비디오 스트림을 동시에 재생할 수 있다고 밝혔다. 이것이 의미하는 바를 이해하는 비디오 전문가라면 놀라움을 금치 못할 것이다. 


단순한 성능이 아닌 ‘와트당’ 성능

M1 울트라는 M1 맥스보다 2배 높은 성능을 제공할 것이라 생각하는 사람이 많을 것이다. 애플의 주장도 마찬가지다. 즉, 우리가 예상할 수 있는 긱벤치(Geekbench) 5 싱글 스레드 점수는 1,800점 미만이며 멀티코어 점수는 약 24,000점이다. AMD나 인텔의 대표 데스크톱 프로세서보다 약 80% 빠른 수준이다. 

더 좋은 성능을 얻기 위해서는 코어가 많고 수백 와트의 전력을 소비하는 인텔의 제온이나 AMD의 스레드리퍼(Threadripper) 워크스테이션 프로세서 또는 서버 CPU를 고려해야 하는데, 이것이 M1 울트라의 핵심이다. 애플의 차트에 따르면, M1 울트라의 소비전력은 약 100W다. 엑스박스 시리즈 X 또는 플레이스테이션 5의 절반 수준이다. 

애플은 64개의 코어와 초당 800GB의 메모리 대역폭을 갖춘 M1 울트라가 약 21테라플롭의 성능을 제공할 수 있다고 주장했다. 이는 플레이스테이션 5의 약 2배이며, 지포스 GTX 3070 또는 라데온 6800 XT와 동등하다. 물론 애플의 GPU는 엔비디아나 AMD의 최신 제품과 기능이 동일하지는 않으며(예컨대 레이 트레이싱 기능이 없다), 테라플롭이 GPU 성능을 측정하는 가장 좋은 방법도 아니다. 하지만 애플의 칩은 이런 종류의 성능을 제공하면서도 소비 전력이 수백 와트 낮다. 
 
필자는 M1 울트라의 성능이 GTX 3090의 성능과 일치한다는 애플의 주장에 대해 회의적이지만, 와트당 성능은 아마도 다를 것이다. ⓒ Apple

벤치마크를 직접 수행할 때까지 판단은 미뤄야 하겠지만, 피크 퍼포먼스에서 등장했던 검증되지 않은 긱벤치 점수는 매우 유망해 보인다. 해당 결과에 따르면, M1 울트라는 맥 스튜디오와 맞먹는 가격의 AMD 라이젠 스레드리퍼 3990X 64코어 프로세서와 유사한 수준이다. 

애플은 워크스테이션 수준의 CPU 및 하이엔드 게이밍 GPU와 같은 성능을 낮은 소비 전력으로 제공하는 칩을 만들었다. 머지않아 인텔이나 AMD에서도 더 빠른 칩을 출시할 것임은 분명하다. 두 업체의 데스크톱 GPU는 이미 속도가 빠르지만, 낮은 전력을 소비하면서 이런 성능을 제공할 때까지는 시간이 걸릴 것이다.

M1 울트라는 게이밍 노트북의 전력 수준으로 워크스테이션 데스크톱 성능을 제공하는 제품인 것 같다. 이제 수많은 윈도우 PC 매니아들이 다시 한번 변명과 경고를 늘어놓을 때다. 
editor@itworld.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.