2020.11.06

"그래픽에 강한 노트북 목표"…인텔 아이리스 Xe 맥스 GPU 개발 어디까지 왔나?

Mark Hachman | PCWorld
지난주 인텔이 아이리스 Xe 맥스 그래픽이 게이밍 분야에서 엔비디아의 지포스 MX350보다 성능이 뛰어날 뿐 아니라, 일부 인코딩 작업에서는 지포스 RTX 2080보다 뛰어나다고 주장했다. 전력 공유와 고유의 딥 링크(Deep Link) 기술을 고려하면, 11세대 코어 타이거 레이크 CPU와 아이리스 Xe 맥스 GPU 사양이 미래형 노트북에 더욱 적합해 보인다.

코드명 DG1로 알려진 이 인텔의 외장형 GPU는 1998년의 인텔 i740이후 처음으로 에이서 스위프트 3x, 에이수스 비보북 플립TP470, Dell인스피론 15 7000 투인원 등 얇고 가벼운 메인스트림 PC에서 모습을 드러냈다. 아이리스 Xe 맥스는 게이밍용 모바일 GPU와 모바일 라이젠 및 코어 프로세서에 포함된 통합형 그래픽 사이의 차이를 가르는 엔비디아의 지포스 MX350 및  MX450과 대결한다.

아이리스 Xe 맥스의 주 사용자 층으로 인텔은 ‘모바일 크리에이터’를 꼽는다. 그 이유는 쉽게 알 수 있다. 인텔의 데이터에 따르면 타이거 레이크-아이리스 Xe LP 콤보가 아이스레이크-지포스 MX350 노트북보다 성능이 약간 더 앞선다. 큰 차이는 아니다. 실제로 프레임률도 초당 45프레임 이상으로 오르지 않는다. 인코딩 작업에서는 차이가 더 크다. 20~40% 수준이며, 경우에 따라 더 클 때도 있다.

인텔의 기술 전략에서는 미래의 노트북에 대한 흥미로운 전망을 엿볼 수 있다. 인텔 CPU와 외장형 GPU 조합은 단명했던 케이비레이크 G부터 시작됐고, 인텔은 여기에서 배운 것을 아이리스 Xe 맥스에 적용했다. 아이리스 Xe 맥스는 이미 타이거 레이크에 내장되어 있는 통합형 그래픽을 별도의 부품으로 분리하여 딥 링크를 통해 함께 작동하도록 한다. 같은 GPU 2개가 함께 작동하는 느낌인데 사실 꼭 그렇지만은 않다.
 

아이리스 Xe 맥스 그래픽, 얼마나 빠를까?

인텔의 외장형 GPU 마케팅 이사 대런 맥피는 타이거 레이크에 내장된 Xe-LP GPU와 아이리스 Xe 맥스가 공유하는 IP 및 사양 측면에서 ‘이란성 쌍둥이’라고 말한다. 아이리스 Xe 맥스는 더 빠른 클럭 속도를 제공하며, 특이하게도 LPDDF4x 메모리를 선택했다.

우선, 수치부터 보자. 아래 그림과 같이 인텔의 오리지널 타이거 레이크 제품 표에그래픽 주파수가 나열된 것이 보인다. 아이리스 Xe 맥스 GPU는 타이거레이크-LP GPU의 한 버전이지만 더 빠른 1.65GHz로 작동한다. 아이리스 Xe 맥스에는 96개의 EU도 내장되어 있다. 타이거 레이크 GPU와의 유사성은 메모리에서도 찾아볼 수 있다. 일반적인 GDDR 메모리 대신에 아이리스 Xe 맥스는 타이거 레이크와 동일하게 4GB의 LPDDR4x 메모리를 사용한다.
 
ⓒ INTEL

인텔의 CCG(Client Computing Group) 그래픽 제품 마케팅 부서의 조쉬 모스는 인텔 아이리스 Xe 맥스는 타이거 레이크와 다른 라이브러리를 사용하여 주파수가 더 높지만 ‘타이거 레이크와 비슷한 점이 많다’라고 말했다.

아이리스 Xe 맥스의 기술 사양은 다음과 같다. 타이거 레이크 제품군과 대부분 특징이 같다. PCIe 4.0, 최대 4대 디스플레이 연결, 디스플레이포트를 통한 최대 8K 지원.
 
ⓒ INTEL

또한 인텔은 아이리스 Xe 맥스가 게이밍에서 엔비디아의 지포스 MX 시리즈와 경쟁할 것이라는, 약간 이른 듯한 미확인 데이터도 일부 공개했다.
 
ⓒ INTEL

인텔은 2021년 초부터 DG2의 판매를 시작한다. 게이밍 PC용으로 설계된 ‘Xe HPG’ 제품의 코드명이다. 예상치 못한 점은 2021년 전반기에 타이거 레이크에 내장된 보급형 Xc LP 그래픽을 보급형 데스크톱 PC에까지 적용할 것이라는 발표였다.
 

아이리스 Xe 맥스가 CPU와 GPU 사이에서 전원을 공유하는 방식

이면의 메시지는 단순하다. 인텔 타이거 레이크 CPU와 외장형 아이리스 Xe 맥스 칩이 탑재된 노트북을 사면 시너지를 얻게 된다. 모스에 따르면, 거의 동일한 반도체 2개를 동시에 활용하게 되며 일반적인 소프트웨어 프레임워크를 통해 연동한다. (물리적으로는 4개의 PCI 익스프레스 4.0 링크를 통해 연결된다고 인텔의 대변인이 밝혔다.)

하지만 우선은 AMD GPU와 인텔 CPU를 조합하여 케이비레이크-G 칩을 만들면서 배운 것이 있다. 게이밍 노트북은 GPU와 CPU를 최대 성능으로 작동하고, 인텔 다이내믹 튜닝(Dynamic Tuning) 기술로 CPU와 GPU 사이에서 전원을 조정하여 전체적인 열 예산을 유지한다. 이제 이 기법이 아이리스 Xe 맥스에도 적용된다.

모스는 어떤 작업 부하가 실행 중이며 시스템 및 운영체제 수준에서 어떤 일이 벌어지고 있는지, 그리고 온도와 열 효율 상황을 알면 “각각 어느 정도 전원을 공급할 수 있는지 알 수 있다”라고 말했다. 드라이버 소프트웨어는 열 측정값, 활용도 등을 기준으로 각각의 전원 레벨을 실시간으로 조정한다. “따라서 CPU 중심적인 작업 부하라서 GPU가 작동하지 않는 상황에서는 전원을 CPU로 몰아주고, GPU에 동력이 필요한 경우에는 GPU로 전원을 몰아주는” 배분이 가능하다.
 
ⓒ INTEL

이미 경쟁사에서도 이런 기법을 적용했다. 올해 초 AMD가 스마트시프트(SmartfShift) 기술을 선보였다. 안타깝게도 PC 제조 업체의 보수적인 계획 때문에 이 기술은 델의 G5 15 SE 노트북에만 적용되었다.

인텔의 딥 링크도 작동 방식은 유사하다. 다음 슬라이드에서 소프트웨어 프레임워크가 타이거 레이크 CPU와 함께 아이리스 Xe 맥스를 인식하고 있다. 그리고 결합된 AI(VNNI와 DP4a) 및 각 반도체의 여러 미디어 인코더를 활용하여 모두 동시에 작동하도록 한다.
 
ⓒ INTEL

이 방식은 다양하게 적용될 수 있다. 예를 들어, 한 시연에서 인텔은 토파즈 랩스(Topaz Labs)의 기가픽셀(Gigapixel) 업스케일러 알고리즘을 사용하여 140만 화소 이미지에 디테일을 더함으로써 2,300만 화소 수준으로 업스케일했다. 텐서플로우를 사용하는 10세대 아이스레이크/지포스 MX350 노트북과 타이거 레이크/아이리스 Xe 맥스 시스템을 비교했고, 인텔 시스템이 7배나 빨리 여러 장의 사진을 업스케일할 수 있음을 발견했다고 발표했다. (지포스 MX450으로는 테스트할 시스템이 없었다는 것이 인텔 임원들의 설명이다.)

두 번째 테스트에서 인텔은 RTX2080 GPU가 탑재된 코어 i9-10980K 시스템과 코어 i7-1165G7 및 아이리스 Xe 맥스를 비교했다. 핸드브레이크를 사용하여 10개의 1분 길이 동영상을 4K/60 AVC에서 1080p/60 HEVC로 트랜스코딩하자, 인텔 시스템에서 같은 작업을 1.78배 더 빨리 완료했다.

이 속도를 최대한 활용할 수 있는 일련의 애플리케이션을 공개하기도 했다. 핸드브레이크, OBS(Open Broadcaster Software), 토파즈 기가픽셀 AI(Topaz Gigapixel AI), x스플릿(xSplit), 후야(Huya), 조이(Joyy), Lc0(Leela Chess 0), 샤오훌루(Xiaohulu) 등이 바로 그것이다. 블렌더(Blender), 사이버링크(CyberLink), 플루엔도(Fluendo), 매직스 소프트웨어(Magix Software)도 곧 지원될 것이라고 모스가 말했다.
 
ⓒ INTEL

또한 모스는 인텔이 2021년 전반기에 싱글 스트림 인코딩에 대한 개념 증명을 출시할 수 있기를 기대하고 있다고 말했다. 인텔 대변인은 구현을 최종화한 후 핸드브레이크 구동 엔진인 FFMPEG로 전송하는 것에 달려 있다고 덧붙였다.

흥미로운 점은 일부 애플리케이션과 게임이 타이거 레이크/아이리스 Xe 맥스 결합 시스템에서 잘 작동하지 않는 경우가 있고, GPU 내장 타이거 레이크 프로세서에서 프레임률이 더 증가한다는 것이다. 두 GPU 사이의 지연 속도가 주된 이유다. 이런 경우 모스는 시스템이 스마트하게 가장 적절한 GPU로 그래픽 작업 부하를 구성한다고 말했다.
 
ⓒ INTEL


여러 제품이 지속적으로 개선되면서 인텔은 계획이 잘 진행되고 있다고 느끼는 것 같다. 맥피에 따르면, 인텔이 아이리스 Xe 맥스(DG1)가 아닌 DG2로 외장형 그래픽 시장에 진입할 수 있는 내부 소프트웨어를 개발할 수 있는 ‘매우 전략적 요소’가 다름 아닌 아이리스 Xe 맥스다. 이후 차세대 Xe-HPG를 패키지 딜로 마케팅하여 CPU와 GPU의 조합을 활용함으로써 성능 수치를 상대적으로 높일 가능성이 매우 높아 보인다. 과연 결과는 어떨까? 발매는 이제 1년 앞으로 다가왔다. editor@itworld.co.kr 


2020.11.06

"그래픽에 강한 노트북 목표"…인텔 아이리스 Xe 맥스 GPU 개발 어디까지 왔나?

Mark Hachman | PCWorld
지난주 인텔이 아이리스 Xe 맥스 그래픽이 게이밍 분야에서 엔비디아의 지포스 MX350보다 성능이 뛰어날 뿐 아니라, 일부 인코딩 작업에서는 지포스 RTX 2080보다 뛰어나다고 주장했다. 전력 공유와 고유의 딥 링크(Deep Link) 기술을 고려하면, 11세대 코어 타이거 레이크 CPU와 아이리스 Xe 맥스 GPU 사양이 미래형 노트북에 더욱 적합해 보인다.

코드명 DG1로 알려진 이 인텔의 외장형 GPU는 1998년의 인텔 i740이후 처음으로 에이서 스위프트 3x, 에이수스 비보북 플립TP470, Dell인스피론 15 7000 투인원 등 얇고 가벼운 메인스트림 PC에서 모습을 드러냈다. 아이리스 Xe 맥스는 게이밍용 모바일 GPU와 모바일 라이젠 및 코어 프로세서에 포함된 통합형 그래픽 사이의 차이를 가르는 엔비디아의 지포스 MX350 및  MX450과 대결한다.

아이리스 Xe 맥스의 주 사용자 층으로 인텔은 ‘모바일 크리에이터’를 꼽는다. 그 이유는 쉽게 알 수 있다. 인텔의 데이터에 따르면 타이거 레이크-아이리스 Xe LP 콤보가 아이스레이크-지포스 MX350 노트북보다 성능이 약간 더 앞선다. 큰 차이는 아니다. 실제로 프레임률도 초당 45프레임 이상으로 오르지 않는다. 인코딩 작업에서는 차이가 더 크다. 20~40% 수준이며, 경우에 따라 더 클 때도 있다.

인텔의 기술 전략에서는 미래의 노트북에 대한 흥미로운 전망을 엿볼 수 있다. 인텔 CPU와 외장형 GPU 조합은 단명했던 케이비레이크 G부터 시작됐고, 인텔은 여기에서 배운 것을 아이리스 Xe 맥스에 적용했다. 아이리스 Xe 맥스는 이미 타이거 레이크에 내장되어 있는 통합형 그래픽을 별도의 부품으로 분리하여 딥 링크를 통해 함께 작동하도록 한다. 같은 GPU 2개가 함께 작동하는 느낌인데 사실 꼭 그렇지만은 않다.
 

아이리스 Xe 맥스 그래픽, 얼마나 빠를까?

인텔의 외장형 GPU 마케팅 이사 대런 맥피는 타이거 레이크에 내장된 Xe-LP GPU와 아이리스 Xe 맥스가 공유하는 IP 및 사양 측면에서 ‘이란성 쌍둥이’라고 말한다. 아이리스 Xe 맥스는 더 빠른 클럭 속도를 제공하며, 특이하게도 LPDDF4x 메모리를 선택했다.

우선, 수치부터 보자. 아래 그림과 같이 인텔의 오리지널 타이거 레이크 제품 표에그래픽 주파수가 나열된 것이 보인다. 아이리스 Xe 맥스 GPU는 타이거레이크-LP GPU의 한 버전이지만 더 빠른 1.65GHz로 작동한다. 아이리스 Xe 맥스에는 96개의 EU도 내장되어 있다. 타이거 레이크 GPU와의 유사성은 메모리에서도 찾아볼 수 있다. 일반적인 GDDR 메모리 대신에 아이리스 Xe 맥스는 타이거 레이크와 동일하게 4GB의 LPDDR4x 메모리를 사용한다.
 
ⓒ INTEL

인텔의 CCG(Client Computing Group) 그래픽 제품 마케팅 부서의 조쉬 모스는 인텔 아이리스 Xe 맥스는 타이거 레이크와 다른 라이브러리를 사용하여 주파수가 더 높지만 ‘타이거 레이크와 비슷한 점이 많다’라고 말했다.

아이리스 Xe 맥스의 기술 사양은 다음과 같다. 타이거 레이크 제품군과 대부분 특징이 같다. PCIe 4.0, 최대 4대 디스플레이 연결, 디스플레이포트를 통한 최대 8K 지원.
 
ⓒ INTEL

또한 인텔은 아이리스 Xe 맥스가 게이밍에서 엔비디아의 지포스 MX 시리즈와 경쟁할 것이라는, 약간 이른 듯한 미확인 데이터도 일부 공개했다.
 
ⓒ INTEL

인텔은 2021년 초부터 DG2의 판매를 시작한다. 게이밍 PC용으로 설계된 ‘Xe HPG’ 제품의 코드명이다. 예상치 못한 점은 2021년 전반기에 타이거 레이크에 내장된 보급형 Xc LP 그래픽을 보급형 데스크톱 PC에까지 적용할 것이라는 발표였다.
 

아이리스 Xe 맥스가 CPU와 GPU 사이에서 전원을 공유하는 방식

이면의 메시지는 단순하다. 인텔 타이거 레이크 CPU와 외장형 아이리스 Xe 맥스 칩이 탑재된 노트북을 사면 시너지를 얻게 된다. 모스에 따르면, 거의 동일한 반도체 2개를 동시에 활용하게 되며 일반적인 소프트웨어 프레임워크를 통해 연동한다. (물리적으로는 4개의 PCI 익스프레스 4.0 링크를 통해 연결된다고 인텔의 대변인이 밝혔다.)

하지만 우선은 AMD GPU와 인텔 CPU를 조합하여 케이비레이크-G 칩을 만들면서 배운 것이 있다. 게이밍 노트북은 GPU와 CPU를 최대 성능으로 작동하고, 인텔 다이내믹 튜닝(Dynamic Tuning) 기술로 CPU와 GPU 사이에서 전원을 조정하여 전체적인 열 예산을 유지한다. 이제 이 기법이 아이리스 Xe 맥스에도 적용된다.

모스는 어떤 작업 부하가 실행 중이며 시스템 및 운영체제 수준에서 어떤 일이 벌어지고 있는지, 그리고 온도와 열 효율 상황을 알면 “각각 어느 정도 전원을 공급할 수 있는지 알 수 있다”라고 말했다. 드라이버 소프트웨어는 열 측정값, 활용도 등을 기준으로 각각의 전원 레벨을 실시간으로 조정한다. “따라서 CPU 중심적인 작업 부하라서 GPU가 작동하지 않는 상황에서는 전원을 CPU로 몰아주고, GPU에 동력이 필요한 경우에는 GPU로 전원을 몰아주는” 배분이 가능하다.
 
ⓒ INTEL

이미 경쟁사에서도 이런 기법을 적용했다. 올해 초 AMD가 스마트시프트(SmartfShift) 기술을 선보였다. 안타깝게도 PC 제조 업체의 보수적인 계획 때문에 이 기술은 델의 G5 15 SE 노트북에만 적용되었다.

인텔의 딥 링크도 작동 방식은 유사하다. 다음 슬라이드에서 소프트웨어 프레임워크가 타이거 레이크 CPU와 함께 아이리스 Xe 맥스를 인식하고 있다. 그리고 결합된 AI(VNNI와 DP4a) 및 각 반도체의 여러 미디어 인코더를 활용하여 모두 동시에 작동하도록 한다.
 
ⓒ INTEL

이 방식은 다양하게 적용될 수 있다. 예를 들어, 한 시연에서 인텔은 토파즈 랩스(Topaz Labs)의 기가픽셀(Gigapixel) 업스케일러 알고리즘을 사용하여 140만 화소 이미지에 디테일을 더함으로써 2,300만 화소 수준으로 업스케일했다. 텐서플로우를 사용하는 10세대 아이스레이크/지포스 MX350 노트북과 타이거 레이크/아이리스 Xe 맥스 시스템을 비교했고, 인텔 시스템이 7배나 빨리 여러 장의 사진을 업스케일할 수 있음을 발견했다고 발표했다. (지포스 MX450으로는 테스트할 시스템이 없었다는 것이 인텔 임원들의 설명이다.)

두 번째 테스트에서 인텔은 RTX2080 GPU가 탑재된 코어 i9-10980K 시스템과 코어 i7-1165G7 및 아이리스 Xe 맥스를 비교했다. 핸드브레이크를 사용하여 10개의 1분 길이 동영상을 4K/60 AVC에서 1080p/60 HEVC로 트랜스코딩하자, 인텔 시스템에서 같은 작업을 1.78배 더 빨리 완료했다.

이 속도를 최대한 활용할 수 있는 일련의 애플리케이션을 공개하기도 했다. 핸드브레이크, OBS(Open Broadcaster Software), 토파즈 기가픽셀 AI(Topaz Gigapixel AI), x스플릿(xSplit), 후야(Huya), 조이(Joyy), Lc0(Leela Chess 0), 샤오훌루(Xiaohulu) 등이 바로 그것이다. 블렌더(Blender), 사이버링크(CyberLink), 플루엔도(Fluendo), 매직스 소프트웨어(Magix Software)도 곧 지원될 것이라고 모스가 말했다.
 
ⓒ INTEL

또한 모스는 인텔이 2021년 전반기에 싱글 스트림 인코딩에 대한 개념 증명을 출시할 수 있기를 기대하고 있다고 말했다. 인텔 대변인은 구현을 최종화한 후 핸드브레이크 구동 엔진인 FFMPEG로 전송하는 것에 달려 있다고 덧붙였다.

흥미로운 점은 일부 애플리케이션과 게임이 타이거 레이크/아이리스 Xe 맥스 결합 시스템에서 잘 작동하지 않는 경우가 있고, GPU 내장 타이거 레이크 프로세서에서 프레임률이 더 증가한다는 것이다. 두 GPU 사이의 지연 속도가 주된 이유다. 이런 경우 모스는 시스템이 스마트하게 가장 적절한 GPU로 그래픽 작업 부하를 구성한다고 말했다.
 
ⓒ INTEL


여러 제품이 지속적으로 개선되면서 인텔은 계획이 잘 진행되고 있다고 느끼는 것 같다. 맥피에 따르면, 인텔이 아이리스 Xe 맥스(DG1)가 아닌 DG2로 외장형 그래픽 시장에 진입할 수 있는 내부 소프트웨어를 개발할 수 있는 ‘매우 전략적 요소’가 다름 아닌 아이리스 Xe 맥스다. 이후 차세대 Xe-HPG를 패키지 딜로 마케팅하여 CPU와 GPU의 조합을 활용함으로써 성능 수치를 상대적으로 높일 가능성이 매우 높아 보인다. 과연 결과는 어떨까? 발매는 이제 1년 앞으로 다가왔다. editor@itworld.co.kr 


X