AIㆍML / 디지털 디바이스 / 퍼스널 컴퓨팅

“NPU, 생각만큼 중요하지 않다” 메테오 레이크 즉석 테스트로 확인하는 AI PC 현실 파악

Mark Hachman | PCWorld 2024.01.12
많은 사용자가 이미 AI PC를 사용하고 있는지도 모른다. 지난 몇 개월 동안 인텔과 PC 제조업체는 AI PC를 사방에 떠들고 다녔고, AMD와 퀄컴도 이에 동조했다. AI가 새로운 메타버스라는 것은 더 이상 비밀도 아니며, 업체 경영진과 투자자는 모두 AI를 사용해 매출과 주가를 끌어올리고자 한다.
 
ⓒ Intel

AI PC의 AI는 인텔의 코어 울트라 같은 칩에 탑재된 NPU를 기반으로 한다. 코어 울트라 칩은 이미 온칩 AI의 대명사로 자리 잡고 있다. 데스크톱에서 인텔을 제치고 먼저 NPU를 탑재한 AMD의 라이젠 8000 시리즈와 퀄컴의 스냅드래곤 X 엘리트도 마찬가지이다.

다만 현재 코어 울트라에 탑재된 통합 NPU는 AI 연산에서 기대만큼 큰 역할을 하지는 못한다. NPU보다는 원래 연산을 담당하던 CPU, 특히 GPU가 더 큰 비중을 차지한다.

몇 가지 유의해야 할 점이 있다. 첫째, 실제로 AI 성능을 벤치마킹하는 것은 모두가 고민하는 문제이다. AI는 다양한 작업을 수행한다. 스테이블 디퓨전 같은 이미지 생성부터 마이크로소프트 코파일럿이나 구글 바드 등의 기반이 되는 대규모 언어 모델(LLM), 어도비 프리미어나 라이트룸 등의 AI를 이용한 이미지 개선까지 다양한 애플리케이션별에 사용된다. LLM의 수많은 변수(프레임워크, 모델, 정량화 등 PC에서 챗봇이 실행되는 방식에 영향을 미치는 모든 변수)와 이런 변수가 바뀌는 속도를 생각하면, 승자를 가리기가 매우 어렵다. 

하지만 벤치마킹은 가능한 한 많은 변수를 제거할 때 가장 효과적이다. 인텔의 코어 울트라 칩인 메테오 레이크가 수행하는 AI 연산에 인텔의 CPU, GPU, NPU가 얼마나 기여하는지를 알아보는 것이 바로 이 퍼즐의 작은 조각으로 할 수 있는 일이다.
 
인텔 메테오 레이크의 테스트 기기로 사용된 MSI 노트북. ⓒ Mark Hachman / IDG
 

온칩 AI의 핵심은 NPU가 아니라 GPU

이번 테스트의 목적은 메테오 레이크 칩이 얼마나 뛰어난 AI 성능을 발휘하는지 확인하는 것이 아니라 AI 연산에서 NPU가 실제로 얼마나 중요한지 확인하는 것이다.

테스트에 사용한 벤치마크 프로그램은 다양한 LLM을 프로세서가 얼마나 효과적으로 실행되는지를 측정하는 UL의 프로시온 AI(Procyon AI) 추론 벤치마크로, CPU, GPU, NPU를 비교하고 세분화해 성능을 확인할 수 있다.

테스트는 CES 2024의 인텔 벤치마킹 데이에 테스트용으로 제공된 MSI 노트북에 탑재된 코어 울트라 7 165H를 대상으로 진행했다. 프로시온 AI는 프로세서 상에서 LLM을 실행하고 성능, 지연 시간 등을 기준으로 점수를 계산한다.

테스트 결과는 다음과 같다.
 
  • 프로시온(OpenVINO) NPU : 356
  • 프로시온(OpenVINO) GPU : 552
  • 프로시온(OpenVINO): CPU : 196

프로시온 테스트는 몇 가지 사항을 증명했다. 첫째, NPU는 AI 연산에서 차이를 만든다. CPU의 다른 성능 및 저전력 코어와 비교하면, NPU는 단독으로 82% 더 뛰어난 성능을 발휘한다. 하지만 GPU의 AI 성능은 CPU의 182%에 달하며, NPU보다 55% 더 뛰어나다. 다시 말해, AI 성능이 정말로 중요하다면 먼저 고성능 GPU를 구매하는 것이 좋다.

하지만 두 번째 결론은 그리 확실하지 않다. 물론, 전용 AI 칩 없이도 CPU 또는 GPU에서 AI 애플리케이션을 실행할 수 있다. 프로시온 테스트는 어떤 칩이 더 효과적이라는 것을 보여줄 뿐이다.
 
코어 7 울트라 165H의 프로시온 NPU 추론 테스트 세부 결과. ⓒ Mark Hachman / IDG

인텔은 NPU가 더 효율적이라고 주장한다. 현실 세계에서 "효율성"은 "긴 배터리 수명"을 의미한다. 즉, NPU의 효율성은 배터리 전력을 사용하는 AI 애플리케이션을 더 오래 사용할 수 있도록 해준다. 호텔 방이나 전시장에서 장시간의 화상회의를 하면서 소음과 배경을 필터링하는 데 AI를 사용하는 것이 대표적인 예이다. 또한 인텔은 CPU, GPU, NPU가 함께 작동할 수 있다는 점을 강조한다. 
 
인텔은 처음부터 메테오 레이크의 다양한 요소가 함께 동작한다는 점을 강조했다. ⓒ Intel

스테이블 디퓨전과 같은 애플리케이션은 처음에는 사용자 시스템에서 고성능 GPU와 대용량 VRAM을 사용해 AI 아트를 생성하는 방법으로 출시됐다. 하지만 시간이 지나면서 AI 애플리케이션은 CPU를 주로 사용하는 시스템에서도 실행되도록 발전했다. 예를 들어, 크라이시스처럼 그래픽 집약적인 게임도 통합 그래픽을 탑재한 일반 PC에서 아주 느리지만, 실행할 수는 있다. LLM 기반 챗봇도 마찬가지로 저성능 시스템에서는 오랜 시간 동안 응답을 '생각'한 다음 매우 느리게 '입력'한다. GPU 기반 LLM은 더 나은 성능을 발휘하며, 클라우드 기반 솔루션은 훨씬 더 빠르다.

현재 시점에서 UL의 프로시온은 AMD 라이젠 7040의 CPU와 GPU는 인식하지만, NPU는 인식하지 못한다. 칩 자체의 기본 기능조차도 이를 사용하도록 설계된 애플리케이션에서 인식하지 못할 정도로 초기 단계라고 볼 수 있다. 이 때문에 AI 관련 벤치마크는 훨씬 더 복잡해진다.
 

결론 : 진화하는 AI

현재 시점에서 게임용 노트북이나 데스크톱 PC 사용자는 AI를 실행하는 데 NPU가 필요없다. AMD나 인텔, 퀄컴의 NPU가 있으면 좋겠지만, 반드시 필요한 것은 아니다.

하지만 앞으로도 계속 이렇지는 않을 것이다. 인텔은 올해 말 출시 예정인 루나 레이크 칩의 NPU 성능이 3배 향상될 것이라고 약속했다. CPU나 GPU 성능에 대해서는 언급하지 않았다. 시간이 지남에 따라 다양한 PC 칩에서 NPU의 성능이 향상되고, CPU나 GPU를 큰 격차로 앞서게 될 가능성이 크다. 그렇지 않다면, 수많은 AI 가속기 칩 스타트업은 AI 세계의 3Dfx가 되고 말 것이다.
editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.