디지털 디바이스 / 퍼스널 컴퓨팅

“성능 벤치마크의 표준” 최신 긱벤치 6의 이해

Roman Loyola, Jason Cross | Macworld 2023.02.17
지난 14일 프라이밋 랩(Primate Labs)의 유명 벤치마크 툴 '긱벤치(Geekbench)'의 최신 버전이 공개됐다. 긱벤치 6 은 애플의 맥, 아이폰, 아이패드는 물론 다른 업체 컴퓨팅 기기의 CPU와 GPU 성능을 측정하는 데 널리 활용된다. 이번 업데이트에는 최신 기기가 처리하는 워크로드를 성능 수치에 더 잘 반영하는 내용이 포함돼 있다.
 
ⓒ Primate Labs

긱벤치 개발자 존 풀은 블로그를 통해 "지난 3년간 기술 부문에서 많은 것이 변했다. 스마트폰 카메라 사진은 점점 더 크고 좋아지고 있고, 인공지능, 특히 머신러닝은 일반 및 모바일 애플리케이션에서 약방의 감초처럼 쓰인다. 컴퓨터와 모바일 기기는 코어 수가 계속 늘고 있고 사용자와 상호작용하는 방식도 극적으로 달라졌다. 2020년에 화상 회의가 돌연 급증할 것이라고 누가 예측했겠는가?”라고 설명해다.

긱벤치 6은 최신 워크로드를 한층 더 잘 반영하기 위해 벤치마크에 새로운 작업을 추가했다. 예를 들면, 화상 회의에서 배경 흐리기, SNS용으로 이미지를 필터링하고 조정하기, 사진에서 원치 않는 대상을 자동으로 제거하기, 머신러닝 모델을 활용해 사진에서 대상을 탐지하고 태깅하기, 텍스트를 분석, 처리, 변환하기 위해 스크립트 언어 사용하기 등이다. 데이터 집합 역시 더 큰 파일과 고해상도 이미지로 업데이트됐다. 업체는 "이 새로운 CPU 벤치마크 점수는 데이터 압축, 이미지 처리, 머신러닝, 코드 컴파일 등의 워크로드를 사용해 CPU와 메모리 성능을 평가하고 최적화할 목적으로 활용할 수 있다"라고 설명했다.

또한 새 버전은 긱벤치 5와 성격이 비슷하지만 최신 애플리케이션을 한층 더 잘 나타내기 위해 새로운 데이터 집합 및 라이브러리로 최신 작업을 수행한다. 긱벤치 5 점수와 긱벤치 6 점수를 직접 비교할 수 없다. 특히 멀티코어 성능은 코어 간 작업을 공유하는 새로운 방식을 사용하는데 그 결과, ‘고성능’ 코어와 ‘고효율’ 코어를 갖춘 CPU의 성능이 더 좋게 나온다.

아이폰, 아이패드, 맥 리뷰에 긱벤치를 사용하는 MacWorld 역시 긱벤치 6을 사용할 예정이다. 그러나, 긱벤치 5와 6은 서로 다른 테스트를 사용하므로 긱벤치 5로 기록한 예전 결과를 긱벤치 6과 비교할 수 없다. 단기적으로는 긱벤치 5 결과를 포함시켜 긱벤치 6으로 테스트할 수 없는 구형 기기에 대한 최소한의 판단 자료를 제공하겠지만, 대규모의 테스트를 실시하지 않고 점수를 함께 사용하기는 어렵다.

예를 들어 8코어 CPU와 14코어 GPU가 탑재된 14인치 맥북 프로를 테스트했을 때 긱벤치 6에서는 2,138점(싱글코어)과 8,475점(멀티코어)이 나온 것에 비해 긱벤치 5에서는 1,750점(싱글)과 9,550점(멀티)이다. 10코어 M1 프로와 16코어 GPU가 탑재된 14인치 맥북 프로도 테스트했는데 긱벤치 6 점수는 2,399점(싱글)과 12,289점(멀티), 긱벤치 5 점수는 1,778점(싱글)과 12,544점(멀티)이다. 

긱벤치 6은 개인적인 용도로는 무료이며 긱벤치 사이트 또는 앱 스토어(iOS)에서 다운로드할 수 있다. 프로 버전을 사용하면 휴대용 기기나 네트워크 드라이브에서 앱을 실행한 후 결과를 오프라인에 저장할 수 있으며 테스트 작업을 자동화할 수도 있다. 프로 버전은 상업적인 용도를 위한 라이선스도 제공한다. 긱벤치 6 프로는 99달러지만 2월 28일까지 20% 할인된 가격(79달러)에 판매한다.
 

긱벤치 점수의 의미 

그렇다면 이런 긱벤치 점수는 구체적으로 무엇을 의미하고, 무엇을 측정할까? 긱벤치는 CPU 또는 GPU에 특정 방식으로 압박을 가하는 구체적이고 반복 가능한 일련의 테스트를 실시한 후 이를 숫자로 환산하여 점수로 보여준다. 긱벤치의 테스트와 여기에 사용되는 데이터는 모든 플랫폼에서 같지만 일부 플랫폼에는 파일 압축 같은 일부 작업의 속도를 높일 수 있는 하드웨어가 포함된 경우가 있다. 긱벤치 점수는 높을수록 좋지만 ‘경과 시간’이나 ‘초당 화소 수’와 같은 구체적인 값을 나타내지는 않는다. 단지 종합적으로 판단한 점수로 완전히 ‘합성된’ 벤치마크 겸 점수이다. 하나씩 자세히 살펴보자.

CPU 테스트
CPU 테스트에 포함된 항목은 파일 압축(9,842개의 파일로 구성된 75MB짜리 아카이브를 다양한 방법으로 압축 후 압축 해제), 연속적인 위치 사이에 방향 생성, 8개의 인기 있는 웹 페이지 렌더링, PDF 렌더링, 개발자 스크립트 실행, 대상 탐지 및 배경 흐리기 같은 머신러닝 작업 등이다. 

CPU 테스트에는 2가지 결과 점수가 있다. 싱글 코어는 CPU 코어 한 개에서의 작업 실행 성능을 측정한다. 멀티 코어는 모든 CPU 코어를 사용한다. 둘 다 중요하다. 많은 애플리케이션의 경우 성능이 하나의 기본 쓰레드에 의해 제한되므로 싱글 코어 CPU 성능이 애플리케이션의 실행 속도를 결정한다. 그러나 멀티 스레드가 잘 된 애플리케이션이나 여러 애플리케이션을 동시에 실행하는 경우에는 멀티코어가 전체 최대 CPU 성능을 판단할 수 있는 척도다. 

GPU 테스트 
그래픽 프로세서(GPU) 성능을 측정하는 일은 3D 게임에서 기대할 수 있는 프레임 속도를 파악하는 일과 비슷하다고 생각하기 쉽지만 꼭 그런 것은 아니다. 오히려 긱벤치 테스트는 3D 그래픽 렌더링 성능을 측정하지 않는다. 대신 ‘GPU 컴퓨트’ 작업의 성능을 측정한다. GPU 컴퓨트 작업이란 이미지 가장자리 탐지, 2400만 화소 사진에 가우시안 흐림 효과 적용, 입자 물리학 시뮬레이션, 사진의 얼굴 탐지와 같은 전산 작업을 GPU를 사용해 처리하는 것을 말한다. 

따라서 한 제품이 다른 제품보다 3D 게임 실행 속도는 높은 반면 긱벤치 GPU 컴퓨트 테스트 점수는 낮을 가능성이 충분하다. GPU 컴퓨트 성능과 3D 그래픽 성능이 연관된 경우가 많지만 3D 그래픽 성능을 측정하고 싶다면 긱벤치와 같은 GPU 컴퓨트 벤치마크가 아닌 3D 그래픽 벤치마크를 실행하는 것이 맞다. 

긱벤치 6 GPU 컴퓨트 테스트를 실행할 때 이 테스트에서 사용했으면 하는 API(애플리케이션 프로그래밍 인터페이스: 개발자들이 하드웨어에 말을 거는 방식)를 선택하게 된다. 맥에서는 오픈CL(OpenCL)과 메탈(Metal) 중 선택할 수 있고 아이폰과 아이패드에서는 메탈만 지원된다. 단, API 선택에 따라 테스트 결과는 달라지지 않는다. 단지 애플리케이션이 하드웨어에게 말을 거는 방식만 달라진다. 맥에서는 메탈이 가장 중요한 점수일 것이고 윈도우 PC와 안드로이드에서의 벌컨(Vulkan) 성능과 비교할 수 있다.

더 자세한 내용은 테스트가 상세히 기술된 PDF 백서를 읽어보면 된다. CPU 테스트GPU 컴퓨트 테스트에 대한 백서가 있다.
editor@itworld.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.