디지털 디바이스 / 모바일 / 미래기술 / 태블릿

엔비디아의 신형 테그라 X1 칩에 대해 알아야 할 모든 것

Ryan Whitwam | Greenbot 2015.02.10

전통적인 PC 시장이 하향세에 접어들자 PC 그래픽 카드 분야의 강자 엔비디아는 진작부터 모바일 시장으로 눈길을 돌렸다. 엔비디아의 ARM 기반 시스템 온 칩(SoC)인 테그라 제품군은 데스크톱에 육박하는 성능을 제공하면서 모바일 컴퓨팅 혁신의 시험대 역할을 해왔다.

엔비디아가 새로운 데스크톱 GPU 아키텍처를 모바일로 구현해 이번에 발표한 테그라 X1 역시 중요한 의미를 가진 칩이다. 무엇보다 의외인 점은 엔비디아 자체의 맞춤형 “덴버” CPU 코어 대신 ARM 레퍼런스 디자인을 택했다는 것이다. 테그라 X1에 대해 알아야 할 부분들을 살펴보자.

CPU
시스템 온 칩에는 CPU, GPU, 메모리 컨트롤러, 이미지 신호 프로세서를 비롯한 다양한 구성 요소가 포함된다. 테그라 X1은 64비트 ARMv8 프로세싱 코어를 사용한다(K1 첫 버전은 32비트 ARMv7 코어를 사용했다). 그러나 이번에 엔비디아는 테그라 K1 두 번째 버전에서 구현한 자체 맞춤형 “덴버” CPU 코어가 아닌 표준 ARM 레퍼런스 코어를 선택했다.

엔비디아는 맞춤형 64비트 덴버 CPU를 위한 명령어 집합 라이선스 비용으로 ARM에게 상당한 금액을 지불했는데, 어째서 벌써 사용을 중단했을까? 엔비디아에 따르면 이는 인텔과 유사한 틱톡 하드웨어 전략에 따른 것이다. 이전 테그라 K1은 2개의 덴버 CPU 코어로 작동했으며 28nm 제조 공정으로 생산됐다. 엔비디아는 테그라 X1에서 칩 공정을 더 줄여 20nm로 생산하고자 했다. 제조 공정을 줄이면 칩에 올라가는 트랜지스터 수는 그만큼 늘어나고, 동일한 성능에서 전력 소비량은 더 줄어든다. 모바일 기기에서는 열 설계 전력(TDP)이 매우 중요하다.


테그라 X1은 현재 ARM 레퍼런스 코어를 사용한 8코어 칩이다.

즉, 엔비디아가 자체 CPU 코어 설계를 사용하지 않은 것은 덴버 아키텍처가 아직 20nm 공정을 사용할 준비가 되지 않았기 때문인 듯하다. 테그라 차기 버전의 코드명은 “파커(Parker)”다. 파커는 덴버 CPU 코어의 뒤를 잇는 제품이 될 수 있지만, 엔비디아의 정확한 의중은 아직 알 수 없다. 이전 로드맵상에는 파커에 16nm 공정이 사용되는 것으로 나와 있으나 이는 연기된 것으로 보인다.

그렇다면 작년 K1과 상황이 똑 같은 셈이다. 먼저 표준 ARM CPU 코어와 케플러 GPU를 사용하는 쿼드코어 칩이 나왔고(실드 태블릿에 사용된 칩), 몇 달 후 후속 K1 버전(넥서스 9에 사용된 칩)에서는 64비트 덴버 코어와 케플러의 조합이 사용됐다. 따라서 덴버의 20nm 버전은 X1의 향후 버전에 도입된다고 예상할 수 있다. 다만 지금 당장은 라이선스된 표준 ARM 코어가 사용되며 이 코어도 충분한 성능을 제공한다.

테그라 X1은 코텍스-A57 코어 4개(“빅” 코어)와 코텍스-A53 코어 4개(“리틀” 코어)로 구성된다. 빅 코어는 빠르고 전력 소비량도 더 크며, 리틀 코어는 백그라운드 프로세싱에 적합하고 전력 효율성이 높다. 이 8개 코어 구성을 사용하는 칩은 대부분 빅.리틀(big.LITTLE)이라는 ARM 시스템을 사용한다. 이 기술의 최신 버전은 ‘전역 작업 스케줄링(Global Task Scheduling)’을 사용해서 두 CPU 구역 간에 데이터를 이동한다. 최신 전역 작업 스케줄링 기술(이종 멀티 프로세싱(heterogeneous multi-processing)이라고도 함)은 8개의 빅/리틀 코어를 자유롭게 조합할 수 있다.

엔비디아는 8개 코어를 제어하기 위해 ARM 방식을 사용하지 않고, 직접 고안한 캐시 일치(cache coherence) 시스템과 클러스터 마이그레이션을 사용하여 두 구역 사이에서 데이터를 움직인다. 이 모델에서 OS 스케줄러는 한 번에 하나의 클러스터(빅 또는 리틀)만 볼 수 있다.

이것은 무엇을 의미할까? 테그라 X1은 한 번에 하나의 코어 집합에서만 프로세스를 실행하지만, 데이터는 소비 전력이 큰 빅 코어와 전력 효율성이 높은 리틀 코어 사이를 오갈 수 있음을 의미한다. 일반적으로 클러스터 마이그레이션은 전역 작업 스케줄링보다 효율성이 떨어지지만, 엔비디아는 맞춤형 인터커넥트 기술을 통해 클러스터 관리의 전력 효율성을 대폭 개선했다고 주장한다.


테그라 X1은 K1과 비교해 상당한 성능 향상을 이루었는데, 대부분은 새로운 GPU에 의한 것이다.

이는 엔비디아가 처음하는 시도가 아니다. 엔비디아는 전통적인 고성능 CPU 코어와 저전력 코어를 함께 사용하기 위한 시스템을 최초로 고안한 SoC 제조업체 중 하나다. 엔비디아는 이 설계에 “컴패니언 코어(companion core)”라는 이름을 붙였다가 이후 훨씬 더 심심한 “4-플러스-1”이라는 이름으로 바꿨다. 이 기술은 테그라 3에 처음 도입됐는데, 당시엔 1개의 저속 코어텍스-A9와 4개의 표준 A9 조합이 사용됐다. 엔비디아 엔지니어들이 지난 몇 년 동안 ARM 코어에 대한 경험을 충분히 축적했다고 본다면, 이번 맞춤형 멀티 프로세싱 구조는 더 효과적일 것이라고 기대할 수 있다.

Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.