엔비디아 수석 과학자 “구식 설계, CPU 속도 향상에 발목”

Joab Jackson | IDG News Service 2010.11.19

전력 효율이 우수한 컴퓨팅에서 공통 작업을 병렬로 실행할 경우에 CPU는 GPU(그래픽 처리장치)를 능가하는 성능을 보여 주기 위해 너무 많은 유보 기능을 부담하고 있다고 GPU 공급사인 엔비디아의 수석 과학자가 말했다.

 

엔비디아의 수석 과학자이자 연구책임자인 빌 돌리는 뉴올리언스에서 개최된 슈퍼컴퓨터 2010 회의의 기조 연설에서 CPU는 오늘날의 컴퓨팅 환경에서 불필요할 수도 있는 작업을 실행하면서 "많은 전력을 소비하고 있다"라고 지적했다.

 

그는 우수한 쓰레드 성능을 얻기 위해 GPU는 "처리능력에 최적화되어 있는데" 반해 "CPU는 지연시간 단축에 최적화되어 있다"고 말했다.

 

돌리는 이어 대다수의 최신 CPU에서 지연시간 단축을 위해 에너지를 낭비하는 몇몇 기능을 지목했다.

 

그는 "이러한 기능들은 프로그램의 분기 여부와 무관하게 각 분기를 예측하는 분기 예측치를 가지고 있는데 이들 예측치가 대량의 전력을 소비한다. 이들 예측치는 메모리 지연시간을 숨기기 위해 명령을 재배열한다. 그 과정에서 많은 전력이 소비된다. 이들 예측치는 많은 해석을 필요로 하는 [일단의] 유보기능 명령을 실행한다. 이 과정이 많은 전력을 소비한다. 이들은 추측 실행을 하고 자신에게 필요지 않을 수도 있는 코드를 실행한 다음에 버린다. 이들 모든 작업이 많은 전력을 소비한다"라고 말했다.

 

GPU는 본질적으로 화면에서 그래픽을 랜더링하도록 디자인되었지만 엔비디아나 AMD와 같은 GPU 제조기업 이제 최소한 여러 부분으로 분할될 수 있고 일렬로 실행될 수 있는 작업 부하를 위해 GPU 카드를 일반 컴퓨팅 엔진으로 배치하고 있다.

 

일부 업계에서는 이 아이디어, 특히 고성능 컴퓨팅(HPC)에 주목하고 있다. 금주 초, 중국이 새로 구축한 티안허-1A(Tianhe-1A) 시스템은 세계 최강 슈퍼컴퓨터의 상위 500 목록의 정점에 자리매김했다. 그 시스템은 1만 4,000개의 CPU에 더하여 엔비디아의 테슬라 M2050 GPU 7,168개를 포함하고 있다. 엔비디아는 그 시스템에 GPU가 없다면 운용을 위해 거의 4배 많은 CPU, 2배의 바닥 면적과 3배의 전력이 필요할 것이라고 주장했다.

 

돌리가 HPC 사용에 대해 초점을 맞추기는 했지만 그는 이러한 일반적인 생각이 컴퓨팅 세계 전체에 확산될 것이라고 주장한다.

 

그는 기조연설 후의 인터뷰에서 "HPC는 더 큰 규모로 작동하기 때문에 더 빨리 문제에 봉착한다는 점에서 여러모로 얼리어답터다. 그러나 이 성능은 서버 애플리케이션에 뿐만 아니라 범용 애플리케이션에서도 마찬가지다"라고 말했다.

 

돌리는 현재의 애플리케이션 중에서 병렬 환경에서 실행되도록 작성된 것이 많지는 않지만 프로그램 작성자들은 결국 이 모델로 옮길 것이라고 예상했다.

 

그는 "시간이 가면 애플리케이션을 병렬로 변환할 것이고 그러한 병렬 세그먼트는 GPU에 적합해질 것"이라고 말했다. 그는 심지어 시스템이 어느 날 CPU뿐만 아니라 GPU 없이 부팅이 가능해질 것이라고 했지만 그는 GPU 기반의 운영 체제를 구축하는 어떤 작업에 대해서도 딱히 아는 것이 없다고 말했다.

 

에너지 사용에서 속성 분배는 GPU 우월성을 주장하려는 돌리에게 중대한 요소의 하나다. 그는 페르미(Fermi)라는 별칭을 가진 엔비디아의 차세대 GPU 구조가 각 명령을 실행하기 위해 200pj(피코줄)의 전력을 소비하는 반면에 CPU는 2nJ(나노줄) 또는 더 큰 자리수의 줄을 소비한다고 말했다.

 

이 작은 차이는 대형 시스템을 거쳐 증폭될 경우에 엄청난 간격으로 벌어진다는 설명이다. 돌리는 엑사스케일 컴퓨터 또는 초당 1퀸티리온의 계산을 실행할 수 있는 컴퓨터 개발에 기금을 투입하려는 미국국방과학기술연구소의 노력을 언급했다. 그는 CPU 단독으로 구축되는 시스템은 에너지 사용 관점에서는 작동을 위해 "옆 건물에 소형 원자력발전소 건설을 필요로 할 것"이라고 주장했다.

 

한편 HPC 지지자들의 모두가 완전히 CPU 대신에 GPU를 사용한다는 생각에 열중하고 있지는 않다. 많은 사람들이 지적하는 한 가지 잠재적인 문제는 GPU가 더 큰 처리능력을 가질 수 있는 반면에 시스템이 그렇게 많은 데이터를 이들 프로세서에 제공하기가 어렵다는 것이다.

 

IBM의 딥 컴퓨팅 부문(Deep Computing) 책임자 데이브 튜렉은 지난 주에 "각각의 GPU가 사용할 수 있는 메모리 량은 매우 적다. 정말 빨리 작동하는 것이 있다면 정말 빨리 작동하도록 할당을 할 필요가 있으며 만일 그 프로세서에 할당하려는 메모리 량이 충분하지 않다면 그 프로세서는 단지 그 시점에 멈추어서 기다릴 것이다"라고 말했다.

 

돌리는 그러나 이 대역폭 문제가 GPU에 국한되는 것이 아니라 CPU도 같은 딜레마에 직면하고 있다고 말했다.

 

그는 "대역폭이 모든 컴퓨팅 시스템에서 큰 문제가 되고 있다"고 말했다. 그는 그러면서도 이 문제가 GPU에 더 심각하다는 점을 인정했다. 엔비디아가 최근에 공개한 GTX 580 카드는 초당 200 기가바이트의 순수 대역폭을 가지고 있는데 반하여 "최고급" CPU는 고작 초당 약 35 기가바이트를 가지고 있다. 그는 "메모리 시스템의 효율이 더 높아져야 할 필요가 있다"고 말했다. editor@idg.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.