2012.11.19

2020년, 엑사급 수퍼컴퓨터가 온다

Joab Jackson | IDG News Service
수퍼컴퓨터의 속도 상승이 현재와 같은 속도도 계속된다면, 2020년에는 엑사급 수퍼컴퓨터가 등장할 것으로 예상된다. 하지만 이런 대형 컴퓨터의 시스템 아키텍트는 몇몇 심각한 문제에 직면할 것으로 보인다.
 
미국 테네시대학의 잭 돈가라 교수는 SC2012 컨퍼런스에서 최신 수퍼컴퓨터 톱 500 목록을 발표하며, “이들 과제가 엑사급 수퍼컴퓨터를 구현하는 데 근본적인 문제가 될 것”이라고 지적했다. 돈가라 교수는 톱 500 수퍼컴퓨터 목록의 책임자 중 한 명이다. 
 
이론적으로 엑사급 성능을 구현하는 방법은 현재로서도 가능하다. 엑사급 수퍼컴퓨터는 1퀸틸리온(quintillion, 백자, 10의 18승) FLOPS 성능을 의미하는 것으로, 현재 가장 빠른 수퍼컴퓨터도 엑사급 컴퓨터의 20% 이하에 불과하다.
 
 
새로운 목표
지난 주 발표된 최신 수퍼컴퓨터 톱 500 목록에서 가장 빠른 수퍼컴퓨터는 미국 오크리지 국립연구소의 타이탄 시스템이 차지했는데, 17.59페타플롭의 성능을 갖추고 있다. 페타플롭은 쿼드릴리언 FLOPS(quadrillion, 백경, 10의 15승) 성능이다.
 
하지만 일년에 두 번 발행되는 톱 500 목록은 수퍼컴퓨터의 성능이 얼마나 빠르게 성장하고 있는가를 보여준다. 목록을 기준으로 판단할 때, 수퍼컴퓨터들은 매 10년마다 10배의 성능을 확보하고 있다. 지난 1996년, 첫번째 테라플롭 수퍼컴퓨터가 목록에 등장했으며, 2008년에 첫번째 페타플롭 컴퓨터가 나타났다. 이런 성장 속도를 기초로 추정할 때, 돈가라는 2020년에는 엑사급 컴퓨터가 등장할 것으로 보고 있다.
 
HPC(High Performance Computing) 업계는 엑사급 컴퓨팅 환경을 주요 이정표로 정하고 있다. 인텔은 파이(Phi)란 이름의 대규모 멀티코어 프로세서를 생산해 왔는데, 2018년 경에는 이 프로세서가 엑사급 컴퓨터의 기반을 제공할 수 있기를 기대하고 있다.
 
돈가라 교수는 엑사급 컴퓨터의 특징에 대해서도 설명했다. 엑사급 컴퓨터는 10만~100만 개의 노드를 갖추고, 순간적으로 10억 쓰레드의 연산을 수행할 수 있을 것이다. 개별 노드의 성능도 1.5~15테라플롭급이며, 노드 간의 연결은 초당 200~400Gbps를 전달할 것으로 예상했다.
 
엑사급 컴퓨터의 비용과 전력 소모가 성능에 맞춰 선형적으로 증가해서는 안된다는 점도 지적했다. 엑사급 성능이라도 비용은 2억 달러, 전력은 20메가와트 이상을 사용해서는 안된다는 것. 돈가라 교수는 엑사급 수퍼컴퓨터의 비용 중 절반이 시스템 메모리에 할당될 것이라고 예상했다. 메모리 업체들의 로드맵을 보면, 2020년엔 32~64페타바이트의 메모리를 구매하는 데 1억 달러 정도가 들 것으로 추정되기 때문이다.


 
소프트웨어의 과제
하드웨어 상의 과제는 물론, 소프트웨어 문제도 해결해야 된다. 가장 큰 문제는 동기화가 될 것으로 보인다. 오늘날의 수퍼컴퓨터는 수많은 노드에 작업을 전달하는데, 노드의 수가 증가하면서 이런 접근 방법을 최적화해야만 한다는 것.
 
돈가라 교수는 “오늘날 병렬 처리 모델은 포크/조인(fork/join) 모델이지만, 엑사급의 병렬 환경에서는 이렇게 할 수 없을 것이다. 모델을 바꿔야만 한다. 한층 더 동기화되어야만 한다”고 강조했다. 같은 맥락에서 노드 간의 전체적인 커뮤니케이션을 줄일 수 있는 알고리즘의 개발도 필요하다.
 
이외에도 고려해야 할 요소가 많다. 소프트웨어는 최적화를 위해 내장 루틴을 반드시 포함하고 있어야 한다. 돈가라 교수는 “최고 성능을 구동될 소프트웨어를 얻기 위해서는 사용자 설정에 의존할 수 없다”고 설명했다. 오류 방지 역시 역시 중요한 기능으로, 결과적으로 재생 가능성, 즉 복잡한 연산을 한 번 이상 실시해도 동일한 결과가 나온다는 것을 보장해야 한다.
 
재생 가능성은 컴퓨터의 기본적인 특징처럼 보이지만, 멀티노드 수퍼컴퓨터에서의 대규모 연산에서는 해결해야 할 과제가 될 수 있다.
 
돈가라 교수는 “연산 방법의 관점에서 비트 단위의 재생 가능성을 보장하는 것은 어려운 일이다”라고지적했다. 가장 큰 문제는 병렬로 연산된 결과를 합치는 것으로, 이들 숫자가 한꺼번에 전달될 때 그 순서를 보장하지 못하면 잘못된 결과를 낳게 된다는 것이다.  editor@itworld.co.kr


2012.11.19

2020년, 엑사급 수퍼컴퓨터가 온다

Joab Jackson | IDG News Service
수퍼컴퓨터의 속도 상승이 현재와 같은 속도도 계속된다면, 2020년에는 엑사급 수퍼컴퓨터가 등장할 것으로 예상된다. 하지만 이런 대형 컴퓨터의 시스템 아키텍트는 몇몇 심각한 문제에 직면할 것으로 보인다.
 
미국 테네시대학의 잭 돈가라 교수는 SC2012 컨퍼런스에서 최신 수퍼컴퓨터 톱 500 목록을 발표하며, “이들 과제가 엑사급 수퍼컴퓨터를 구현하는 데 근본적인 문제가 될 것”이라고 지적했다. 돈가라 교수는 톱 500 수퍼컴퓨터 목록의 책임자 중 한 명이다. 
 
이론적으로 엑사급 성능을 구현하는 방법은 현재로서도 가능하다. 엑사급 수퍼컴퓨터는 1퀸틸리온(quintillion, 백자, 10의 18승) FLOPS 성능을 의미하는 것으로, 현재 가장 빠른 수퍼컴퓨터도 엑사급 컴퓨터의 20% 이하에 불과하다.
 
 
새로운 목표
지난 주 발표된 최신 수퍼컴퓨터 톱 500 목록에서 가장 빠른 수퍼컴퓨터는 미국 오크리지 국립연구소의 타이탄 시스템이 차지했는데, 17.59페타플롭의 성능을 갖추고 있다. 페타플롭은 쿼드릴리언 FLOPS(quadrillion, 백경, 10의 15승) 성능이다.
 
하지만 일년에 두 번 발행되는 톱 500 목록은 수퍼컴퓨터의 성능이 얼마나 빠르게 성장하고 있는가를 보여준다. 목록을 기준으로 판단할 때, 수퍼컴퓨터들은 매 10년마다 10배의 성능을 확보하고 있다. 지난 1996년, 첫번째 테라플롭 수퍼컴퓨터가 목록에 등장했으며, 2008년에 첫번째 페타플롭 컴퓨터가 나타났다. 이런 성장 속도를 기초로 추정할 때, 돈가라는 2020년에는 엑사급 컴퓨터가 등장할 것으로 보고 있다.
 
HPC(High Performance Computing) 업계는 엑사급 컴퓨팅 환경을 주요 이정표로 정하고 있다. 인텔은 파이(Phi)란 이름의 대규모 멀티코어 프로세서를 생산해 왔는데, 2018년 경에는 이 프로세서가 엑사급 컴퓨터의 기반을 제공할 수 있기를 기대하고 있다.
 
돈가라 교수는 엑사급 컴퓨터의 특징에 대해서도 설명했다. 엑사급 컴퓨터는 10만~100만 개의 노드를 갖추고, 순간적으로 10억 쓰레드의 연산을 수행할 수 있을 것이다. 개별 노드의 성능도 1.5~15테라플롭급이며, 노드 간의 연결은 초당 200~400Gbps를 전달할 것으로 예상했다.
 
엑사급 컴퓨터의 비용과 전력 소모가 성능에 맞춰 선형적으로 증가해서는 안된다는 점도 지적했다. 엑사급 성능이라도 비용은 2억 달러, 전력은 20메가와트 이상을 사용해서는 안된다는 것. 돈가라 교수는 엑사급 수퍼컴퓨터의 비용 중 절반이 시스템 메모리에 할당될 것이라고 예상했다. 메모리 업체들의 로드맵을 보면, 2020년엔 32~64페타바이트의 메모리를 구매하는 데 1억 달러 정도가 들 것으로 추정되기 때문이다.


 
소프트웨어의 과제
하드웨어 상의 과제는 물론, 소프트웨어 문제도 해결해야 된다. 가장 큰 문제는 동기화가 될 것으로 보인다. 오늘날의 수퍼컴퓨터는 수많은 노드에 작업을 전달하는데, 노드의 수가 증가하면서 이런 접근 방법을 최적화해야만 한다는 것.
 
돈가라 교수는 “오늘날 병렬 처리 모델은 포크/조인(fork/join) 모델이지만, 엑사급의 병렬 환경에서는 이렇게 할 수 없을 것이다. 모델을 바꿔야만 한다. 한층 더 동기화되어야만 한다”고 강조했다. 같은 맥락에서 노드 간의 전체적인 커뮤니케이션을 줄일 수 있는 알고리즘의 개발도 필요하다.
 
이외에도 고려해야 할 요소가 많다. 소프트웨어는 최적화를 위해 내장 루틴을 반드시 포함하고 있어야 한다. 돈가라 교수는 “최고 성능을 구동될 소프트웨어를 얻기 위해서는 사용자 설정에 의존할 수 없다”고 설명했다. 오류 방지 역시 역시 중요한 기능으로, 결과적으로 재생 가능성, 즉 복잡한 연산을 한 번 이상 실시해도 동일한 결과가 나온다는 것을 보장해야 한다.
 
재생 가능성은 컴퓨터의 기본적인 특징처럼 보이지만, 멀티노드 수퍼컴퓨터에서의 대규모 연산에서는 해결해야 할 과제가 될 수 있다.
 
돈가라 교수는 “연산 방법의 관점에서 비트 단위의 재생 가능성을 보장하는 것은 어려운 일이다”라고지적했다. 가장 큰 문제는 병렬로 연산된 결과를 합치는 것으로, 이들 숫자가 한꺼번에 전달될 때 그 순서를 보장하지 못하면 잘못된 결과를 낳게 된다는 것이다.  editor@itworld.co.kr


X