2019.07.11

최초의 GPU 슈퍼컴 ‘타이탄’의 퇴역과 해체 “비싸고 오래 걸리는 프로젝트”

Andy Patrizio | Network World
2012년 배치된 슈퍼컴퓨터가 7년 간의 고된 작업을 마치고 퇴역한다. 하지만 해체 작업도 만만치 않다.

미 에너지부 오크리지 국립연구소에 있는 크레이 XK7 타이탄 슈퍼컴퓨터는 오는 8월 1일 해체해 부품을 재활용할 계획이다. 27페타플롭 성능의 타이탄 슈퍼컴퓨터는 2012년 데뷔 당시 세계에서 가장 빠른 컴퓨터였으며, 2019년 현재로 10위에 올라 있다.
 
ⓒ Oak Ridge National Laboratory

하지만 시간이 지나면서 컴퓨팅 표준이 바뀌고 괴물 컴퓨터도 고대 문명이 되었다. 타이탄은 16코어 AMD 옵테론과 엔비디아 케플러 세대 프로세서를 사용한다. 오늘날 일반 사용자가 구매하는 게임용 PC에도 더 나은 부품이 탑재되어 있다.

연구소의 타이탄 운영 책임자 스테판 맥낼리는 “타이탄은 자연스러운 소멸 과정을 밟고 있다”며, “현실은 전자의 시간으로 타이탄이 아주 오래됐다는 것이다. 7년 전 휴대폰을 최신 휴대폰과 비교해보라. 기술은 빠르게 발전하고 슈퍼컴퓨터도 예외는 아니다”라고 말했다.

7년 동안 타이탄은 미 에너지부뿐만 아니라 전 세계의 수많은 연구팀을 위해 260억 코어시간 이상의 컴퓨팅 시간을 생성했다. 타이탄은 또 GPU를 사용한 최초의 슈퍼컴퓨터였다. 지금은 당연한 일이지만, 당시로써는 획기적인 사건이었다.

OLCF(Oak Ridge Leadership Computing Facility)는 타이탄을 약 5,500평방미터(6만 평방피트)의 시설에 배치했는데, 타이탄은 이 공간의 1/3을 차지한다. 타이탄을 지원하는 이오스 클러스터와 아틀라스 파일 시스템은 32페타바이트의 데이터를 담고 있다. 

타이탄 규모의 컴퓨터를 해체하는 것은 스위치를 내리는 것처럼 간단하지 않다. 오크리지 연구소가 해체 비용을 밝히지는 않았지만, 논의된 작업 규모만으로도 얼마나 많은 비용이 들지 짐작할 수 있다. 타이탄의 해체에는 오크리지 연구소와 크레이, 외부 계약업체의 인력 41명이 참여한다. OCLF 직원은 실행을 완료하거나 데이터를 저장해야 하는 사용자를 지원하고 이들의 프로젝트를 다른 컴퓨팅 자원으로 이전하는 것을 돕는다.

우선 전기 엔지니어가 9메가와트 용량의 시스템을 안전하게 정지시키고, 클레이 인력이 타이탄의 전자장치와 금속 부품, 캐비닛을 해체해 재활용한다. 별도의 인력은 냉방 시스템을 처리한다. 전체적으로 350톤 규모의 장비와 5톤 규모의 냉방 장비가 제거된다.

구형 장비가 어떻게 처리되는지는 확실하지 않다. 크레이가 회수한 부품을 어떻게 할지는 오크리지 연구소도 모른다. 다만 맥낼리는 타이탄의 부품은 아무 가치가 없다며, “타이탄의 가치는 전체로서의 시스템에 있다”고 말했다.

기존 데이터센터 시설은 2021년 도입된 엑사급 슈퍼컴퓨터인 프론티어(Frontier)를 위해 확장할 예정이다. 프론티어는 AMD 에픽 프로세서와 엔비디아 GPU를 사용한다. 전력과 냉방 시스템의 업그레이드는 타이탄 해체 전부터 진행되고 있다. 타이탄의 해체 작업은 약 1개월 정도가 걸리지만, 아직 타이탄을 사용하고 있는 사용자의 원활한 이전을 보장하기 위해 여러 달이 걸쳐 진행된다. editor@itworld.co.kr


2019.07.11

최초의 GPU 슈퍼컴 ‘타이탄’의 퇴역과 해체 “비싸고 오래 걸리는 프로젝트”

Andy Patrizio | Network World
2012년 배치된 슈퍼컴퓨터가 7년 간의 고된 작업을 마치고 퇴역한다. 하지만 해체 작업도 만만치 않다.

미 에너지부 오크리지 국립연구소에 있는 크레이 XK7 타이탄 슈퍼컴퓨터는 오는 8월 1일 해체해 부품을 재활용할 계획이다. 27페타플롭 성능의 타이탄 슈퍼컴퓨터는 2012년 데뷔 당시 세계에서 가장 빠른 컴퓨터였으며, 2019년 현재로 10위에 올라 있다.
 
ⓒ Oak Ridge National Laboratory

하지만 시간이 지나면서 컴퓨팅 표준이 바뀌고 괴물 컴퓨터도 고대 문명이 되었다. 타이탄은 16코어 AMD 옵테론과 엔비디아 케플러 세대 프로세서를 사용한다. 오늘날 일반 사용자가 구매하는 게임용 PC에도 더 나은 부품이 탑재되어 있다.

연구소의 타이탄 운영 책임자 스테판 맥낼리는 “타이탄은 자연스러운 소멸 과정을 밟고 있다”며, “현실은 전자의 시간으로 타이탄이 아주 오래됐다는 것이다. 7년 전 휴대폰을 최신 휴대폰과 비교해보라. 기술은 빠르게 발전하고 슈퍼컴퓨터도 예외는 아니다”라고 말했다.

7년 동안 타이탄은 미 에너지부뿐만 아니라 전 세계의 수많은 연구팀을 위해 260억 코어시간 이상의 컴퓨팅 시간을 생성했다. 타이탄은 또 GPU를 사용한 최초의 슈퍼컴퓨터였다. 지금은 당연한 일이지만, 당시로써는 획기적인 사건이었다.

OLCF(Oak Ridge Leadership Computing Facility)는 타이탄을 약 5,500평방미터(6만 평방피트)의 시설에 배치했는데, 타이탄은 이 공간의 1/3을 차지한다. 타이탄을 지원하는 이오스 클러스터와 아틀라스 파일 시스템은 32페타바이트의 데이터를 담고 있다. 

타이탄 규모의 컴퓨터를 해체하는 것은 스위치를 내리는 것처럼 간단하지 않다. 오크리지 연구소가 해체 비용을 밝히지는 않았지만, 논의된 작업 규모만으로도 얼마나 많은 비용이 들지 짐작할 수 있다. 타이탄의 해체에는 오크리지 연구소와 크레이, 외부 계약업체의 인력 41명이 참여한다. OCLF 직원은 실행을 완료하거나 데이터를 저장해야 하는 사용자를 지원하고 이들의 프로젝트를 다른 컴퓨팅 자원으로 이전하는 것을 돕는다.

우선 전기 엔지니어가 9메가와트 용량의 시스템을 안전하게 정지시키고, 클레이 인력이 타이탄의 전자장치와 금속 부품, 캐비닛을 해체해 재활용한다. 별도의 인력은 냉방 시스템을 처리한다. 전체적으로 350톤 규모의 장비와 5톤 규모의 냉방 장비가 제거된다.

구형 장비가 어떻게 처리되는지는 확실하지 않다. 크레이가 회수한 부품을 어떻게 할지는 오크리지 연구소도 모른다. 다만 맥낼리는 타이탄의 부품은 아무 가치가 없다며, “타이탄의 가치는 전체로서의 시스템에 있다”고 말했다.

기존 데이터센터 시설은 2021년 도입된 엑사급 슈퍼컴퓨터인 프론티어(Frontier)를 위해 확장할 예정이다. 프론티어는 AMD 에픽 프로세서와 엔비디아 GPU를 사용한다. 전력과 냉방 시스템의 업그레이드는 타이탄 해체 전부터 진행되고 있다. 타이탄의 해체 작업은 약 1개월 정도가 걸리지만, 아직 타이탄을 사용하고 있는 사용자의 원활한 이전을 보장하기 위해 여러 달이 걸쳐 진행된다. editor@itworld.co.kr


X