2020.04.03

“분산 컴퓨팅의 승리” 엑사플롭의 장벽을 먼저 넘은 수천 대의 PC

Andy Patrizio | Network World
미국에서는 엑사플롭(exaFLOP)의 장벽을 넘는 첫 슈퍼컴퓨터 자리를 노리는 경쟁이 치열하다. 인텔은 2021년 오로라(Aurora)가 첫 주자가 될 것이라고 말하고, AMD와 클레이는 자사가 개척자가 될 것이라고 말한다. 다른 한편으로는 미국 에너지부가 승자가 될 것이다. 두 컴퓨터 모두 에너지부 시설에 배치될 것이기 때문이다.
 
ⓒ GettyImagesBank

엑사플롭은 1초에 퀸틸리언(quintillion, 1018, 100경)번의 부동소수점 연산을 하는 성능으로, 1,000페타플롭이다. 사람이 만약 1초에 한 번씩 계산을 한다면, 31,688,765,000년 동안 계산을 해야만 하는 성능이다.

이처럼 슈퍼컴퓨팅 전문업체들의 도전이 계속되는 가운데, 폴딩앳홈(Folding@Home)이 IBM이나 인텔, 엔비디아, 미국 에너지부보다 먼저 엑사플롭의 장벽을 넘어섰다.

폴딩앳홈은 20년 역사를 자랑하는 분산 컴퓨팅 프로젝트이다. 처음에는 스탠퍼드 대학 화학과에서 관리했다가 지난 해 워싱턴 대학이 맡았다. 이 프로젝트의 소프트웨어는 개인 PC에서 실행되며, PC를 사용 중일 때는 대기 상태를 유지하다가 PC가 대기 상태일 때 본격적으로 작동한다.

이 프로젝트는 단백질의 비정상적인 접힘이 어떻게 발생하고 암이나 알츠하이머병 같은 질병을 유발하는지를 시뮬레이션한다. 접힘은 단백질의 자체 조립 과정을 말하는 것으로, 단백질이 잘못 접히면 질병이 발생한다. 폴딩앳홈은 단백질의 비정상적인 접힘을 시뮬레이션해 이런 현상이 발생하는 원인과 방지할 방법을 찾는다. 20년을 거치면서 이 프로젝트는 화학 및 분자 생물학 박사들만 이해할 수 있는 233건의 연구 논문을 발표했다.

이 프로젝트의 기술적인 과제는 단백질 접힘이 100분의 1초 만에 일어나기 때문에 이 과정과 모든 잠재적 변수를 시뮬레이션하는 데 엄청난 양의 연산이 필요하다는 것이다. 분산 컴퓨팅이 필요한 부분이다. 폴딩앳홈은 기본적으로 무차별 대입을 시도하고 실패하는 방식으로 동작한다. 이 소프트웨어를 실행하는 모든 컴퓨터는 단백질 접힘의 변수 하나를 분자 수준에서 시도하고 결과가 나올 때까지 계속한다.

이 프로젝트는 주로 암이나 파킨슨병, 에이즈, 에볼라 등의 질병에 중점을 뒀는데, 지난 2월부터는 코로나19도 추가하고 관련 단백질의 역학을 시뮬레이션하기 시작했다. 코로나19의 경우, 폴딩앳홈은 바이러스가 인간의 ACE2 수용체와 상호작용하는 방법을 파악하고자 한다. 이 과정을 통해 바이러스는 인간 숙주의 세포로 침투한다. 또한 연구원들이 새로운 치료 항체를 설계해 이 상호작용을 파괴할 수 있을지도 연구한다. 간단히 말해 바이러스가 사람의 세포로 침투하는 것을 막을 방법을 찾고 있다.

이 프로그램을 맡고 있는 워싱턴대학 교수 그레그 바우먼 박사에 따르면, 폴링앳홈은 2월에 3만 명의 자원자로 구동되다가 3월에는 무려 40만 명, 그리고 70만 명까지 참여자가 증가했다. 자원자가 너무 많아 컴퓨터에서 돌릴 잠재적 시뮬레이션 데이터베이스가 다 떨어질 정도이다.

지난 주 폴딩앳홈 관리자는 네트워크가 엑사플롭 마크를 넘었다고 발표했다. 최고 성능은 무려 1.5엑사플롭을 기록했다. 이는 세계 최고의 슈퍼컴퓨터인 오크릿지 국립연구소의 서밋보다 7배 이상 빠른 성능이다. 그리고 세계 100대 슈퍼컴퓨터 모두의 성능을 합친 것보다 기본 연상 성능이 뛰어나다.

물론 서밋이 아무 것도 못한다는 것은 아니다. 실제로 서밋은 코로나19 연구에 투입되어 한 달 동안 바이러스를 막을 수 있는 약품 조합을 무려 77가지나 찾아냈다.

폴딩앳홈의 기본 컴퓨팅 성능에는 단점도 있다. 수천 대의 PC가 동작하지만, 모든 작업은 독립적으로 이루어져 서로 연결되지 않는다는 것. 한 작업자의 결과가 다른 작업자의 결과에 의존하지 않으며, 심지어 개별 PC는 서로 알지도 못한다.

서밋과 같은 고성능 컴퓨팅 시스템에서는 모든 노드가 상호 연결되어 커뮤니케이션한다. 따라서 한 노드의 결과는 다른 노드와 공유된다. 서멋이니 시에라 같은 슈퍼컴퓨터의 대규모 처리 작업은 원래 연산의 결과에 의존한다. A 단계가 B 단계에 필요하고, B단계는 C 단계에 필요하다. 하지만 분산 컴퓨팅 프로젝트를 이렇게 하지 못한다.

폴딩앳홈에 참여하려면, 클라이언트를 다운로드해 설치하고 실행하면 된다. 하지만 업무용 PC를 이용하려면, 관리자에게 먼저 확인하기 바란다. editor@itworld.co.kr


2020.04.03

“분산 컴퓨팅의 승리” 엑사플롭의 장벽을 먼저 넘은 수천 대의 PC

Andy Patrizio | Network World
미국에서는 엑사플롭(exaFLOP)의 장벽을 넘는 첫 슈퍼컴퓨터 자리를 노리는 경쟁이 치열하다. 인텔은 2021년 오로라(Aurora)가 첫 주자가 될 것이라고 말하고, AMD와 클레이는 자사가 개척자가 될 것이라고 말한다. 다른 한편으로는 미국 에너지부가 승자가 될 것이다. 두 컴퓨터 모두 에너지부 시설에 배치될 것이기 때문이다.
 
ⓒ GettyImagesBank

엑사플롭은 1초에 퀸틸리언(quintillion, 1018, 100경)번의 부동소수점 연산을 하는 성능으로, 1,000페타플롭이다. 사람이 만약 1초에 한 번씩 계산을 한다면, 31,688,765,000년 동안 계산을 해야만 하는 성능이다.

이처럼 슈퍼컴퓨팅 전문업체들의 도전이 계속되는 가운데, 폴딩앳홈(Folding@Home)이 IBM이나 인텔, 엔비디아, 미국 에너지부보다 먼저 엑사플롭의 장벽을 넘어섰다.

폴딩앳홈은 20년 역사를 자랑하는 분산 컴퓨팅 프로젝트이다. 처음에는 스탠퍼드 대학 화학과에서 관리했다가 지난 해 워싱턴 대학이 맡았다. 이 프로젝트의 소프트웨어는 개인 PC에서 실행되며, PC를 사용 중일 때는 대기 상태를 유지하다가 PC가 대기 상태일 때 본격적으로 작동한다.

이 프로젝트는 단백질의 비정상적인 접힘이 어떻게 발생하고 암이나 알츠하이머병 같은 질병을 유발하는지를 시뮬레이션한다. 접힘은 단백질의 자체 조립 과정을 말하는 것으로, 단백질이 잘못 접히면 질병이 발생한다. 폴딩앳홈은 단백질의 비정상적인 접힘을 시뮬레이션해 이런 현상이 발생하는 원인과 방지할 방법을 찾는다. 20년을 거치면서 이 프로젝트는 화학 및 분자 생물학 박사들만 이해할 수 있는 233건의 연구 논문을 발표했다.

이 프로젝트의 기술적인 과제는 단백질 접힘이 100분의 1초 만에 일어나기 때문에 이 과정과 모든 잠재적 변수를 시뮬레이션하는 데 엄청난 양의 연산이 필요하다는 것이다. 분산 컴퓨팅이 필요한 부분이다. 폴딩앳홈은 기본적으로 무차별 대입을 시도하고 실패하는 방식으로 동작한다. 이 소프트웨어를 실행하는 모든 컴퓨터는 단백질 접힘의 변수 하나를 분자 수준에서 시도하고 결과가 나올 때까지 계속한다.

이 프로젝트는 주로 암이나 파킨슨병, 에이즈, 에볼라 등의 질병에 중점을 뒀는데, 지난 2월부터는 코로나19도 추가하고 관련 단백질의 역학을 시뮬레이션하기 시작했다. 코로나19의 경우, 폴딩앳홈은 바이러스가 인간의 ACE2 수용체와 상호작용하는 방법을 파악하고자 한다. 이 과정을 통해 바이러스는 인간 숙주의 세포로 침투한다. 또한 연구원들이 새로운 치료 항체를 설계해 이 상호작용을 파괴할 수 있을지도 연구한다. 간단히 말해 바이러스가 사람의 세포로 침투하는 것을 막을 방법을 찾고 있다.

이 프로그램을 맡고 있는 워싱턴대학 교수 그레그 바우먼 박사에 따르면, 폴링앳홈은 2월에 3만 명의 자원자로 구동되다가 3월에는 무려 40만 명, 그리고 70만 명까지 참여자가 증가했다. 자원자가 너무 많아 컴퓨터에서 돌릴 잠재적 시뮬레이션 데이터베이스가 다 떨어질 정도이다.

지난 주 폴딩앳홈 관리자는 네트워크가 엑사플롭 마크를 넘었다고 발표했다. 최고 성능은 무려 1.5엑사플롭을 기록했다. 이는 세계 최고의 슈퍼컴퓨터인 오크릿지 국립연구소의 서밋보다 7배 이상 빠른 성능이다. 그리고 세계 100대 슈퍼컴퓨터 모두의 성능을 합친 것보다 기본 연상 성능이 뛰어나다.

물론 서밋이 아무 것도 못한다는 것은 아니다. 실제로 서밋은 코로나19 연구에 투입되어 한 달 동안 바이러스를 막을 수 있는 약품 조합을 무려 77가지나 찾아냈다.

폴딩앳홈의 기본 컴퓨팅 성능에는 단점도 있다. 수천 대의 PC가 동작하지만, 모든 작업은 독립적으로 이루어져 서로 연결되지 않는다는 것. 한 작업자의 결과가 다른 작업자의 결과에 의존하지 않으며, 심지어 개별 PC는 서로 알지도 못한다.

서밋과 같은 고성능 컴퓨팅 시스템에서는 모든 노드가 상호 연결되어 커뮤니케이션한다. 따라서 한 노드의 결과는 다른 노드와 공유된다. 서멋이니 시에라 같은 슈퍼컴퓨터의 대규모 처리 작업은 원래 연산의 결과에 의존한다. A 단계가 B 단계에 필요하고, B단계는 C 단계에 필요하다. 하지만 분산 컴퓨팅 프로젝트를 이렇게 하지 못한다.

폴딩앳홈에 참여하려면, 클라이언트를 다운로드해 설치하고 실행하면 된다. 하지만 업무용 PC를 이용하려면, 관리자에게 먼저 확인하기 바란다. editor@itworld.co.kr


X