Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.

슈퍼컴퓨터

AMD, 弗 스타트업 사이펄과 ARM 기반 슈퍼컴 구축 협력

AMD가 프랑스 칩 설계 업체 사이펄(SiPearl)과 합작해 엑사급 슈퍼컴퓨터 시스템을 구축한다. 해당 시스템은 사이펄의 ARM 기반 레아(Rhea) 프로세서와 AMD의 인스팅트 GPU를 이용한다.   사이펄은 상대적으로 소규모인 스타트업으로, ARM의 네오버스(Neoverse) 라이선스를 취득하고 2019년 사업을 시작해 인텔, 엔비디아, HPE, 그래프코어 등 여러 업체와 협력 관계에 있다.  사이펄은 유럽 프로세서 이니셔티브(EPI) 회원사이기도 하다. EPI는 유럽연합(EU)의 채택 하에 유럽 마이크로프로세서 개발을 지원하는 컨소시엄으로, 고성능 컴퓨팅(HPC) 및 인공지능(AI) 등 유망 애플리케이션에 중점을 둔다. EPI의 목표는 2023년까지 엑사급 슈퍼컴퓨터용 ARM 기반 프로세서를 개발하는 것이다.  사이펄의 레아 프로세서는 프랑스 IT 대기업 아토스(Atos)와 합작해 설계된 제품이다. 레아 마이크로프로세서는 72개의 차세대 ARM 네오버스 코어를 탑재하고 DDR5 및 고대역폭 메모리 인터페이스를 지원한다. 이를 통해 메모리(IBM) 속도와 메모리 풀(DDR5) 용량이 극대화된다. 레아 마이크로프로세서는 TSMC 제조를 거쳐 2023년 출하될 예정이다. 인스팅트 가속기는 AMD 라데온 GPU 기술을 기반으로 하지만, 프론티어(Frontier) 등 다른 시스템에서도 사용할 수 있다. 미국 오크 리지 국립 연구소(Oak Ridge National Lab)에서 사용하는 엑사급 슈퍼컴퓨터는 프론티어 기반 인스팅트 가속기가 탑재된 슈퍼컴퓨터로, 전 세계에서 가장 빠른 슈퍼컴퓨터이다.  협력과 관련해 AMD와 사이펄은 먼저 AMD의 ROCm 소프트웨어 스택과 사이펄의 레아 마이크로프로세서의 상호호환성을 목표로 한다고 밝혔다. ROCm은 GPU 성능을 향상시키는 AMD 애플리케이션 개발용 소프트웨어 스택이다.  이와 함께 양사는 AMD의 HIP(Heterogeneous Interface for P...

AMD ARM 슈퍼컴퓨터 2022.11.18

"이 가격 맞아?" HPE, 보급형 슈퍼컴퓨터 출시

HPE가 슈퍼컴퓨터 ‘크레이’의 저렴이 버전을 출시했다. 엑사플롭 장벽을 돌파했던 슈퍼컴퓨터와 동일한 아키텍처를 기반으로 하는 보급형 슈퍼컴퓨터를 기업들이 구매할 수 있게 됐다.    HPE는 기업용 슈퍼컴퓨터 포트폴리오에 ‘HPE 크레이 EX’와 ‘HPE 크레이 XD’ 라인업이 포함된다고 발표했다. 이 라인업은 오크 릿지 국립 연구소에 소재하는 프론티어 엘사스케일 슈퍼컴퓨터를 기반으로 설계됐다. 일례로 HPE 크레이 EX2500은 프론티어 구축에 사용된 HPE 크레이 EX4000 슈퍼컴퓨터와 동일한 아키텍처를 보유했지만, 규모는 24% 작다.  HPE의 HPC/MCS/Edge 하드웨어 시스템 및 실리콘 엔지니어링 담당 부사장 제랄드 클라인은 “냉각 시스템에서 큰 감소가 구현됐다. EX2500은 프론티어의 EX4000과 동일한 스위치와 블레이드를 사용한다”라며 "이번 제품군을 통해 과거 슈퍼컴퓨터에 접근할 수 없는 규모의 예산을 가진 기업들에게 접근할 수 있게 됐다"라고 말했다.  EX2500은 공냉식이 적용되진 않았다. 하지만 HPE는 EX4000 모델과 같은 별도의 캐비닛 대신, 서버 캐비닛 자체에 냉각수 분배 장치(CDU)를 통합해 공간과 비용을 절약했다.  함께 발표된 HPE 크레이 XD2000은 표준 19인치 데이터 센터 랙에 들어가는 2U 플랫폼으로, HPE의 아폴로 2000 라인에서 파생됐다. 공랭식 또는 수랭식이기에 데이터센터에 수랭식 인프라가 없는 경우에도 활용할 수 있다.  한편 HPE는 인텔의 4세대 제온 스케일러블(사파이어 래피드)와 AMD의 에픽 4 제노아 CPU와 함께 XD2000 및 EX2500용 컴퓨팅 블레이드를 제공한다고 밝혔다.  신규 라인업 중 하나인 XD6500은 최대 8개의 엔비디아 H100 호퍼 GPU가 있는 5U 플랫폼으로, 엔비디아의 DGX 서버와 유사한 솔루션이다. 모델링, 시뮬레이션 및 인공지능(AI)를 포함한 고급 워크로드용으로...

HPE 크레이 슈퍼컴퓨터 2022.11.16

개념부터 잠재적 사용 사례까지, 간략하게 살펴보는 ‘양자 컴퓨팅’

‘양자 컴퓨팅(Quantum computing)’은 컴퓨팅의 본질을 바꾸고, 심지어는 컴퓨터로 간주되는 것을 재정의한다. 이 기술의 잠재력은 데스크톱 컴퓨터부터 자동차, 가정, 의료 및 산업 환경의 기술까지 확장될 전망이다.  지난 2021년 맥킨지 보고서에 따르면 상당한 산업 가치를 창출하리라 예상되는 양자 컴퓨팅 생태계와 새로운 비즈니스 사용 사례가 급성장하고 있다. 이를테면 투자금이 쏟아지고 있고, 스타트업도 급증하고 있다고 맥킨지는 밝혔다. 아울러 알리바바, 아마존, IBM, 구글, 마이크로소프트 등 기술 업계의 거물도 상용 양자 컴퓨팅 클라우드 서비스를 개발하기 위해 작업 중이다.    슈퍼컴퓨터의 한계 정의된 수학적 프레임워크에 따라 더 많은 처리 메모리, 속도, 성능을 추가해 클라우드 플랫폼을 실행하고, 알고리즘을 구동하며, 웹 브라우징을 제공하고, 속도를 높이며, 더 많은 데이터를 전달하는 수많은 컴퓨터가 있다.  하지만 컴퓨터로 할 수 있는 일에는 한계가 있다고 호주 시드니 대학교의 양자 나노과학 연구소 소장이자 마이크로소프트 스테이션 Q(Microsoft Station Q)의 수석 연구원 겸 책임자 데이비드 라일리는 말했다. 라일리는 “컴퓨터가 어디까지 계산할 수 있을까? 상상할 수 있는 가장 큰 컴퓨터로도 여전히 답을 계산할 수 없는 유형의 문제가 있다. 사실 이러한 범주에 속하는 문제가 많다”라고 전했다.  양자 컴퓨팅은 이러한 문제의 해답으로 자리 잡고 있다. 양자 컴퓨팅은 양자 역학의 법칙을 활용하여 비트 또는 1과 0을 기존 컴퓨터보다 더 효율적으로 처리할 수 있다. 이는 수천 개의 CPU 및 GPU 코어를 탑재한 슈퍼컴퓨터의 한계를 넘어서는 컴퓨팅을 제공한다.  현재 슈퍼컴퓨터가 직면한 과제 중 하나는 고도로 복잡한(이는 복잡한 방식으로 상호작용하는 여러 변수로 정의된다) 문제를 해결할 때 장애물에 부딪힌다는 점이다. 예를 들면 슈퍼컴퓨터는 데이터베이스에서 대량의 데...

양자 컴퓨팅 알리바바 아마존 2022.10.12

ISC 2022 살펴보기··· AMD-인텔-엔비디아 간 HPC 경쟁 치열

전 세계 슈퍼컴퓨터 상위 500대 순위(TOP 500) 발표와 함께, 2022 국제 슈퍼컴퓨터 컨퍼런스(International Supercomputer Conference; ISC)가 이번 주 독일 함부르크에서 개막했다. 톱 500에서는 美 에너지부(DoE) 산하 오크릿지 국립연구소의 ‘프론티어(Frontier)’가 전 세계에서 가장 빠른 슈퍼컴퓨터로 선정됐다.    ‘프론티어’는 AMD EPYC CPU와 AMD 인스팅트 MI250 GPU를 탑재한 HPE-크레이 EX 시스템이며, 1초에 100경 번의 연산을 수행하는 최초의 엑사급(exascale) 슈퍼컴퓨터다. 인텔은 에너지부 산하 다른 국립연구소의 슈퍼컴퓨터(‘오로라(Aurora)’)로 엑사급 경쟁에서 승리하고자 했지만 AMD에 패배했다. 또한 프론티어는 엑사급 경쟁에서 중국과 일본의 경쟁자도 물리쳤다.  AMD 칩을 사용한 슈퍼컴퓨터가 1위에 오른 것은 또 다른 이정표다. AMD의 서버 프로세서가 이제 인텔의 최고 성능 제품보다 경쟁력 있으며, 아울러 인스팅트(Instinct)는 적수였던 엔비디아의 코프로세서와 경쟁할 수 있음을 보여준다. AMD는 인텔을 추격하면서 서버 분야에서 꾸준히 입지를 확보해왔다. 하지만 AI와 HPC 분야는 엔비디아가 거의 독점하고 있다. (따라서) AMD는 아직 샴페인을 터트릴 때가 아니다. 엔비디아 코프로세서는 500대 슈퍼컴퓨터 가운데 154개에서 찾을 수 있다. 한편 크레이(Cray)와 AMD는 자랑할 게 한 가지 더 있다. 프론티어가 슈퍼컴퓨터의 전력 효율에 따른 순위를 매기는 ‘그린500(Green500)’에서도 가장 에너지 효율이 높은 슈퍼컴퓨터로 뽑혔다.    인텔, HPC 로드맵 업데이트 한동안 인텔은 자사 최고 성능의 HPC 프로세서 ‘폰테 베키오(Ponte Vecchio)’를 내세워왔다. 이는 인텔 ‘Xe GPU 아키텍처’의 데이터센터 버전이다. 아울러 폰테 베키오는 엔비디아의 암페어 A100(Ampere ...

슈퍼컴퓨터 AMD 인텔 2022.06.03

“엑사급 슈퍼컴퓨터 등장” 프론티어, 1.12엑사플롭 성능으로 톱500 1위 등재

최신 슈퍼컴퓨터 톱500 목록에 따르면, 세계에서 가장 빠른 컴퓨터는 이제 최초의 엑사급 슈퍼컴퓨터 프론티어(Frontier)이다.    엑사급 컴퓨터란 1초에 1018(100경)번의 부동소수점 연산(1exaFLOPS)을 할 수 있는 컴퓨터를 말하는 것으로, 미국 오크릿지 국립연구소에 설치된 프론티어의 성능은 1.12엑사플롭이다. 프론티어는 또한 와트당 62.68기가플롭의 연산을 수행해 가장 전력 효율이 높은 슈퍼컴퓨터 타이틀도 차지했다. 프론티어의 성능은 일본 리켄 컴퓨터과학센터의 후가쿠(Fugaku)를 2년 만에 2위 자리로 밀어냈는데, 후가쿠의 HPL 벤치마크 성능은 442페타플롭이다. 톱500은 후가쿠의 이론 상 성능은 1엑사플롭을 넘지만, HPL 벤치마크에서는 이런 속도를 보여주지 못했다고 밝혔다.  프론티어는 톱500 슈퍼컴퓨터 목록에서 처음으로 톱10에 들었으며, 이외에도 핀란드 EUROHPC/CSC의 루미(LUMI)가 3위에, 프랑스 GENCI-CINES의 아다스트라(Adastra)가 10위에 새로 이름을 올렸다. 톱 10 목록은 다음과 같다.   1위. 프론티어. 미 에너지부의 HPE 크레이 EX 시스템으로, HPC 및 AI에 최적화된 3세대 AMD 에픽 CPU 873aks 112코어를 탑재했다. AMD 인스팅트(Instinct) 250X 가속기와 슬링샷(Slingshot)-11 인터커넥트를 사용한다. 2위. 후가쿠. 후지쯔가 구축한 슈퍼컴퓨터로, 763만 848코어를 탑재했다. 3위. 루미. HPE 크레이 EX 시스템으로, 성능은 151.9페타플롭이다. 4위. 서밋(Summit). 미국 오크릿지 국립연구소에 설치된 IBM 시스템으로, 최고 성능은 148.8페타플롭이다. 4,356대의 노드로 구성되어 있으며, 노드마다 파워9 CPU 22코어, 엔비디아 테슬라 V100 GPU 6대를 탑재했다. 노드 연결에는 멜라녹스의 EDR 인피니밴드 네트워크를 사용한다. 5위. 시에라(Sierra). 미국 ...

슈퍼컴퓨터 톱500 엑사플롭 2022.06.02

"온디맨드 슈퍼컴퓨터" 애저 HPC의 이해

오래 전, 누군가 온 세계에 필요한 컴퓨터는 단 5대라고 말했다고 한다. 마이크로소프트 애저, 아마존 웹 서비스, 구글 클라우드 플랫폼 등은 모두 대규모 확장이 가능한 컴퓨팅 클러스터로, 각 서버와 각 데이터센터는 또 하나의 구성요소이고, 이들이 모여 거대한, 전 지구급 규모의 컴퓨터가 된다고 말할 수도 있다. 사실 클라우드를 움직이는 기술의 상당수는 원래 일반적인 기성품 하드웨어를 사용해서 슈퍼컴퓨터를 만들고 운용하기 위해 개발된 기술이다.    클라우드를 활용해 문제를 해결하는 동안에만 존재하는 HPC(High Performance Computing) 시스템을 만들고 구축하고 실행하면 좋지 않을까? 웨타 데지털(Weta Digital)의 영화 제작자들이 렌더 팜(render farm: 킹콩, 호빗과 같은 영화의 CGI 효과를 위해 구축된 하드웨어 서버 룸)에 대해 생각하는 것과 거의 똑 같은 방식으로 클라우드를 생각하면 된다. 렌더 팜은 영화 제작에 사용되지 않을 때는 뉴질랜드 정부를 위한 임시 슈퍼컴퓨터로 활용된다.  퍼블릭 클라우드의 첫 대규모 사례 연구는 이 부분, 즉 과거라면 온프레미스 HPC 하드웨어를 사용했을 일시적인 폭발적 용량을 위해 퍼블릭 클라우드를 사용하는 데 초점을 맞췄다. 이를 통해 데이터센터 공간, 스토리지, 전력에 대한 투자 없이 HPC를 이용해 상당한 비용을 절감할 수 있다는 것을 확인했다.   애저 HPC 소개  HPC 기능은 애저를 비롯한 클라우드에서 여전히 중요한 기능이다. 클라우드는 더 이상 일반 하드웨어에 의존하지 않고 이제 HPC에 초점을 둔 컴퓨팅 인스턴스를 제공하고 HPC 솔루션 업체와 협력해 전문 툴을 서비스로 제공한다. 특히 HPC를 요구사항에 따라 확장 가능한, 빠르고 쉽게 실행할 수 있는 동적 서비스로 취급한다.  애저의 HPC 툴은 마이크로소프트가 말하는 “빅 컴퓨팅”을 제공하는 데 초점을 둔 아키텍처 원칙 모음이라고 생각하는 것이 가장 정확할 ...

HPC 슈퍼컴퓨터 매니지드서비스 2022.01.14

교토 대학 데이터 손실 사고로 살펴보는 ‘내부자 위협으로서의 기기’

작년 12월 28일, 일본 교토 대학 컴퓨팅 및 미디어 연구팀 소장 오카베 토시오가 슈퍼컴퓨팅 오류로 77TB 상당의 사용자 데이터가 손실된 것에 대해 사과했다. 잃은 데이터는 교토 대학 내 연구 기관 14곳의 데이터 파일 3,400만 개를 포함한다.   12월 16일 교토 대학 정보 관리 및 통신 연구소는 공식 홈페이지를 통해 사용자에게 이번 사건의 개요를 포함한 사과문을 개별적으로 전송하겠다고 밝혔다. 연구소에 따르면, 작년 12월 14일~12월 16일에 /LARGE0 디렉토리를 지원하는 슈퍼컴퓨터 시스템 백업 스토리지 프로그램에 결함이 발생해 뜻하지 않게 데이터가 삭제됐다. 이 슈퍼컴퓨터는 닛폰 휴렛 팩커드(Nippon Hewlett-Packard) GK로 확인됐다. 휴렛 팩커드(Hewlett-Packard Enterprise, HPE)는 사과문을 통해 데이터 손실을 인정하며 100% 자사 책임이라고 밝혔다. 49TB 데이터는 어떻게 /LARGE1 디렉토리에 계속 백업된 상태로 존재할 수 있었는지에 관해서도 언급했다. 또한, 파일을 잃은 사용자에 보상을 제공하고, 불만 사항이나 상담을 접수할 수 있는 경로도 안내했다. 데이터 손실이 발생한 경위 HPE가 설명한 것처럼, 백업 스크립트를 실행하는 기기는 가시성과 가독성을 개선하도록 조정됐다. 하지만 스크립트가 수정됐고, 이전 스크립트를 덮어쓰는 방식으로 재배치됐다. 그 결과 하나의 작은 결함이 발생했으며, 결과 코드가 중간부터 새로고침됐다. 이로 인해 삭제 지정된 파일 디렉토리가 아닌, /LARGE0 디렉토리가 삭제된 것이다. 이번 문제의 재발 가능성을 낮추기 위해 HPE가 권고한 사항은 다음과 같다. 슈퍼컴퓨터 시스템에 적용하기 전, 코드를 꼼꼼하게 확인한다. 이번 사건의 영향과 관련해 검사를 실시하고, 재발 방지를 위한 개선점을 제시한다. 휴먼 에러가 반복되지 않도록 엔지니어를 재교육한다. 교토 대학은 1월 말까지 백업 프로세스를 전면 중단했다.   백업 프로세스 및 ...

기기 슈퍼컴퓨터 내부자위협 2022.01.13

IDG 블로그 | 클라우드 슈퍼컴퓨터가 부상한다

영국 소재 클라우드 워크로드 관리 전문업체 '옐로우독(YellowDog)'가 여러 클라우드 서버를 이용해 가상 슈퍼컴퓨터를 만드는 데 성공했다. 최고 성능을 낸 약 10분간 320만 개 이상의 가상 CPU를 활용했다. 더 자세히 보면 클라우드 서버 중 하나가 AWS 96-코어 C5 24 인스턴스로, 시간당 1.6달러가 드는데, 6시간 사용했다.   옐로우독이 이렇게 여러 클라우드 서버를 결합한 것은 방대한 분산 슈퍼컴퓨터를 이용해 싱글 클러스터로 마약 탐지 애플리케이션을 실행해 많은 문제를 빠르게 해결하기 위해서였다. 비용은 약 6만 달러가 들었다. 너무 비용이 크다고 생각할 수도 있지만 실제로는 그렇지 않다. 필자는 80~90년대 슈퍼컴퓨터를 사용한 경험이 있는데, 옐로우독 사례보다 10배 정도 더 많은 작업을 처리하긴 했지만, 최소 수백만 달러짜리 청구서를 받곤 했다. 반면 옐로우독은 온디멘드 클라우드 기반 슈퍼컴퓨터를 이용해 불과 6시간 만에 3억 3700만 개 화합물을 분석했다. 오늘날 이런 고성능 컴퓨팅을 클라우드 기반 플랫폼으로 사용하는 경우가 점점 늘어나고 있다. 특히 대기업은 전통적인 업무용 애플리케이션을 실행하고 데이터를 저장하는 데 있어 클라우드가 경제적이며, 특수 제작된 고가의 슈퍼컴퓨터를 클라우드에서도 구현할 수 있음을 깨닫고 있다. 더우기 잇점은 전통적인 슈퍼컴퓨터를 대체하는 것만이 아니다. 고급 분석에 들어가는 시간도 줄일 수 있는데, 예를 들면 마약 탐지 애플리케이션, 조사와 의료 연구, 고급 시뮬레이션를 비롯한 컴퓨트 집약적인 애플리케이션 작업이 대표적이다. 중소기업도 더는 슈퍼컴퓨터의 가격표 때문에 주저하지 않아도 된다. 이를 이용하면 체급을 뛰어넘어 역량을 몇 배씩 증폭하는 기술로 활용할 수 있고, 대기업은 생각할 수 없는 시장 혁신을 이룰 수 있다. 이러한 파괴적인 현상이 몇 년 내에 더 일상화될 것으로 보인다. 지난 100년 이상 시장을 선도했던 대기업의 영역을 중소기업이 점차 잠식할 것이다. 이전에는 소...

슈퍼컴퓨터 클라우드 2021.12.01

“전세계 톱 500 슈퍼컴퓨터 70%, 엔비디아 기술로 구동”

엔비디아(www.nvidia.co.kr)가 슈퍼컴퓨팅 컨퍼런스 2021(SC21)에서 발표된 전세계 슈퍼컴퓨터 톱 500 리스트 중 70%에 달하는 355개 시스템이 엔비디아 기술로 가속되고 있다고 밝혔다. 새로 구축된 시스템의 90% 이상이 엔비디아의 기술력을 채택하고 있다. 또한 에너지 효율이 가장 높은 시스템을 선별하는 그린500(Green500)의 상위 25개 시스템 중 23개가 엔비디아 기술로 구동되고 있는 것으로 나타났다. 평균적으로 엔비디아 GPU 기반 슈퍼컴퓨터는 GPU를 사용하지 않는 그린500 시스템 대비 3.5배 높은 에너지 효율을 제공한다.   마이크로소프트의 GPU 가속 애저(Azure) 슈퍼컴퓨터는 10위에 오르면서 클라우드 기반 시스템으로는 처음으로 10위권에 진입했다. AI는 과학 연구를 위한 컴퓨팅을 혁신하고 있다. 최근 고성능컴퓨팅(HPC)과 머신러닝을 활용한 논문의 수가 급증해 2018년에 약 600편 정도 제출되었던 관련 논문이 2020년에는 5,000편으로 증가했다. HPL-AI는 혼합정밀도연산(딥러닝과 다양한 과학 연구, 상업적 활용의 기초)을 사용하면서도 배정밀도 연산의 정확도(전통적 HPC 벤치마크의 표준 측정자 역할)를 온전히 제공하는 HPC와 AI 융합형 워크로드의 새로운 벤치마크다. MLPerf HPC는 슈퍼컴퓨터상의 시뮬레이션을 AI로 가속, 개선하는 컴퓨팅 스타일을 평가한다. HPC 센터의 주요 워크로드인 천체물리학(Cosmoflow)과 날씨(Deepcam), 분자동역학(Opencatalyst)을 바탕으로 성능을 측정한다. 엔비디아는 GPU 가속 프로세싱, 스마트 네트워킹, GPU 최적화 애플리케이션, AI와 HPC 융합 지원 라이브러리들로 풀 스택을 커버한다. 이 같은 접근법을 통해 워크로드를 가속하고 과학적 혁신을 이룩할 수 있었다고 업체 측은 설명했다. 다양한 활용 사례에서 GPU의 병렬 처리 기능과 2,500개 이상의 GPU 최적화 애플리케이션이 결합하면 HPC 작업에 소요되는 시...

슈퍼컴퓨터 엔비디아 2021.11.19

미 아르곤 국립 연구소 폴라리스 슈퍼컴퓨터, 엔비디아 A100 GPU 탑재

엔비디아는 미 에너지부(U.S. Department of Energy) 산하 아르곤 국립 연구소(Argonne National Laboratory)의 슈퍼컴퓨터인 폴라리스(Polaris)가 엔비디아의 가속 컴퓨팅 플랫폼으로 구동된다고 26일 밝혔다.   아르곤 리더십 컴퓨팅 시설(ALCF)에서 호스팅 되는 폴라리스 슈퍼컴퓨터는 2,240개의 엔비디아 A100 텐서 코어(Tensor Core) GPU로 가속화되며, 약 1.4엑사플롭(EF) AI 성능과 최대 44페타플롭(PF) 배정밀도(double-precision) 성능을 제공한다. HPE(Hewlett Packard Enterprise)에 의해 구축되고, 엔비디아 A100 GPU 4개를 탑재해 총 560개의 노드로 구동된다. 슈퍼컴퓨터 폴라리스는 사용자 알고리즘과 과학분야 전반에 관한 방대한 양의 연구와 발견을 위해 사용되는데, 특히 물리학에 대한 새로운 발견을 위해 암 치료 개선, 청정에너지 탐사, 입자충돌 연구를 포함한 혁신적인 과학 탐사를 가속화하는 데에 활용된다.  폴라리스는 아르곤 연구소의 피어리뷰(peer-review) 형식의 할당 및 애플리케이션 프로그램을 통해 학계, 정부 기관 및 업계의 연구원들도 사용할 수 있다. 엔비디아의 가속 컴퓨팅 총괄 이언 벅은 “엑사스케일 AI 시대에는 엄청난 규모의 과학적 혁신이 가능해지고 이는 사회에 엄청난 이익을 제공할 것”이라며 “엔비디아의 GPU 가속 컴퓨팅 플랫폼을 통해 아르곤 연구소의 선구자들이 폴라리스와 같은 차세대 컴퓨터로 과학 탐사의 경계를 넓힐 수 있도록 지원한다”라고 말했다. ALCF 국장 마이클 R. 파프카는 “폴라리스는 사용자들이 엑사스케일 AI 시대에 진입하게 해주는 강력한 플랫폼”이라며 “다수의 엔비디아 A100 GPU를 탑재함으로써 데이터 집약적 AI HPC 워크로드를 개선해 세계에서 가장 복잡한 과학 문제를 해결할 수 있을 것이다”라고 말했다. editor@idg.co.kr

슈퍼컴퓨터 폴라리스 엔비디아 2021.08.26

존재감 확인한 엔비디아, 내일 기약하는 인텔과 AMD : 슈퍼컴퓨팅 20

슈퍼컴퓨팅 20 컨퍼런스에서 발표된 세계에서 가장 빠른 컴퓨터 500대의 거의 70%가 엔비디아 GPU를 사용하는 것으로 나타났다. 톱 10 중 8대도 마찬가지다. 이 가운데 세레네(Selene)라는 이름의 슈퍼컴은 엔비디아가 자체 구축한 것으로, 최근 슈퍼컴 톱 500 목록에서 5위에 올랐다.    최상위 시스템은 대부분 1만 개 이상의 CPU와 GPU를 탑재해 엄청나게 비싸고, 이 때문에 대부분은 각국 정부기관이나 연구기관이 보유하고 있다. 이 때문에 세레네는 좀 더 희귀한 사례이다. 엔비디아가 자체 구축한 세레네는 엔비디아의 산타클라라 본사에 설치되어 있다. 물론 경쟁상의 이유로 공개하지 않은 민간 기업 소유의 컴퓨터가 적지 않은 것으로 알려져 있다. 엔비디아의 또 다른 슈퍼컴인 DGX SuperPOD가 그린5000(GREEN500) 목록에서 1위를 했다는 것도 주목할 만하다. 톱500 슈퍼컴 중 가장 전력 효율이 높다는 것을 의미한다. 상위 4대 시스템은 모두 엔비디아의 A100 암페어 GPU를 사용하며, ARM 프로세서만을 사용하는 후지쯔의 후가쿠 프로토타입은 1위에서 6위로 떨어졌다. 그동안 GPU는 전력 효율이 높았던 적이 없었지만, 엔비디아는 한 제품에서 성능과 전력 효율 모두를 높이는 새로운 기록을 만들어 낸 것이다.  엔비디아는 또한 멜라녹스 NDR 400Gbps 인피니밴드 제품군도 발표했는데, 내년 2분기에 출시될 예정이다. 새 제품군에는 어댑터, DPU(Data Processing Unit) 등 지능형 NIC와 스위치, 케이블용 제품이 포함된다. 특히 신제품은 포트당 대역폭을 두 배로 늘리는 데 그치지 않고, 단일 장비당 탑재할 수 있는 포트의 수를 세 배로 늘렸다. 이론적으로는 단일 스위치 플랫폼으로 전체 데이터센터를 연결할 수도 있다. 멜라녹스는 NDR 400Gbps 인피니밴드로 네트워크 비용은 1.4배, 전력 비용은 1.6배 절감할 수 있다고 밝혔다. 부활을 노리는 AMD는 톱500 목록에서 AM...

슈퍼컴퓨터 엔비디아 gpu 2020.11.19

세계 1위 슈퍼컴퓨터는 후지쯔 후가쿠…"2위 IBM보다 약 3배 더 빨라"

세계에서 가장 빠른 슈퍼컴퓨터 500종 중 후지쯔가 만든 후가쿠(Fugaku)가 1위를 차지했다. 지난 6월의 순위와 같다. 후가쿠는 2위 슈퍼컴퓨터보다 거의 3배 가까이 더 빠른 속도를 기록했다. 슈퍼컴퓨터 성능과 아키텍처의 발전을 검토하는 이 순위는 1993년 이래 매년 6월과 11월에 갱신, 발표된다. 이번 500위 목록에는 집계를 시작한 이후 신규 진입한 시스템이 가장 적어 슈퍼컴퓨터 분야의 경쟁이 심화되고 있음을 나타냈다. 그럼에도 상위 10위권에 첫 진입한 2개 업체가 눈에 띈다. 새로 발표된 상위 10위 안에는 연구 환경이 아니라 사기업 설정에 맞게 설치된 슈퍼컴퓨터도 2종 들어 있다. 500개 목록의 전반적 속도는 지난 6월보다 향상됐다. 6월 순위에서 가장 느린 시스템은 최대 초당 1.23PFLOP이었지만 이번 테스트에서는 초당 1.32PFLOP을 기록했다. HPL 벤치마크는 밀도 높은 선형 방정식을 얼마나 잘 해결하는지를 측정한다. 비슷한 맥락에서 500개 시스템의 전체 성능 역시 6월의 2.22엑사플롭에서 2.43엑사플롭으로 증가했다. 국가 관점으로는 미국이 상위 10위 안에 4개의 슈퍼컴퓨터 시스템, 중국이 2개, 독일, 이탈리아, 일본, 사우디아라비아가 각각 1개씩 진입했다.   상위 500위 슈퍼컴퓨터 중 부동의 1위는? 가장 빠른 1위는 최고 속도가 6월보다 25PFLOP, 2위 시스템보다 약 3배 더 빠른 442PFLOP까지 개선된 후지쯔의 후가쿠로 집계됐다. 2위는 IBM이 미국 테네시 ORNL을 위해 구축한 초당 148.8PFLOP 속도의 서밋(Summit)이다. 서밋은 노드 4,356개, 22코어 파워9 CPU 2개, 엔비디아 테슬라 V100 GPU 6개, 241만 4,592개의 코어가 있고 지난 6월의 순위도 2위였다. 서밋과 비슷한 구조이지만 HPL 점수가 94.6PFLOP인 시에라(Sierra)가 3위를 유지했다. 시에라는 파워9 CPU 2개, 엔비디아 테슬라 V100 GPU 4개, 노드 4,32...

슈퍼컴퓨터 2020.11.17

“TOP500 슈퍼컴퓨터 모두 리눅스 구동” 오픈소스의 가치 증명

리눅스의 성공을 증명하는 증거 중 하나가 슈퍼컴퓨팅 분야의 놀라운 점유율이다. 현재, 전 세계 최고 성능 슈퍼컴퓨터 500대가 모두 리눅스를 구동한다. 사실, 2017년 11월부터 그래 왔다. TOP500은 1993년부터 가장 강력한 상용 컴퓨터 시스템 500대를 조사했는데, 1998년 1대가 등장한 이후의 그래프는 인상적이다.     리눅스 슈퍼컴퓨터 약사 어떻게 이런 일이 일어났을까? 잘 알려진 것처럼 리눅스는 1991년 핀란드의 학생 리누스 토발즈의 개인 프로젝트로 시작되었다. 필자 역시 몇 년이 지나서야 리눅스의 존재를 인식했는데, 존스 홉킨스 대학의 물리 및 천문학부에서 일할 때였다. 당시 이 학부의 네트워킹과 다수의 서버를 몇몇 석사 과정 학생을 도움을 받아 관리했다. 흥미를 느끼긴 했지만, 당시에는 운영체제가 원하는 사람 누구나 소스 코드를 이용할 수 있다고 해서 이런 주목할 만한 성공을 거둘 수 있다고 상상하기는 힘들었다. 또 상당수의 대기업이 그 가치를 알아채고 함께 작업하고 혁신해 오늘날의 리눅스를 만들어 낼 것이란 생각도 하지 못했다. 뒤돌아보면, 오픈소스와 집약적인 협업이 핵심이었다. 여기에 많은 수의 기여자와 인텔, 레드햇, 삼성, 수세, IBM, 엔비디아 등등의 많은 협력 기업이 참여했다. 사실 리눅스 재단의 기업 회원 목록만 봐도 놀랄 정도이다. 이외에도 리눅스의 성공에는 비독점성, 확장성 등의 특성도 한몫했다. TOP500은 1년에 두 번, 6월과 11월에 성능을 기준으로 가장 강력한 컴퓨터 시스템 500대의 목록을 발표한다. 성능의 기준은 린팩(LINPACK) 벤치마크이다. 그렇지만 리눅스가 상위 500대의 슈퍼컴퓨터를 구동한다고 해서 다른 슈퍼컴퓨터에는 사용되지 않는다는 말은 아니다. 그저 아무도 추가 통계를 모으거나 홍보하지 않을 뿐이다. 확인할 수는 없지만, 리눅스는 퍼블릭 클라우드의 90%, 임베디드 시스템과 IoT 디바이스의 60%, 스마트폰의 80%를 구동하는 것으로 알려져 있다. 이런 추정...

리눅스 슈퍼컴퓨터 리누스토발즈 2020.07.31

슈퍼컴 1위 415.5페타플롭의 후가쿠, AI 워크로드 성능은 엑사플롭 달성

톱 500 목록에 새로 가장 빠른 슈퍼컴퓨터로 이름을 올린 주인공은 기존 1위보다 무려 2.8배나 빠르다.   일본의 ARM 기반 슈퍼컴퓨터 후가쿠(Fugaku)는 린팩 벤치마크에서 무려 415.5페타플롭이란 성능을 기록했다. 기존 1위 서밋(Summit)은 지난 해 가을 148.6페타플롭의 성능을 기록했다. 특히 AI 애플리케이션에서 주로 사용하는 워크로드인 단정밀도 또는 반정밀도 테스트에서는 무려 1엑사플롭, 즉 1,000페타플롭의 성능을 기록했다. 서밋은 지난 3번의 톱 500 목록에서 1위를 기록했고, 후가쿠는 올해 5월 22일에야 조립이 완료됐다. 따라서 이번 성능 테스트가 처음이다. 후가쿠는 후지쯔 시스템으로, 총 729만 9,072개의 코어를 탑재했다. 설치 장소는 일본 고베에 있는 일본 이화학연구소의 전산과학센터이다. 톱 500 목록의 3위인 시에라는 IBM 파워9 프로세서를 기반으로 총 157만 2,480개의 코어와 엔비디아 볼타 GV 액셀러레이터 138만 2,400코어를 탑재했다. 6개월 전 측정한 최고 성능은 94.6페타플롭이었다.  톱 10에 새로 이름을 올린 슈퍼컴퓨터는 2대 더 있다. 6위로 올라선 HPC5는 델이 구축한 파워에지 시스템으로, 이탈리아의 석유회사 에니(Eni S.p.A)가 설치했다. 현재 유럽의 최고 성능 슈퍼컴퓨터로, 엔비디아 테슬라 V100을 가속기로 사용하고 멜라녹스의 HDR 인피니밴드를 네트워크로 사용해 35.5페타플롭의 성능을 달성했다. 7위인 셀레네(Selene)는 엔비디아의 자체 슈퍼컴퓨터인 엔비디아 DGX A100 슈퍼팟이다. 엔비디아의 신형 암페어 A100 프로세서를 사용하며, 린팩 테스트에서 27.6페타플롭의 성능을 기록했다. 10위까지의 목록을 보면, 미국 4대, 중국과 이탈리아가 각 2대, 일본과 스위스가 1대씩을 보유했다. 하지만 전체 500위를 보면, 45.2%가 중국, 22.8%가 미국이다. 그 뒤를 일본(5.8%), 프랑스(3.8%), 독일(3.2%)이 따르고...

슈퍼컴퓨터 엑사플롭 후가쿠 2020.06.25

엔비디아, 과학 컴퓨팅 플랫폼으로 코로나19 연구 지원

전 세계 과학자와 연구원들이 엔비디아의 과학 컴퓨팅 플랫폼을 기반으로 코로나19를 연구하고 있다. 엔비디아 과학 컴퓨팅 플랫폼은 데이터 애널리틱스, 시뮬레이션 및 시각화, 인공지능(AI), 엣지 프로세싱 작업의 속도를 높이는 데 중요한 역할을 한다.     코로나19 팬데믹 사태를 해결하기 위해 전 세계적으로 많은 노력을 펼치고 있는 가운데, 엔비디아는 과학 컴퓨팅 플랫폼으로 바이러스의 이해를 돕고 테스트와 치료법을 발견하는 것을 지원하고 있다. 엔비디아는 과학 컴퓨팅 커뮤니티를 위한 엔드-투-엔드 워크플로우를 제공해 다양한 분야에 도움을 줄 수 있었으며, 모든 핵심 애플리케이션 분야에서 풀스택 혁신을 위한 접근법을 취하고 있다. - 유전학: 옥스퍼트 나노포어 테크놀러지스(Oxford Nanopore Technologies)는 엔비디아 GPU를 활용해 바이러스 게놈의 염기서열을 7시간 만에 분석했다. - 감염 분석 및 예측: 엔비디아 래피즈(RAPIDS) 팀은 실시간 감염률 분석에 명확한 통찰력을 제공하기 위해 데이터 시각화 툴인 GPU 가속 플로틀리 대쉬(Plotly’s Dash)를 활용한다. - 구조 생물학: 미국 국립보건원(National Institutes of Health)과 텍사스 대학교 오스틴 캠퍼스(University of Texas, Austin)는 극저온 전자 현미경으로 최초의 바이러스 단백질의 3D 구조를 재구성하기 위해 GPU 가속 소프트웨어 크라이오SPARC(CryoSPARC)를 활용한다.  - 치료: 엔비디아는 미국 국립보건원과 협력해 폐 스캐닝을 기반으로 코로나19 감염을 정확하게 분류해 효율적인 치료 계획을 세울 수 있는 AI를 구축했다. - 의약품 개발: 오크리지 국립연구소(Oak Ridge National Laboratory)는 GPU 가속 서밋(Summit) 슈퍼컴퓨터에서 스크립스 연구소(Scripps Research Institute)의 오토덕(AutoDock)을 실행해 수십억 개의 잠재적 약품...

인공지능 코로나19 엔비디아 2020.06.24

엔비디아, 슈퍼컴퓨터 ‘DGX 슈퍼POD’ 2세대 모델 공개

엔비디아(www.nvidia.co.kr)가 세계에서 20번째로 빠른 슈퍼컴퓨터 ‘DGX 슈퍼POD(DGX SuperPOD)’의 2세대 모델을 공개했다.  엔비디아 DGX A100 시스템과 멜라녹스(Mellanox) 네트워크 패브릭을 기반으로 구축된 DGX 슈퍼POD는 몇 주가 소요되는 복잡한 언어 이해 모델의 처리시간을 단 한시간 내로 단축시킨다고 업체 측은 설명했다. 엔비디아는 지난해 여러 DGX 시스템을 결합한 DGX 슈퍼POD를 처음 선보였다. DGX 슈퍼POD는 일반적으로 슈퍼컴퓨터에 들어가는 비용과 에너지 사용량을 훨씬 줄이면서도 고성능을 제공하는 것이 특징이다. 멜라녹스 기술과 결합된 엔비디아 솔루션은 가장 복잡한 문제를 병렬로 처리하고 최대한 빠르게 문제를 해결할 수 있는 아키텍처로 데이터센터를 재정의하고 있다. DGX A100에는 시스템 당 최대 9개의 인터페이스를 갖는 200Gbps HDR 인피니밴드(InfiniBand)를 갖춘 새로운 멜라녹스 커넥트X-6 VPI 네트워크 어댑터가 제공된다. 엔비디아는 시스템 간 상호연결성을 높이고 고성능을 제공하기 위해 멜라녹스 스위치를 활용한다. 또한, 엔비디아 DGX 슈퍼POD와 DGX A100을 통해 사용량 기반 지불방식(pay-as-you-grow) 모델로 쉽게 확장할 수 있으면서도 운영에 미치는 영향을 최소화하는 AI 네트워크 패브릭을 설계했다. 엔비디아는 DGX 슈퍼POD를 확장가능한 20개의 DGX A100 시스템 그룹으로 모듈화했다. 각각은 멜라녹스 HDR 인피니밴드를 사용하는 2티어 팻트리(Fat-Tree) 스위치 네트워크 토폴로지로 지원돼, 초과가입(Oversubscription) 없이 완전한 바이섹션 대역폭을 제공한다. 또한, 세 번째 스위칭 티어를 추가하면 드래곤플라이+(DragonFly+) 또는 팻트리 토폴로지를 사용해 수천 대의 시스템으로 확장할 수 있다. 이를 통해 기업들은 시스템 모듈 추가 관련 비용은 줄이면서 인프라 확장에 유연하게 대처할 수 있다. DGX...

엔비디아 슈퍼컴퓨터 2020.05.27

“DIM 소켓 없는 ARM 기반 HPC” 후지쯔의 슈퍼컴퓨팅 승부수

서버용 ARM 프로세서는 처참한 실패(Calxeda)로 시작해서 적당한 성공(ThunderX2)으로, 그리고 마침내 제대로 된 경쟁자(ThunderX3, Ampere)로 부상했다. 일본의 대형 IT 기업인 후지쯔의 ARM 프로세서에 대한 세부 정보가 공개됐는데, 후지쯔는 엔비디아 GPU보다 더 적은 전력으로 더 높은 성능을 구현할 수 있다고 주장한다.   후지쯔는 ARM8 파생 버전인 48코어 A64FX를 고성능 컴퓨팅 전용 프로세서로 개발하고 있는데, 범용 코어가 아니라 인공지능이나 머신러닝 등에 특화된 연산 엔진을 추가했다. 이 프로세서는 후가쿠(Fugaku)란 이름의 새 슈퍼컴퓨터에 탑재된다. 후가쿠는 포스트 K라고도 불리는데, 한때 세계 최고의 슈퍼컴퓨터였던 K 슈퍼컴퓨터의 후속작이다. K는 맞춤형 스팍 칩을 사용했다. 후지쯔는 관련 세부 정보 일부를 공개했는데, 꽤 인상적이다. 우선 A64FX의 설계는 전통적인 방식에서 시작한다. AMD 에픽이나 일부 제온과 같은 치플렛 설계 대신 단일 모놀리식 설계를 선택했다. 더 중요한 것은 HBM2 칩 4개가 들어간다는 것이다. CPU와 연결되는 이 값비싼 고속 메모리는 고성능 시스템에만 사용된다. 각각 2개의 8GB 모듈이 CPU 양옆에 배치되어 CPU당 32GB의 HBM2 메모리를 제공한다. 이 때문에 A64FX의 메인보드 프로토타입에는 RAM DIMM 소켓이 없다.  HPC 환경에서는 메모리 대역폭이 병목지점이 되는 경우가 많다. 특히 분석이나 시뮬레이션, 머신러닝 같은 데이터 집약적인 워크로드에서 성능 저하가 발생하는 원인이 된다. 실제로 데이터를 처리하는 데 드는 처리 성능의 100배 정도가 데이터를 옮기는 데 사용된다. 따라서 전력 효율을 높이기 위해서는 데이터를 가능한 한 조금 움직여야 한다. 따라서 A64FX의 설계는 표준 ARM 칩이나 x86 칩과는 완전히 다르다. 시스템 메모리가 없으며, 프로세서당 32GB의 초고속 메모리가 느린 메모리 버스 대신 고속 상호연결 기술을...

후지쯔 HPC 슈퍼컴퓨터 2020.04.07

IDG 설문조사

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.