
그래프코어는 자사 AI용 칩 IPU를 탑재하는 랙마운트 타입 서버 ‘IPU-POD’를 판매하는데, 최근 출시한 IPU-POD128과 IPU-POD256에는 전작 대비 2~4배 많은 칩을 탑재할 수 있다. 이전까지는 64유닛을 장착할 수 있는 IPU-POD64 모델이 최대였다.
IPU-POD128의 AI 컴퓨트 성능은 32페타플롭이며, IPU-POD256 성능은 64페타플롭이다. 그래프코어는 “농구장만큼을 차지하는 기존 슈퍼컴퓨터보다 훨씬 적은 면적에서 AI 슈퍼컴퓨터의 영역을 확장할 수 있을 것”이라고 강조했다.
그래프코어의 IPU-POD 시스템은 서버에서 AI 컴퓨팅 성능을 분리한다. 다른 수준의 성능이 요구되는 다양한 AI 워크로드를 하나의 랙마운트에서 실행할 수 있다. 예컨대 전체 시스템 컴퓨팅 성능을 대규모 모델링에 할당해 학습 속도를 더 높일 수 있고, 시스템을 작고 유연한 vPOD 단위로 쪼개 더 많은 개발자가 IPU를 이용할 수도 있다.
컴퓨팅 성능을 분리할 때에는 그래프코어의 소프트웨어 스택 포플러(Poplar)를 이용한다. 포플러에는 그래프코어 커뮤니케이션 라이브러리(GCL)와 팝런(PopRun), 팝디스트(PopDist) 총 3가지 소프트웨어 개발 키트가 포함돼 있다. GCL은 IPU간 통신과 동기화를 관리하는 도구이며, 팝런과 팝디스트는 여러 IPU-POD 시스템에 걸쳐서 애플리케이션을 실행할 수 있는 도구다.
IPU-POD128과 IPU-POD256 모두 초대형 클라우드 데이터센터용으로 개발됐다. 금융 서비스나 제약 업체 등 대규모 AI 팀을 보유한 기업이나 과학 연구소 등에 적합하다. 미국 에너지부 산하 로렌스 버클리 국립 연구소나 J.P.모건이 그래프코어를 초창기부터 이용하고 있다. editor@itworld.co.kr