데이터센터 / 미래기술

“프로그래밍 가능한 멀티코어 CPU” 데이터 처리 장치(DPU)가 부상한다

Michael Cooney | Network World 2023.09.14
AI와 보안, 네트워킹 애플리케이션에 더 높은 시스템 성능이 필요해지면서 대기업 환경에서 데이터 처리 장치(Data Processing Unit, DPU)가 빠르게 확산하고 있다. 기존의 DPU 발전은 대부분 하이퍼스케일러를 대상으로 했지만 앞으로는 데이터센터와 엔터프라이즈 네트워크의 다른 부분에서 DPU 사용이 증가할 전망이다. DPU 기술과 네트워킹 스위치의 결합도 나타날 것으로 보이는데, AMD 펜산도(AMD Pensando)는 이 기술 조합을 “스마트스위치(smartswitch)”로 지칭한다. 
 
ⓒ Getty Image Bank

이 범주에 일찌감치 뛰어든 주자는 AMD 펜산도의 DPU 기술과 하이엔드 스위칭 기능을 결합한 HPE 아루바(HPE Aruba)의 CX 10000이다. 2022년에 출시된 CX 10000은 3.6Tbps의 스위칭 용량을 갖춘, 랙 최상단에 설치되는 L2/3 데이터센터 박스다. 이 제품만 있으면 저지연 트래픽, 보안 및 로드 밸런싱을 처리하는 별도의 어플라이언스가 필요 없다.

AMD 펜산도의 네트워킹 기술 및 솔루션 그룹 최고 비즈니스 책임자인 소니 지안다니는 “스마트스위치는 기업 환경에서 오래된 어플라이언스를 버리고 네트워크의 기술 수준과 규모를 대폭 강화할 수 있게 해주므로 DPU 기술을 흡수하는 가장 쉬운 방법이다. 많은 기업에서 진입 장벽도 낮춰준다. 지금까지 DPU 자산을 도입한 300곳 이상의 CX 10000 설치 기업 환경을 보면, 클라우드 사용 기업과 마찬가지로 초거대 기업부터 중간 규모 기업까지 다양하다”라고 말했다. 지안다니에 따르면, 스마트스위치와 DPU의 통합은 통합, 현대화, 보안과 같은 핵심적인 엔터프라이즈 이니셔티브를 따르는 것이기도 하다. 구현하는 첫날부터 뛰어난 가시성과 텔레메트리, 성능을 얻을 수 있다.

현재 시중에서 혼합 DPU 기술을 지원하는 유일한 스위치는 CX 10000이지만 전문가들은 앞으로 더 많은 제품이 출시될 것으로 예상한다. 650 그룹(650 Group)의 창립 기술 분석가인 앨런 웨켈은 최근 보고서에서 “2022년과 2023년 1분기 동안 CX 10000 플랫폼과 HPE 아루바의 스마트스위치 제품군이 견조하게 성장했다. 주요 업체인 시스코와 아리스타, 주니퍼, 델이 이 분야를 주목하고 있으며, 대부분 2024년 중에 관련 제품을 출시할 것으로 보인다”라고 말했다. 

2024년 말에는 650 그룹이 예측한 포트의 절반 이상이 DPU 기반 솔루션과 ASIC 자체의 직접 프로그래밍 기능을 통해 구현되는 스마트 포트 또는 프로그래밍이 가능한 포트가 될 전망이다. 현재 데이터센터 시장은 전통적인 워크로드를 넘어 AI/ML로 이동하면서 네트워크도 더 발전하고 있다. 따라서 단순히 컴퓨팅 어플라이언스와 최종 사용자 간에 연결을 제공하는 빠른 경로 이상의 역할을 해야 한다. 

웨켈은 “전통적인 스위칭 ASIC에는 처리 용량, 충분한 하드웨어 메모리 리소스 또는 유연한 프로그래밍 가능 데이터 플레인이 없어 상태 유지(stateful) 네트워크 기능이나 서비스를 구현할 수 없는 한계가 있다. 앞으로 네트워킹은 더 강력해질 것이며, 네트워크 가상화, 상태 유지 방화벽 같은 향상된 보안, 로드 밸런싱, QoS, 비용 계측을 위한 상태 유지 네트워크 기능이 기존의 값비싼 어플라이언스에서 이더넷 스위치로 이전될 것이다. 이를 통해 기업은 DPU가 내장된 네트워크에서 개선된 성능과 비용 절감 효과, 더 높은 민첩성을 얻게 된다"라고 말했다.

가상 환경에서 네트워크 트래픽 암호화 및 방화벽과 같은 기능을 DPU에 탑재하는 것도 이 기술 사용을 촉진하는 요인이다. 전문가들은 네트워크를 방화벽 구역으로 분할하는 마이크로세그멘테이션 정책을 시행하기 위해 필요한 처리 기능 역시 스마트NIC가 담당할 수 있다고 분석한다. 지안다니는 “모든 서버에서 포괄적인 보안 및 마이크로세그멘테이션과 방화벽 기능을 제공하고 분산된 정책 기반 모델을 통해 애플리케이션을 보호하는 기능이 DPU의 핵심 요소가 될 것이다. 현재 기업은 DPU 환경 내에서 30~60%의 총소유비용 절감 효과를 얻고 있다”라고 말했다. 

여기서 끝이 아니다. 기업은 다른 핵심 애플리케이션에도 DPU를 활용할 수 있다. 델 오로 그룹(Dell Oro Group)의 선임 디렉터 바론 펑은 최근 스마트NIC 서밋(SmartNIC Summit)에서 “스토리지 오프로드에는 인라인 암호화를 위한 가속기와 NVMe-oF 지원이 포함된다. VM웨어의 프로젝트 몬테레이(Project Monterey)와 같이 하이퍼바이저도 CPU에서 스마트NIC로 옮기고 이를 통해 많은 맞춤 구성 없이도 사용률을 개선할 수 있다”라고 말했다. 실제로 VM웨어는 프로젝트 몬테레이에서 NSX용 DPU 기반 가속이라는 기능을 개발했다. 이 기능은 기업이 네트워킹, 로드 밸런싱, 보안 기능을 DPU로 이전해서 서버 CPU 용량의 부담을 덜 수 있게 해준다. 

VM웨어에 따르면 이 시스템은 DPU에서 분산 방화벽, 또는 대규모 데이터베이스 서버를 지원해 서버 환경에 영향을 미치지 않으면서 방대한 트래픽을 안전하게 처리한다. 펑은 “프로젝트 몬테레이는 엔터프라이즈의 스마트 NIC 도입을 촉진할 것으로 전망된다. 단, 현재는 AMD와 인텔, 엔비디아와 같은 주요 업체의 지원에도 불구하고, 최종 사용자는 아직 스마트 NIC의 총소유비용(TCO)을 검증하는 단계여서 도입은 더딘 상황이다. 표준 네트워크 인터페이스 카드 시장의 성장은 향후 5년 동안 한자릿수에 머물겠지만 데이터 처리 장치(DPU) 또는 인프라 처리 장치(IPU)와 같은 변형을 포함한 스마트NIC 시장은 30% 넘게 성장할 것으로 전망한다"라고 말했다.

DPU의 또 다른 주요 응용 분야는 대기업의 AI 애플리케이션 지원을 돕는 것이다. 델오로 그룹은 최근 발표한 데이터센터 시장 전망에서 AI 워크로드를 지원하기 위해 2027년까지 이더넷 데이터센터 스위치 포트의 20%가 가속 서버에 연결될 것으로 전망했다. 델오로 부사장 사메 부젤빈은 "새로운 생성형 AI 애플리케이션의 부상은 이미 견고한 데이터센터 스위치 시장의 성장을 한층 더 촉진하는 데 도움이 될 것이다. 향후 5년에 걸쳐 시장 누적 매출이 1,000억 달러를 넘어설 것으로 보인다"라고 말했다.

650 그룹은 또 다른 최근 보고서 역시, AI/ML이 엄청난 네트워크의 대역폭 성능을 요구하기 때문에 AI/ML이 향후 5년 동안 데이터센터 스위칭의 주요 성장 동력 중 하나가 될 것으로 예상했다. AI 대역폭이 증가하면서 AI/ML 및 가속 컴퓨팅에 연결되는 이더넷 스위칭 비중은 지금의 틈새 시장 수준에서 2027년에는 상당한 규모로 커진다는 것이다.

이 때문에 지안다니는 AI 네트워킹의 증가하는 요구사항을 충족하기 위해 이더넷 기술의 혁신이 지속적으로 이뤄질 것으로 전망한다. 특히 그는 AMD 페산도의 DPU 기술과 관련해 프로그래밍 기능을 가장 큰 장점으로 꼽았다. 이를 이용하면 기업이 자체 혼잡 관리 기능을 갖춘 AI 파이프라인을 맞춤 구축할 수 있기 때문이다.

울트라 이더넷 컨소시엄(UEC) 등이 이를 지원하는 것도 같은 맥락에서 볼 수 있다. AMD, 아리스타, 브로드컴, 시스코, 에비든, HPE, 인텔, 메타, 마이크로소프트는 최근 리눅스 재단이 주관하고 물리, 링크, 전송 및 소프트웨어 계층 이더넷 발전을 추진하는 그룹인 UEC를 발표했다. UEC는 AI에 필요한 수준의 규모와 속도를 처리하기 위해 현재의 이더넷 기술을 보완하는 데 중점을 둔다. 

지안다니는 “AMD 펜산도는 AI 네트워크와 그 네트워크 위에서 실행되는 애플리케이션을 제공하기 위한 필수적인 서비스를 수용할 역량을 갖췄다. 광범위한 파트너 생태계를 구축해 AI 네트워킹 비용을 낮추고 기업이 동종 최고의 네트워킹 기술을 자유롭게 선택할 수 있도록 할 것이다. 우리는 기업이 고도로 프로그래밍 가능한 방식으로 AI를 채택할 수 있도록 지원하려 한다”라고 말했다. 

엔비디아 엔터프라이즈 컴퓨팅 부문 부사장 마누비르 다스는 골드만삭스 커뮤나코피아 및 기술 컨퍼런스에서 향후 AI 시장을 전망하면서 전체 AI 시장이 칩 및 시스템 부문 3,000억 달러, 생성형 AI 소프트웨어 부문 1,500억 달러, 옴니버스 엔터프라이즈 소프트웨어 부문 1,500억 달러로 구성될 것으로 예상했다. 야후 파이낸스에 따르면 다스는 이러한 수치가 장기적인 성장을 반영한 것이라고 했지만 구체적인 기간까지 언급하지는 않았다. 현재 엔비디아는 AI와 AI의 GPU 기술을 통해 막대한 이익을 거두고 있다. 아직은 주로 하이퍼스케일러 네트워크에서 이뤄지고 있다. 실제로 엔비디아의 2분기 매출은 AI 성장에 힘입어 전년 동기 대비 101% 급증한 135억 1,000만 달러를 기록했다.
editor@itworld.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.