PCWorld는 E3 2018에서의 사이버펑크 2077 공개 무대를 “지금까지 본 가장 환상적인 데모”라고 표현했다. CD 프로젝트레드의 전작인 위쳐 3(Witcher 3)는 당시 세대의 가장 뛰어난 게임이라는 왕좌를 차지했다. 위쳐 3는 데우스 엑스(Deus Ex)를 대신하여 실제로 필자가 가장 좋아하는 게임이 되었고, 이후 CD 프로젝트레드가 개발한 1인칭 사이버펑크 롤플레잉 게임인 사이버펑크 2077은 상상의 최대치인 ‘드림 게임’에 가깝다. 키아누 리브스, 그리고 밀레니엄 시대에 필자가 가장 좋아하는 음악가인 런 더 쥬얼스의 노래가 포함된 인기 스타가 참여한 맞춤형 사운드 트랙 등 너무나 짜릿한 소식이 계속 이어졌다. 이런 수준의 기대치에 부응하는 게임이 존재하기란 거의 불가능하다.
하지만 이것이 현실로 나타났다. 사이버펑크 2077은 12월 10일 PC와 콘솔판으로 출시되며 곧 사전 설치가 제공된다. 공개까지 약 24시간 미만이 남았는데, 현재까지 미리 플레이해 본 사이버펑크 2077은 분명 모든 기대치를 충족했다. 그저 놀랍기만 하다.
나이트 시티에서 살아간다는 것

플레이어는 인공 두뇌학적으로 강화된 용병 V를 플레이하게 된다. V의 머릿속에는 일련의 흥미진진한 사건을 겪은 후 전설적인 락스타에서 테러리스트가 된 자니 실버핸드의 AI 유령이 호스팅되고 있다. 하지만 지금까지 이 게임의 진정한 스타는 배경 도시인 나이트 시티 자체이다.
나이트 시티는 캘리포니아 어디쯤에 있을 법한 반이상향에 가까운 미래의 대도시다. 첫 번째 공개된 환상적인 데모에서 정글처럼 뺵빽한 대규모의 거리는 PCWorld 편집진을 놀라게 했다. 당시 필자의 동료 헤이든 딩맨은 이렇게 말했다.
“지금까지 많은 비디오 게임을 경험했다. 비디오 게임 경력만 30년이다. 비디오 게임에 나오는 도시가 어떤 것인지 알고 있다. 그리고 그 정의는 지난 수 년 동안 진화했다. 모로윈드(Morrowind)의 마을도 북적거렸고 그 다음에는 오블리비언(Oblivion)의 도시가 발전했다. 오리지널 어쌔신 크리드(Assassin’s Creed)의 트레일러를 보고 그 규모와 번잡함에 놀랐었다. GTA 5(Grand Theft Auto V) 안을 누비면서도 하나하나 저마다 다른 행인이 오가는 것과 그 규모에 놀랐다.
정말 진지하게 이야기한다. CD프로젝트레드가 말하는 나이트 시티가 불가능하다고 생각했었다. 최소한 지금까지는 그랬다. 이런 기술이 존재하는지 몰랐다. CD 프로젝트의 데모를 보면서도 믿기 어려울 정도였다."

그 놀라운 생동감, 생명감이 드디어 최종 릴리즈에 반영되었다. 나이트 시티는 마천루와 후미진 골목 및 도로에 상점과 네온 사인이 빼곡히 들어 찬 세상이다. CD 프로젝트레드는 엄청난 세상을 구현해냈다.
아직 모든 지역을 다 돌아보지 않았지만 방문한 곳들은 저마다 다른 느낌을 준다. 왓슨의 얽혀 있는 길과 수직성은 헤이우드의 더욱 직선적인 선과 무거운 그래피티로 이어지며 황량한 배드랜드(Badlands)는 도시와 대조를 이룬다. 지구에는 다양한 사람들이 살고 있으며 모든 영역에는 할 일을 할당해주는 현지 중개인인 음성 해결사가 있어 분위기를 고조시킨다.
군중의 밀도는 사람들이 계속 살고 있는 나이트 시티의 압력을 더한다. 필자가 2018년에 게임스컴에서 직접 데모를 보고는 현재의 콘솔 세대에서 이 게임이 출시되는 일은 없을 것이라는 트윗을 작성했었다. 사실 사이버펑크 2077 계정을 조롱한 것이나 마찬가지다. 필자의 생각은 아직 바뀌지 않았다. 사이버펑크 2077 설정에는 군중 밀도가 있으며, 필자는 오버클럭 된 5GHz 코어 i7-8700K 시스템에 최상위 지포스 RTX 3090을 갖추고 군중 규모를 최대로 설정했다. 프레임률에 영향이 있기는 하지만 게임이 왁자지껄해지기 때문에 몇 프레임을 포기할 만한 가치는 있다.

사람들은 어깨를 부딪히면 욕을 하거나 대화를 하고 있는 동안에 플레이어를 완전히 무시한다. 술에 취해 잠든 사람들과 귀여운 고양이들이 골목길 가장자리에 늘어서 있다. 번잡한 시장 안에서는 다양한 가게와 골목길, 마주치고 싶지 않은 민간 자위군을 볼 수 있다. GTA처럼 자동차가 거리를 메우고 있지만 사이버펑크 2077의 지능적인 운전자 AI는 길을 가로막지 않으려 노력한다. 새로운 모퉁이에 들어서면 임무가 표시된다. 군중을 스캔하면 체포할 수 있는 지명수배 범죄자들이 나타난다. 기본적으로 모든 곳이 북적거리기 때문에 한밤중에도 길거리에 생동감이 넘쳐난다. 단, 나이트 시티의 부유한 구역은 예외다. 북적이는 행인과 소음이 없기 때문에 부자들이 얼마나 많은 특권을 갖고 있는지 알 수 있다.

그리고 이 모든 것들이 매우 밀집되어 있다. 필자는 앞서 나이트 시티를 설명하면서 ‘뻗어 있다’고 말했었고 적절한 표현이라고 생각한다. 도시는 수평 방향만큼 수직 방향으로도 뻗어 있다. 거의 모든 곳에서 거대 도시에서 예상할 수 있는 발코니, 구불구불한 길, 보행자 전용 다리, 비상계단을 볼 수 있으며, 실제로 들어가고 액세스할 수 있는 길이 많다. 도시의 밀도는 아주 용의주도하게 설계되었고 타의추종을 불허할 정도이며 게임에 엄청난 즉흥을 더한다. 모든 캐릭터가 오리지널 데우스 엑스 이후로 느껴보지 못한 느낌을 선사한다.

잠긴 문을 여는 키코드가 없다고? 기술을 써서 얻거나 중앙 제어판을 찾아내면 된다. 경첩과 문을 분리할 수 있는 바이오모드나 이웃과 대화하여 비밀을 공유하는 특성에 포인트를 투자할 수 있다. 이도 저도 안 되면 목표 위의 옥상으로 올라가거나 아래의 구불구불한 길로 내려가 에어컨과 셔터를 살금살금 지나쳐 목적지에 도달할 수 있다. 때로는 찾기가 매우 어렵다.
이런 옵션을 찾는 과정은 진부하게 느껴지지 않는다. 대신에 나이트 시티 자체를 현명하게 활용하고 있다는 느낌이 든다.
마음대로 바꾸는 주인공 V의 외형

CD 프로젝트레드는 캐릭터를 만들 때도 즉각적인 유연성을 제공한다. V의 남성 성우와 여성 성우는 1명씩이지만 그 외에는 성기 옵션까지 매우 상세하고 심층적으로, 또 플레이어가 원하는 대로 용병을 만들 수 있다. (경고 : 사이버펑크 2077은 아동용 게임이 아니다.) 또한 V가 거리의 악동인지, 기업 에이전트인지, 배드랜드의 유목민 클랜 소속인지를 선택하게 되는데, 이 선택이 각각 게임 진행 중 고유한 대화로 나타난다.
RPG 사용자 정의도 정말로 환상적이다. 캐릭터는 반사(Reflex), 냉정함(Cool), 기술 능력(Technical Ability), 지능(Intelligence), 신체(Body) 등 5가지 핵심 스탯을 기준으로 성장한다. 각 스탯은 다양한 스킬과 연계되어 있다. 반사는 권총, 소총, 칼을 제어하며, 해커는 포인트를 지능에 투자하고 신체는 체력, 샷건, 근접 데미지를 제어하는 식이다. 스킬 레벨은 제어 속성의 레벨을 초과할 수 없기 때문에 세계적인 수준의 자물쇠 열기 전문가가 되려면 기술 능력을 쌓아야 한다.

핵심은 각 레벨에서 잠금이 해제되는 특전 능력이다. 특전은 수동형, 반응형, 능동형 특수 능력의 3종류이고, 각 스킬 트리에 있다. 예를 들어, 위장에 특화되어 있다면 자신이 발견되었을 때 자동으로 시간을 늘리거나 몰래 공격할 때 치명적인 데미지를 높이고, 위에서 적을 덮칠 때 공격을 수행하는 특전을 선택할 수 있다. 특전을 통해 캐릭터를 자신의 느낌대로 사용자 정의할 수 있으며, 특화 기능 외의 모든 스킬 트리에 특전 포인트를 투자할 수 있다.

필자는 대부분의 게임에서처럼 위장 스나이퍼가 되기로 계획하고 사이버펑크 2077을 시작했기 때문에 V를 생성하면서 반사와 냉정함에 대대적으로 투자했다. 하지만 카리스마가 넘치는 친구 잭키와 함께 나이트 시티의 거리로 들어서자 도심의 밀도 때문에 스나이핑 지점을 찾기가 어렵다는 사실을 발견했다. 또한 ‘칼질’이 아주 끝내준다는 것도 실감했다.

소총과 칼에 관계된 속성은 모두 반사이기 때문에 필자는 적진에 숨어들어 일련의 수류탄으로 적을 무력화한 후 그림자 속에서 슬로우 모션으로 베어버리는 위장 암살자가 되기 위해 장비를 교체했다. 과거를 전혀 바꿀 수 없었기 때문에 한 선택이었다. 기술 능력 스킬 트리에서 선택한 특전에 투자하면 분해된 아이템에서 고철을 얻어서 더 많은 수류탄을 만들 수 있다. 또 다른 기술 특전은 화면상 폭발 반경을 보여주어 잘못해서 내가 던진 수류탄에 부상을 입는 것을 방지한다.
이 게임의 전투는 느낌이 좋으며, 위장 같은 일부 유용한 특전에 투자했을 경우에는 더욱 그렇다. 각 무기(그리고 자동차)는 취급 방식이 다르기 때문에 실험을 통해 손에 맞는 것을 찾아야 한다. 하지만 사이버펑크 2077의 보통 난이도는 그렇게 어렵지 않다. 필자는 아직 죽은 적이 없지만, 특히 긴박한 상황에서 동료들이 당했을 때 여러 번 죽을 뻔했다.

필자의 V는 여러분의 V와 달리 해킹에 잼병이다. 필자는 이미 대안 빌드가 다른(그리고 훨씬 간단한) 경로로 갈 수 있는 수십 가지의 상황을 목격했다. 하지만 특정 영역에 특화할 생각이라면 각각 수령하는 기본 3 포인트로는 일부 기본 단계에서부터 이미 모자라므로, 모든 속성에 1 포인트씩은 투자하는 것이 좋다. 예를 들어, 신체 점수가 4 포인트 미만이라면 소유자를 죽이지 않고는 차량을 빼앗을 수 없으며 기술이 4 포인트가 안 된다면 기본적인 자물쇠를 열 수 없다.

스포일러를 방지하기 위해 스토리를 심층적으로 다루지는 않을 것이다. 하지만 사이버펑크 2077은 매우 흥미롭고 잘 만들어진 게임이며, 모든 중요한 임무에서 자신이 영화배우가 된 듯한 느낌을 든다. 필자는 스토리에 매료되었고 벌써부터 다음 스토리가 궁금하다. 나이트 시티에서 만나는 등장 인물은 진짜로 역할에 완벽하게 부합하는 것 같다. CD 프로젝트레드는 사이버펑크 2077을 위해 JALI(Jaw and Lip Integration)라는 기술에 집중적으로 투자했으며, 결과는 성공이다.
CDPR은 “JALI를 통해 감성 지향적인 립싱크와 표정 애니메이션을 절차적으로 생성할 수 있으며, 게임의 모든 NPC에 이를 사용했다”고 리뷰어 가이드를 통해 밝혔다. “게임 내에서 지원되는 모든 VO 언어에 적용되며 맞춤화 수준이 높다. 즉, 캐릭터의 언어에 상관없이 표정과 작은 움직임(근육의 떨림, 눈썹의 움직임)이 자연스럽고 진짜처럼 느껴진다. JALI를 통해 립싱크와 표정 애니메이션을 오픈 월드 전체에 적용할 수 있으며, 키프레임 애니메이션이나 FFC(Full Facial Capture) 같은 다른 기법을 사용했다면 거의 불가능했을 것이다.”
PC 사양과의 관계

지난 며칠동안 사이버펑크 2077을 플레이하기는 했지만 PC 포트의 성능에 대해서는 할 수 있는 말이 많지 않다. 필자가 받은 것은 진짜 최종본이 아니며 일반 판매 버전에는 없는 DRM이 있는 리뷰 전용본이다. CDPR과 엔비디아는 리뷰본으로 캡처한 성능 벤치마크가 최종 버전과 같다는 보장이 없다고 경고했고, 사전 공개 버전에서 시각 설정을 변경할 경우 성능 문제가 발생할 수 있다고 밝혔다.
하지만 게임 플레이를 훼방 놓지 않고도 내용과 첫인상을 공유하는 데에는 문제가 없다.

첫인상부터 시작해보자. “사이버펑크 2077를 실행할 수 있을까?”가 “크라이시스를 실행할 수 있을까?”로 바뀌었다. 이 게임은 넋을 쏙 빼 놓을 정도로 멋지다. 모든 시각 설정을 최대로 설정하면 아무리 강력한 시스템이라도 다 구현하기 어려울 것이다. 4K 해상도에서 레이트레이싱 없이 울트라 설정으로 실행하면 1,500달러의 지포스 RTX 3090이라도 초당 약 60 프레임 수준 밖에 표시하지 못하며, 운전이 포함된 장면에서는 더 떨어질 때도 있다.
광범위한 레이트레이싱 효과를 켜면 더 어려워진다. 컨트롤을 제외한 대부분의 게임은 단일 레이트레이싱 효과만 지원하지만, 사이버펑크 2077은 레이트레이싱 그림자, 레이트레이싱 반사, 레이트레이싱 앰비언트 오클루전, 레이트레이싱 확산 조명, 레이트레이싱 전역 조명을 쑤셔 넣었다. RTX 3090으로 필자가 플레이한 사전 공개 빌드에서 게임의 “RT Ultra” 설정을 활성화하면 DLSS 2.0의 프레임 부스트 퍼포먼스 모드가 활성화된 상태에서도 60fps에 채 미치지 못하며 거울을 보고 있으면 반사 표현 때문에 30fps ~ 40fps까지 곤두박질친다.
하지만 그만한 가치가 있다. 사이버펑크 2077은 레이트레이싱을 켜지 않아도 아름답다(발매 첫 날에는 아직 라데온 레이트레이싱을 지원하지 않기 때문에 좋은 소식이라 할 수 있다). 최첨단 광원 효과는 게임에 매력적인 시각적 레이어를 추가한다. 아래 스크린샷의 대리석에 비친 상, 마천루의 창문에 방 전체가 반사되는 모습, 도심 거리와 작은 바에서 네온이 빛나는 모습을 감상하자.




주요 역할을 맡아 출연한 배우 키아누 리브스의 말을 빌리자면 정말 숨이 멎는 듯하다.
모든 광원 효과를 켜고 게임을 실행하려면 DLSS 2.0이 반드시 필요하며, 따라서 DLSS의 대안이 없는 라데온 GPU에 좋지 않은 소식이고다. 주의를 경험에서 딴 데로 돌린다. 아주 공격적인 퍼포먼스 모드를 켜면, 게임의 포토 모드에서 장면이 멈출 때만 알아챌 수 있는 이상하게 희미한 가장자리를 제외하고는 시각적 품질이 크게 떨어져 보이지 않았다. 키보드의 N(또는 게임패드의 양쪽 스틱)을 누르면 즉시 포토 모드를 불러오고, 이 글에서 본 모든 멋진 사진은 이 기능으로 플레이하면서 직접 촬영한 것이다. CDPR이 제공한 사진이 아니다. 앞서 말했듯이 이 게임은 아름답다.
또한 지금까지 신기하게도 버그가 없었다. 필자가 사전 공개 빌드에서 경험한 유일한 문제점은 죽은 적의 무기가 가끔 지면으로 떨어지지 않고 공중에 떠 있는 것이었다. 몰입감이 떨어지기는 하지만 게임을 망치는 수준은 아니다.
앞으로 공개할 성능 가이드에서는 이 게임이 다양한 그래픽 카드에서 어떻게 구동되는지 심층적으로 알아보겠지만 사이버펑크 2077의 PC 사양은 그렇게 높지 않기 때문에 스케일 업/다운이 어렵지 않을 것이다. 마니아라면 일일이 손보면서 수정하고 미세하게 성능을 조정할 수 있는 시각 옵션도 풍부하다.

오디오 경험도 모범적이다. 도시의 번잡한 소리가 군중의 북적이는 소음부터 경적 소리, 고기가 지글거리는 소리, 횡단보도에서 요란하게 울리는 로봇 목소리의 통행 금지 안내(DON’T WALK, DON’T WALK)까지 게임의 분위기를 고조시킨다. 배경 음악도 게임에 잘 어울린다. CD 프로젝트레드는 사려깊게도 설정에 저작권 문제가 일어날 수 있는 트랙을 비활성화하는 ‘스트리머 모드’ 옵션을 넣었다. 이 기능을 활성화하면 DMCA의 공격을 피할 수 있을 것이다.
살아 숨쉬는 도시와 독특한 캐릭터

CD 프로젝트레드는 긴 개발 기간 동안 무거운 부담을 졌지만, 사이버펑크 2077은 그 어려운 일을 해냈다. 사전 플레이 중 크게 불만스러운 점을 발견하지 못했다.
게임은 외관이 멋지고 소리가 감미로우며 위쳐 3만큼 느낌이 강렬하다. 심층적이고 놀랍도록 유연한 캐릭터 사용자 정의 옵션은 위쳐 시리즈와 달리 게임을 처음 시작한 후에도 지속적으로 할 만한 가치를 제공하며, 높은 자유도와 광범위한 스토리가 합쳐져 재미가 배가된다.
필자가 V와 사이버 용병단을 좋아하듯, 배경이 되는 나이트 시티 자체도 진정한 스타이다. 거대 도시가 다른 게임이 범접할 수 없는 진짜 살아있고 밀집되어 있으며 인상적인 도시로 느껴진다. 그렇다. GTA V의 거리에도 사람들이 많지만 사이버펑크에서는 거리 자체에서 생동감이 느껴진다.

다시 한번 강조하지만, 필자가 플레이한 것은 수십 시간에 불과하기 때문에. 스토리 자체에 대한 인상은 앞으로 달라질 수도 있다. 하지만 개발사 전작인 위쳐 2와 3의 엔딩은 그야말로 훌륭했고, (최소한 필자에게)이 게임의 진정한 묘미는 나이트 시티 안에 존재하는 것이다. 해결사가 의뢰를 가져오기를 기다리면서 네온 조명과 귀여운 고양이를 보고, V의 지능, 스킬, 인맥을 활용해 밀집된 거리와 번잡한 마천루를 활보한다.
메인 줄거리가 끝에서 조금 헤매는 느낌은 있었지만, 그 절묘한 핵심적인 게임플레이 경험을 빼앗아가지는 못할 것이다. 수십 시간을 플레이했는데도 나이트 시티의 첫 번째 6개 지역과 주변의 배드랜드에 아직 미션이 많이 남아 있다. V에게 무슨 일이 생기더라도, 나이트 시티의 모든 거리를 다 돌아다니고 싶다. 그야말로 사랑에 빠졌다. editor@itworld.co.kr
Sponsored
Intel
데이터센터 성능을 재정의하는 게임 체인저 ‘4세대 인텔® 제온® 스케일러블 프로세서’
ⓒ Getty Images Bank AI, HPC, 첨단 분석 등 새로운 유형의 워크로드가 급부상하면서 데이터센터의 성능에 대한 재정의가 필요한 시대가 되었다. 이런 시대적 요구에 부응하기 위해 인텔은 4세대 제온 스케일러블 프로세서(코드명 사파이어 래피즈)라는 답을 내놓았다. 인텔은 이전 세대에 비해 성능, 확장성 및 효율성을 크게 개선한 4세대 제온 스케일러블 프로세서로 차세대 데이터센터에 대한 인텔의 전략을 구체화하고 있다. 성능 최적화의 새로운 관점 ‘워크로드 최적화’ 4세대 제온 스케일러블 프로세서는 ‘다양한 워크로드 각각의 요구에 맞는 최대 성능을 끌어 낸다’라는 한 줄로 핵심을 짚을 수 있다. 이 프로세서의 설계 사상은 AI, HPC, 첨단 분석 등 다양한 워크로드의 요구사항을 충족하기 위해 CPU 및 관련 기술을 설계하고 최적화하는 것이다. 최근 기업들이 주목하는 주요 워크로드는 각각 성능에 대한 요구와 기준이 다르다. 예들 들어 AI 워크로드는 매트릭스 연산과 병렬 처리에 크게 의존한다. 더불어 대용량 데이터 세트를 처리해야 하는 경우가 많아 CPU와 메모리 간의 효율적인 데이터 전송을 위해 높은 메모리 대역폭이 필요하다. AI 워크로드에 맞는 최고의 성능을 제공하기 위해 인텔은 4세대 제온 스케일러블 프로세서에 고급 매트릭스 확장(AMX)과 같은 특수 명령어 세트와 통합 가속기를 내장하였다. 이는 꽤 주목할 개선이다. AMX의 내재화는 CPU도 AI 처리가 준비됐다는 것을 뜻한다. 이는 AI 인프라에서 CPU의 역할을 크게 확장할 전망이다. 최근 ChatGPT의 등장과 함께 모든 기업의 관심사가 된 초거대 언어 모델 기반 생성형 AI 전략 수립에 있어 AMX에 관심을 두는 곳이 늘고 있는 것도 같은 맥락에서 이해할 수 있다. HPC 워크로드는 복잡한 수학적 계산이 포함되며 높은 부동소수점 성능을 보장해야 한다. HPC 워크로드에는 병렬 처리가 수반되는 경우가 많다. 멀티코어 CPU는 이러한 워크로드를 가속하는 데 있어 핵심이라 할 수 있다. 또한, 대규모 HPC 시뮬레이션은 효율적인 데이터 처리를 위해 높은 메모리 용량과 대역폭도 요구한다. 이런 특수성도 4세대 제온 스케일러블 프로세서는 유연하게 수용한다. 4세대 제온 스케일러블 프로세서는 최대 8채널 DDR5 메모리 구성 및 인텔 옵테인 퍼시스턴트 메모리(Optane Persistent Memory)를 지원하여 HPC 시뮬레이션을 위한 높은 메모리 용량과 대역폭을 제공한다. 또한, PCIe 5.0을 지원하여 PCIe 4.0의 두 배에 달하는 대역폭을 제공하여 CPU와 가속기 및 스토리지와 같은 기타 장치 간의 통신 속도가 빠르다. QAT를 통해 암호화 및 압축 워크로드를 가속화하여 네트워킹 및 스토리지와 같은 애플리케이션의 성능과 효율성도 크게 높인다. 열거한 특징들은 HPC뿐 아니라 AI 워크로드의 성능 요구에도 부합한다. 다음으로 첨단 분석의 경우 적시에 통찰력을 제공하고 빠른 의사결정을 지원하려면 지연 시간을 최소화하면서 데이터를 빠르게 처리할 수 있는 CPU가 필요하다. 인텔은 단일 스레드 성능 및 멀티 스레딩 기능을 향상시켜 실시간 분석을 위한 저지연 처리를 가능하게 한다. 그리고 인텔 프로세서는 최적화된 캐시 계층 구조를 갖추고 있어 메모리 액세스 시간을 최소화하여 실시간 분석 워크로드의 지연 시간을 줄이고 성능을 개선할 수 있다. 여기에 4세대 제온 스케일러블 프로세서는 넓은 메모리 대역폭으로 데이터베이스 성능을 향상하고 인텔 인-메모리 분석 가속기(IAA), 데이터 이동 속도를 높이는 인텔 데이터 스트리밍 가속기(DSA)까지 통합하여 실시간 데이터 처리 성능을 높였다. 요약하자면 워크로드마다 특화된 CPU 기능, 아키텍처 또는 가속기가 필요한 요구사항이 다르다. AI 워크로드는 가속 기술과 넓은 메모리 대역폭의 이점을 누리고, HPC 워크로드는 높은 부동소수점 성능과 병렬 처리가 필요하며, 실시간 분석 워크로드는 지연 시간이 짧은 처리와 효율적인 I/O 및 스토리지가 필요하다. 4세대 제온 스케일러블 프로세서는 다양한 워크로드의 성능 요구를 수용하여 각각 최대의 성능을 끌어 낸다. 워크로드 최적화 성능 추구가 가능한 이유 CPU의 발전사를 보면 무어의 법칙의 시대를 지나 멀티 코어의 시기가 이어지고 있다. 멀티 코어는 현재 진화를 거듭 중인데 최근 동향은 더 나은 성능과 에너지 효율성을 보장하는 가운데 워크로드별 최적화를 지원하는 것이다. 이를 실현하기 위해 인텔은 코어 수를 늘리는 가운데 다양한 가속기를 CPU에 통합하는 방식을 택하였다. 이런 노력의 결과물이 4세대 제온 스케일러블 프로세서다. 멀티코어 아키텍처는 병렬 처리를 가능하게 하여 성능과 에너지 효율을 높인다. 예를 들어 인텔의 제온 스케일러블 프로세서는 최대 60개의 코어를 가지고 있어 AI, HPC, 실시간 분석 등 다양한 워크로드 처리에 이상적이다. 여기에 다양한 가속기를 통합하여 워크로드마다 차이를 보이는 최적의 성능 목표 달성에 한걸음 더 가까이 다가서고 있다. 또한, 4세대 제온 스케일러블 프로세서는 CPU와 가속기 간의 고속 통신을 위해 설계된 개방형 산업 표준 인터커넥트인 컴퓨트 익스프레스 링크(CXL)를 지원한다. 이 밖에도 인텔은 상호 연결 및 효율적인 전력 공급을 위해 4개의 실리콘 다이를 EMIB(Embedded Multi-Die Interconnect Bridge)라는 고급 패키징 기술로 연결했다. 인텔의 EMIB 기술은 CPU 설계 및 패키징의 패러다임 전환을 잘 보여준다. 인텔은 프로세서를 타일이라고 하는 더 작은 모듈식 구성 요소로 분할하고 EMIB라는 작은 실리콘으로 연결하여 하나의 Monolithic 구조와 같은 성능, 에너지 효율성 및 설계 유연성을 높였고 그 결과물이 4세대 제온 스케일러블 프로세서다. 인텔은 고급 패키징 기술을 통해 다양한 가속기를 통합하면서도 높은 전력 효율을 달성했다. 가령 4세대 인텔 제온 스케일러블 프로세서가 내장된 가속기를 사용하면 이전 세대 대비 워크로드 처리에 있어 평균 2.9배 높은 와트당 성능 목표 달성이 가능하다. 더 자세히 알아보면 범용 컴퓨팅에서 53% 평균 성능 향상을 기대할 수 있고, AI는 최대 10배 높은 추론과 학습 성능, 네트워킹과 스토리지 분야에서는 95% 적은 코어로 더 높은 데이터 압축 성능을 보여 최대 2배 성능을 높일 수 있고, 데이터 분석의 경우 최대 3배 성능 개선이 가능하다. 달라진 게임의 법칙 4세대 제온 스케일러블 프로세서의 등장으로 차세대 데이터센터 시장을 놓고 벌이는 다양한 프로세서 간 새로운 경쟁이 본격화될 전망이다. 4세대 제온 스케일러블 프로세서는 단순한 신제품이 아니다. 다양한 워크로드의 급변하는 요구 사항을 해결하고 성능, 확장성 및 효율성에 중점을 둔 차세대 데이터센터 구축에 대한 인텔의 전략을 상징한다. 4세대 제온 스케일러블 프로세서는 반도체 시장의 게임의 법칙은 시대의 흐름에 따라 바뀐다는 것을 보여주는 산증인이다.
Intel
인텔이 12가지 가속기로 데이터센터에 확장성과 유연성을 추가하는 방법
ⓒ Getty Images Bank 사파이어 래피즈(Sapphire Rapids)라는 코드명으로 알려진 인텔의 4세대 제온 스케일러블 프로세서가 최근 출시됐다. 이 칩은 12가지 가속기로 주목받고 있지만 기능적인 흥미를 넘어 인텔이 급격하게 변화하는 데이터센터, 서버, 클라우드 시장에 대응하는 방법이 반영되어 있다는 점에 주목할 필요가 있다. 프로세서의 근본적인 역할은 연산에 있다. 프로세서는 여전히 연산을 빠르게 많이 할 수 있으면 좋다. 하지만 처리해야 하는 데이터의 종류와 특성이 다양해지면서 데이터를 다루는 방법도 진화했다. 그리고 이는 실질적인 성능의 향상으로 이어진다. 나승주 인텔 데이터센터 담당 상무는 4세대 제온 스케일러블 프로세서가 새로운 데이터센터 환경을 반영한다고 설명한다. ⓒ Intel “단순히 작동속도와 코어의 개수를 늘리는 것만이 최고의 가치를 주는 것은 아닙니다. 폭발적으로 증가하는 데이터센터 수요와 복잡한 데이터 처리에 대한 필요성을 풀어내기 위한 방법은 단순히 트랜지스터 수에만 의존할 일이 아니라 완전히 새로운 방법을 찾을 필요가 있습니다.” 인텔코리아 나승주 데이터센터 담당 상무는 데이터센터 환경이 달라지는 만큼 프로세서 구조도 새로 그려져야 한다고 설명한다. 그 관점에서 4세대 제온 스케일러블 프로세서는 이전과 다른 두 가지 전환점을 갖는다. 한 가지는 연산의 양적 증가, 다른 하나는 데이터 처리의 효율성이다. “모놀리식 아키텍처로는 소켓당 절대적 성능을 높이는 데에 한계가 있습니다. 이를 극복하기 위한 노력이 여전히 이어지고 있지만 단위 칩을 더 작게 만들고 효과적으로 연결하는 방법으로 성능 손실을 최소화하고 단일 칩에 준하는 처리 능력을 제공할 수 있습니다.” 최대 4개의 칩릿을 묶는 구조로 같은 공간 안에 더 많은 코어를 넣을 수 있다. ⓒ Intel 인텔은 사파이어 래피즈를 통해 ‘칩릿(Chiplet)’ 구조를 녹였다. 한정된 공간 안에 더 많은 코어를 넣는 것은 반도체 업계의 숙제였다. 제온 스케일러블 프로세서는 4개의 칩릿을 이어 붙여 최대 60개 코어를 쓴다. 칩릿 구조는 생산이 훨씬 쉬워지고 필요에 따라서 단일 칩부터 2개, 4개 등 필요한 만큼 이어 붙여 다양한 설계의 자유도를 제공하기도 한다. 핵심 기술은 칩과 칩 사이를 손실없이 연결하는 데에 있다. “중요한 것은 인터페이스와 패키징 기술입니다. 사실 이 칩릿 구조는 인텔만의 고민은 아닙니다. 반도체 업계, 그리고 더 나아가 산업 전체의 숙제이기 때문에 이를 공론화해서 업계가 함께 답을 찾아가는 중입니다.” 나승주 상무는 기술 개방과 표준에 해결책이 있다고 말했다. UCIe(Universal Chiplet Interconnect Express) 컨소시엄을 통해 전 세계 반도체 관련 기업들이 경쟁을 내려놓고 답을 찾아가고 있다. UCIe는 단순히 코어와 코어를 연결하는 수준이 아니라 단일 패키지 안에서 GPU도, 컨트롤러도, 또 가속기도 성능 손실을 최소화하면서 이어붙일 수 있다. 성능의 확장 뿐 아니라 단순화된 칩들을 자유롭게 맞붙이는 설계의 자유도 얻게 된다. ⓒ Intel 이 모듈형 칩릿 구조를 적극적으로 활용하는 또 하나의 방법이 바로 12가지 가속기다. 데이터의 특성에 맞는 처리 방법은 점점 중요해지고 있다. 인텔은 오래 전부터 MMX(Multi Media eXtension)와 SSE(Streaming SIMD eXtensions)를 비롯해 AVX(Advanced Vector Extensions)와 최근에는 AMX (Advanced Matrix Extensions) 까지 데이터를 효과적으로 처리하는 기술을 발전시켜 왔다. 사파이어 래피즈의 가속기는 프로세서를 현대 데이터센터의 필요에 맞춰 최적화할 수 있는 방법이라는 것이 나승주 상무의 설명이다. “클라우드는 가상머신과 네트워크는 물론이고, 암호화와 인공지능 처리까지 더욱 복잡해지기 때문에 기업은 설계의 고민이 많습니다. 클라우드에서 GPU의 활용도가 높아지고 있는 것은 사실이지만 머신러닝의 학습과 추론 작업의 80%가 CPU에서 이뤄지고 있습니다. 프로세서가 이를 받아들일 필요가 있습니다.” AMX(Advanced Matrix Extensions)가 더해진 이유도 막대한 실시간 학습 데이터가 필요하지 않은 상황에서 범용적인 인공지능 학습이 CPU만으로 충분히 빠르게 이뤄질 수 있도록 하기 위해서다. AMX는 텐서플로와 파이토치 등 범용적인 머신러닝 프레임워크에 최적화되어 기존 환경을 그대로 가속한다. 12가지 가속기를 통해 데이터센터의 특성에 맞는 서버를 구성할 수 있다. ⓒ Intel 마찬가지로 데이터센터에서 큰 리소스를 차지하는 암호화 효율을 높여주는 QAT(QuickAssist Technology), 로드밸런싱을 맡는 DLB(Dynamic Load Balancer), 인메모리 분석 처리를 가속하는 IAA(In-Memory Analytics Accelerator), 데이터 스트리밍을 가속하는 DSA(Data Streaming Accelerator) 등 별도의 전용 가속 코어를 두고, 필요에 따라서 가속기를 선택할 수 있도록 했다. 그리고 이는 데이터센터의 자원 관리에 직접적으로 영향을 끼치게 된다. “가속기가 실제 현장에서 주는 가치는 특정 리소스를 빠르게 처리하는 것도 있지만 특정 처리에 대한 부담을 덜어 CPU가 본래 해야 할 연산에 집중하는 것입니다. 데이터센터에서 70개 코어를 할당해서 쓰던 암호화가 사파이어 래피즈의 QAT 가속기를 이용하면 11개 코어로 충분합니다. 나머지는 실제로 데이터센터가 처리해야 하는 인스턴스에 할당되면서 자원의 효율이 크게 높아집니다.” ⓒ Intel 4세대 제온 스케일러블 프로세서는 구조의 변화와 가속기를 통해서 ‘스케일러블(Scalable)’이라는 이름이 어울리는 확장성을 갖게 됐다. 이는 곧 데이터센터의 최적화, 그리고 유연성과도 연결된다. 반도체는 시대의 흐름을 읽어야 하고, 인텔은 사파이어 래피즈를 통해 기술로 그 답을 제시하고 있다.