양자 머신러닝의 씨앗을 심는 AI 업체…2020년대에 꾸준한 확산 기대

InfoWorld
양자는 첨단 컴퓨팅 분야에 일어날 다음 혁신이라기보다는 모든 분야를 통틀어 가장 큰 혁신이 될 잠재력을 지닌 미래의 접근 방법이라고 하는 편이 더 정확하다.

비현실적으로 보이고 천문학적으로 평행하며 깰 수 없도록 암호화되고 빛보다 빠른 아원자 계산을 가능하게 해주는 양자 패브릭의 이론적인 가능성을 고려하면 양자는 AI의 발전에 있어 궁극의 아키텍처가 될 수 있다.
 
ⓒ Microsoft

IT 산업이 양자 기술의 개발과 상용화에 있어 상당한 진척을 이루고 있다는 점에는 이론의 여지가 없다. 그러나 이 열기로 인해 전례 없는 수준의 과장이 형성되는 중이기도 하다. 양자 기술이 컴퓨팅 분야에서 전통적인 폰 노이만 아키텍처의 진정한 후계자임을 입증하기까지는 시간이 걸릴 것이다.

언론에서는 프로그래밍 가능한 양자 소자가 폰 노이만 아키텍처의 범위를 넘어선 문제를 해결할 수 있다는 주장을 근거로 양자 우위를 주장하지만, 정작 양자의 현실성에 대한 이야기는 찾아보기 어렵다. 달리 말하면 양자 컴퓨터가 AI나 머신러닝 및 기타 첨단 분석의 실제 사용례에 적용되고 있다는 증거는 여전히 거의 없다.
 

주류 AI와 머신러닝을 향한 머나먼 길

AI는 진작부터 양자 컴퓨팅의 킬러 앱으로 꼽혀왔지만, 상용 데이터 분석 영역에서 양자의 존재감은 아직 거의 없다.

우리는 최근의 업계의 움직임이 우리 스스로를 혹독한 “양자의 겨울”로 몰아가고 있지는 않은 지 자문해야 한다. 양자의 겨울이란 양자 기술에 대한 초기 과장에 대한 역풍으로 찾아올 긴 AI의 혹한기를 의미한다. 여러 평행 우주에 걸쳐 실행되는 양자 분석이 가진 놀라운 가능성에 대한 이야기도 좋지만, 지금 우리의 일상에 큰 변화를 가져올 명확한 킬러 앱을 가진 성숙한 기술을 눈앞에 제시하는 것은 전혀 별개의 사안이다.

그럼에도 불구하고 연구자는 물론 분석 전문가들 사이에서도 머신러닝이 일상에서 양자의 핵심 사용례가 될 것이라는 공감대가 커지고 있다.

최근에 나온 이야기가 아니다. MIT 교수 세스 로이드는 2013년에 이미 “첫 양자 응용 분야”는 머신러닝이라고 선언했다. 구체적으로 로이드는 “q-앱”을 제안했다. q-앱은 “양자 컴퓨터가 거대한 데이터베이스를 통해 실시간 검색을 수행할 수 있도록 해줄 뿐만 아니라 절대적인 프라이버시도 보장하는(검색 엔진 공급업체가 쿼리를 도청하려고 시도할 경우 섬세한 q-비트의 상태 중첩이 훼손되므로) q-비트를 사용해 구글과 같은 쿼리를 인코딩”한다.

더 중요한 점은 최근 양자 컴퓨팅 영역에서 아마존 웹 서비스, 마이크로소프트, IBM, 허니웰의 제품 출시와 여러 발표 내용이 다양한 수준에서 AI와 머신러닝 사용례를 다루고 있다는 것이다. 이러한 발표 중에서 실질적인 비즈니스 문제를 해결하는, 보편적으로 사용 가능한 양자 제품이나 서비스와 관련된 것은 없다. 그러나 대부분의 발표에는 프로그래머가 양자 하드웨어 플랫폼 또는 클라우드 서비스에서 이러한 솔루션을 개발할 수 있게 해주는 도구가 포함되어 있다.

마이크로소프트는 2019년 11월 애저 퀀텀(Azure Quantum)을 발표했다. 이 양자 컴퓨팅 클라우드 서비스는 현재 비공개 프리뷰 단계이며 올 하반기 일반 공개될 예정이다. 마이크로소프트가 개발한 양자 지향 Q# 언어, 그리고 파이썬과 C# 및 기타 언어를 위한 마이크로소프트 오픈 소스 퀀텀 개발 키트와 함께 제공된다. 이 키트에는 ML, 암호화, 최적화 및 기타 영역의 양자 앱 개발을 위한 라이브러리가 포함된다.

애저 퀀텀이 발표되고 한달 뒤에는 AWS가 아마존 브라켓(Amazon Braket) 서비스를 발표했다. 역시 아직 프리뷰 단계인 아마존 브라켓은 완전 관리형 AWS 서비스로, 과학자와 연구자, 개발자가 한 곳에서 D-웨이브(D-Wave), 아이온Q(IonQ), 리게티(Rigetti)를 비롯한 양자 하드웨어 제공업체의 컴퓨터를 사용해 실험할 수 있게 해준다. 양자 알고리즘(머신러닝 포함)을 구축하고 시뮬레이션된 양자 컴퓨터에서 테스트하기 위한 단일 개발 환경을 제공한다. 개발자는 다양한 하드웨어 아키텍처에서 ML 및 기타 양자 프로그램을 실행할 수 있다. 또한 사용자는 아마존 브라켓 개발자 툴킷이나 주피터(Jupyter) 노트북과 같은 익숙한 툴을 사용해서 양자 알고리즘을 설계할 수 있다.

이후 1월에는 IBM이 20만 명 이상의 사용자가 IBM 클라우드를 통해 IBM의 양자 시스템과 시뮬레이터에서 수천억 개의 실행 작업을 구동하는 Q 네트워크(Q Network)의 확장을 발표했다. 네트워크 참가자들은 IBM의 양자 전문 기술과 리소스, 오픈소스 키스킷(Qiskit) 소프트웨어 및 개발자 툴을 이용하고 클라우드 기반으로 IBM 퀀텀 컴퓨테이션 센터(IBM Quantum Computation Center)에도 액세스할 수 있다. 현재 실행 중인 워크로드의 상당수에는 머신러닝, 양자 컴퓨팅 아키텍처의 실시간 시뮬레이션이 포함된다.

약 2주 전에는 허니웰이 3개월 내에 고용량 양자 컴퓨터를 일반 공개할 것이라고 발표했다. 또한 허니웰 벤처스(Honeywell Ventures)가 케임브리지 퀀텀 컴퓨팅(Cambridge Quantum Computing)과 자파타 컴퓨팅(Zapata Computing)에 투자 중이라는 사실도 발표했다. 두 회사 모두 머신러닝에 대한 전문 기술과 양자 컴퓨팅 응용을 위한 교차 영역(cross-vertical) 알고리즘 및 소프트웨어를 보유했다.
 

양자 툴, 주요 AI/머신러닝 개발 프레임워크로 진출

가장 중요한 발표는 며칠 전에 나왔다. 구글 텐서플로우 퀀텀(TensorFlow Quantum)의 출범이다. 소프트웨어로만 구성되는 새로운 스택으로, 널리 도입된 텐서플로우 오픈소스 머신러닝 라이브러리와 모델링 프레임워크를 확장해 양자 컴퓨팅 플랫폼에서 머신러닝 모델 구축과 학습을 처리하도록 지원한다.

구글의 X 연구개발 부서에서 개발한 텐서플로우 퀀텀은 데이터 과학자가 파이썬 코드를 사용해서 표준 케라스(Keras) 함수를 통해 양자 머신러닝 모델을 개발할 수 있게 해주며, 기존 텐서플로우 API와 호환되는 양자 회로 시뮬레이터와 양자 컴퓨팅 프리미티브 라이브러리를 제공한다.


텐서플로우 퀀텀의 출시는 구글이 “전통적인 컴퓨팅 아키텍처로는 불가능했을 양자 컴퓨팅의 개가를 이뤘다”면서 양자 패권을 선언한 몇 개월 후에 나온 만큼 깜짝 발표라고 할 수는 없다.

구글은 양자 프로세싱을 혼합할 수 있는 전체 AI/머신러닝 소프트웨어 스택을 제공하는 외에 텐서플로우 퀀텀이 양자 머신러닝을 시뮬레이션할 수 있는 전통적인 칩 아키텍처의 범위도 확장할 방침이다. 구글은 이 툴에서 지원하는 맞춤형 양자 시뮬레이션 하드웨어 플랫폼을 더 확장, 다양한 솔루션 업체의 GPU와 자체 TPU(Tensor Processing Unit) AI 가속 하드웨어 플랫폼까지 포함할 계획을 발표했다.

구글은 양자 컴퓨팅이 아직 전체 범위의 머신러닝 워크로드를 충분한 정확성으로 처리할 만큼 성숙하지는 않았음을 인식하고, 전통적인 컴퓨팅 아키텍처에 한 발을 그대로 둔 채 많은 AI 사용례를 지원하는 새로운 오픈소스 툴을 설계하는 방법을 택했다. 텐서플로우 퀀텀은 개발자가 학습 작업에서 양자 프로세서와 기존 프로세서를 병렬로 혼합 실행하는 머신러닝 모델을 빠르게 프로토타이핑할 수 있게 해준다. 개발자는 이 툴을 사용해서 전통적인 데이터 집합과 양자 데이터 집합을 모두 구축할 수 있다. 여기서 전통적인 데이터는 텐서플로우에 의해 기본적으로 처리되고, 양자 확장은 양자 회로와 양자 연산자로 구성된 양자 데이터를 처리한다.

개발자는 양자 분류, 양자 제어, 양자 근사 최적화와 같은 머신러닝 사용례의 지도 학습에 텐서플로우 퀀텀을 사용할 수 있다. 또한 메타 학습, 해밀턴(Hamiltonian) 학습, 열 상태 샘플링과 같은 고급 양자 학습 작업도 실행할 수 있다.

또한 구글은 상당한 수준의 사실성을 갖춘 동영상, 음성, 이미지를 생성하는 “딥페이크(deepfake)”와 같이 계속 확대되는 AI 사용례를 지원하도록 텐서플로우 퀀텀을 설계했다. 구글 ML 개발자는 텐서플로우 퀀텀을 사용해 양자/기존 모델을 혼합 학습시켜 이러한 응용 분야에 사용되는 생산적 적대 신경망의 중심에서 식별 워크로드와 생성 워크로드를 모두 처리할 수 있다.

전략적으로 볼 때 구글은 향후 텐서플로우 퀀텀과 기존 퀀텀 컴퓨팅 플레이그라운드(Quantum Computing Playground)를 모든 기능을 갖춘 관리형 양자 머신러닝 서비스로 결합할 가능성이 높다. 구글의 주요 퍼블릭 클라우드 경쟁사(마이크로소프트, AWS, IBM) 모두 이미 이러한 서비스를 출시했거나 프리뷰 단계를 진행 중임을 고려하면, 구글이 자체 양자 머신러닝 서비스로 경쟁사들보다 한 걸음 앞서 나가려 할 것이 거의 확실하기 때문이다.

양자 AI/머신러닝 연구자들, 고속 주행 위한 길 닦는 중

“한 번 만들어 모든 곳에서 실행하는” 양자 머신러닝 구축은 텐서플로우 퀀텀에서 한다 해도 한동안은 어려울 것이다. 양자 연구자들이 실용적인 애플리케이션을 만들기 위해 노력하는 동시에 다양한 대안 아키텍처를 실험하고 있기 때문이다.

주요 양자 머신러닝 솔루션 업체는 주로 다음과 같은 방법으로 기초적인 양자 연구개발 요건을 지원하고 있다.
 
  • 구글은 머신러닝 모델 처리를 위한 대안 양자 컴퓨팅 아키텍처 및 알고리즘 부문의 첨단 연구를 지원하도록 텐서플로우 퀀텀을 설계했다. 덕분에 텐서플로우 퀀텀은 머신러닝 워크로드에 최적화된 다양한 양자 및 하이브리드 처리 아키텍처를 실험하는 컴퓨터 과학자들에게 매우 유용한 연구 툴이다. 이를 위해 텐서플로우 퀀텀은 양자 컴퓨팅 프로그래밍을 위한 오픈소스 파이썬 라이브러리인 서크(Cirq)를 수용했다. 서크는 오늘날 양자 시스템이 가진 ‘잡음이 있는 중간 형태 양자(NISQ)’ 회로 특성을 형성하는 양자 게이트를 프로그래밍에 따라 생성, 편집, 호출하도록 지원한다. 또한 시뮬레이션 또는 실제 하드웨어에서 개발자별 양자 계산을 실행할 수 있게 해준다.
 
  • 마이크로소프트 애저 퀀텀에는 대안 양자 회로 처리 시나리오 시뮬레이션과 이러한 환경에서의 프로그램 성능 예측을 위한 라이브러리가 포함된다.
 
  • 아마존 브라켓은 사용자가 양자 컴퓨팅 하드웨어를 탐색, 평가, 실험하고 양자 알고리즘을 설계하고 저수준 양자 회로 또는 완전 관리형 하이브리드 알고리즘에서 프로그램 실행 성능을 시뮬레이션할 수 있게 해준다.
 
  • IBM Q 네트워크는 대안 양자 컴퓨팅 아키텍처의 실시간 시뮬레이션을 지원한다.
 

2020년대, 양자의 머신러닝 주류 편입

양자 컴퓨팅은 너무 오랫동안 ‘가능성만 있는’ 상태로 유지된 탓에 사람들은 양자 컴퓨팅이 빠른 속도로 실제 사용에 근접하고 있다는 사실을 간과하는 경향이 있다.

양자 컴퓨팅 플랫폼 업체들이 새로운 소재와 방법론, 아키텍처로 실험하는 중에도 전세계 곳곳의 연구자들은 머신러닝 모델의 양자 처리가 실제로 현실성이 있음을 입증해왔다. 앞으로 구글을 비롯한 여러 곳의 AI/머신러닝 연구자들은 텐서플로우 퀀텀을 사용해서 전통적인 AI 가속기 하드웨어 플랫폼에서는 절대 불가능했을 놀라운 일을 하게 될 것이다.

최근 업계의 여러 발표를 보면 우리 세대에 상용화된 양자 머신러닝이 나올 것임은 확실하다. 양자 머신러닝은 이미 부상하기 시작했으며 2020년대에 꾸준히 도입될 것이다. editor@itworld.co.kr