AIㆍML / 미래기술

‘이스라엘의 오픈AI’ AI21랩스가 전하는 생성형 AI의 미래

이지현 기자 | ITWorld 2023.04.26
한국에는 잘 알려지지 않았지만 빅테크 기업과 어깨를 나란히 하는 이스라엘의 스타트업이 있다. AI21랩스(AI21 Labs)가 그 주인공이다. AI21랩스는 특히 연구 조직이 탄탄하고 학계에 여러 AI 주제의 논문을 발표하고 있다는 점에서 미국의 오픈AI(OpenAI), 영국의 딥마인드(Deepmind)와 자주 비교되곤 한다. 

AI21랩스는 1억 1,850만 달러(약 1,581억 원)를 투자금을 받은 후 독자적으로 기술을 개발하며 ‘워드튠(Wordtune)’ 같은 AI 첨삭 서비스를 운영하고 있다. AI21랩스의 핵심 기술은 대형언어모델(Large Language Model, LLM)인 쥬라식-2(Jurassic-2)이며, 쥬라식은 얼마 전 AWS가 공개한 AI 모델 서비스 베드록에 포함되기도 했다. 

설립 8년 차이면서 170여 명 직원이 있는 이 작은 스타트업은 어떻게 높은 기술력을 보유하고, AI 업계의 이목을 집중시킨 것일까? AI21랩스 공동 설립자 겸 CEO인 오리 고센(Ori Goshen)와 직접 인터뷰를 진행하며 AI21랩스의 경쟁력 그리고 현재 생성형 AI의 주요 현황을 살펴보았다. 
 
오리 고센 AI21랩스 공동 설립자 겸 CEO ⓒ Foundry
 

이스라엘 AI 대표 기업이 ‘자연어’를 선택한 이유

AI21랩스의 공동 설립자 3명은 모두 미국 및 이스라엘 IT 업계에서 잔뼈가 굵은 인물들이다. 먼저 요아브 쇼함 교수는 스탠포드 교수 출신으로 여러 스타트업을 창업한 경험이 있으며, 그중 하나는 구글에서 인수되기도 했다. 또 다른 설립자 암논 샤슈아는 오랜 시간 이스라엘 히브리대학교에서 머신러닝를 가르쳤으며, 자율주행 기업인 모빌아이를 공동 설립하기도 했다. 모빌아이는 현재 인텔에 인수됐다. 마지막으로 오리 고센은 소프트웨어 엔지니어로 이스라엘의 사이버 정보부대 유닛 8200(Unit 8200)에서 근무한 적이 있으며, 이후 여러 기술 기업에 종사하기도 했다. AI21랩스 이전에는 크라우드X라는 스타트업을 창업하기도 했다. 

IT 업계에 오래 종사하며 친분이 있던 세 설립자는 이스라엘로 돌아와 언어 서비스에 특화된 AI 기술을 만들기로 했고, 그렇게 해서 나온 것이 AI21랩스다. AI21랩스의 핵심 기술은 LLM인 쥬라식(Jurassic)이며, 이를 활용한 영어 첨삭 도구 ‘워드튠(Wordtune)’를 개발했다.

워드튠은 크롬 및 워드의 확장 프로그램 형태나 일반 웹서비스를 통해 이용할 수 있으며, 영어 문장을 입력하면 바로 문장을 수정하거나 대체 문장을 제안하는 서비스다. 이때 단순히 문법을 확인하는 것을 넘어 문장 구조나 순서를 바꾸고 어조도 다양하게 변형할 수 있다.

영문을 요약해 주는 ‘워드튠 리드(Read)’나 문장 첨삭을 넘어 전체 단락을 작문해 주는 ‘워드튠 스파이스(Spices)’ 같은 연계 서비스도 있다. 워드튠 스파이스의 경우 간단한 문장을 입력하면, ‘설명하기’, ‘수치로 예시들기’, ‘농담 넣기’, ‘인용구 찾기’ 등의 버튼을 클릭해 문장을 확장할 수 있다. 
 
워드튠 스파이스 예시. 기본 내용을 간단히 입력하면, 필요한 예시, 통계, 비유 등을 AI가 직접 제시한다 ⓒ 워드튠 공식 홈페이지

AI21랩스 CEO 오리 고센은 “쥬라식이 엔진이라면 워드튠은 자동차라고 볼 수 있다. AI21랩스는 플랫폼과 이를 사용하는 제품을 모두 생산하는 몇 안 되는 기업으로 사용자 피드백을 기반으로 플랫폼과 제품 모두 개선하며 기술을 고도화하는 역량을 갖추고 있다”라고 설명했다. 

사실 AI21랩스가 처음부터 영어 첨삭 및 작문 서비스를 생각한 것은 아니었다. 공동 설립자들은 회사명에서 유추할 수 있다시피 21세기를 위한 AI 기술을 만드는 것을 찾다가 ‘자연어 분석’ 기술에 선택을 선택하기로 했다고 한다.

고센은 “회사를 설립했던 2017년에는 신경망 관련 기술에 많은 투자가 이뤄졌다. 당시에는 컴퓨터 비전 즉 이미지와 관련된 기술이 많았다. 컴퓨터 비전이 인간의 눈을 들여다보는 렌즈라면, 자연어 분석 기술은 사고방식을 들여다보는 렌즈라고 볼 수 있다. 그래서 자연어 분석 서비스를 만드는 것은 더 어려운 일이지만 가능하다면 그 가치는 무궁무진하다고 보고 현재의 서비스를 만들었다”라고 밝혔다. 
 

“AI 작문 서비스 과장 홍보 많아”…워드튠은 글쓰기의 유리 천장 깨는 도구

AI21랩스만의 독특한 특징은 수익을 만들어 내는 서비스를 직접 만들고 있다는 점이다. 오픈AI는 마이크로소프트, 딥마인드는 구글을 통해 수익화 방법을 찾는 것과는 대조되는 부분이다. AI21랩스 내부에서는 LLM 쥬라식의 가능성을 확인하기 위해서는 상업용 서비스를 스스로 만드는 것이 필요하다고 보며 서비스 개발에도 적극 투자하고 있다. 그런 가치 아래 현재 AI21랩스의 목표는 글쓰기와 읽기의 경험을 바꾸는 것이다. 

고센은 “챗GPT를 이용해서 일종의 데모나 베타버전으로 서비스를 내놓을 수 있다. 하지만 애초에 연구 목적으로 만든 기술은 사용자가 늘고 상용 서비스로 확대하려면 여러 제약이 생긴다. 또한 인공지능 기술 업체 대부분은 인간을 대체하기 위한 수단으로 생성형 AI를 사용하려 한다. AI21랩스는 기획 단계부터 인간의 역량을 강화하기 위한 수단으로 워드튠을 바라보고 서비스를 만들고 있다”라고 설명했다.  

생성형 AI를 논의할 때 빠지지 않는 질문이 ‘AI가 인간을 대체할 것인가?’라는 부분이다. 여기에 대해 고센은 AI가 인간을 대체할 수 없다는 확신을 가지고 있다. 적어도 글쓰기 관련 직업에 대해서 그렇다. 일단 AI는 통계와 확률 모델을 기반으로 하기 때문에 인간의 지능과 경쟁할 수 있는 단계에 이르지 못했다는 것이 그의 설명이다. 또한 현재 AI가 작가를 대체할 수 있다는 논의가 많은 이유는 관련 기업들의 과장된 홍보가 영향을 미쳤다고 보았다. 

고센은 “신경망 기술은 다음 단어를 예측하도록 설계된 통계 시스템이다. 이런 시스템이 만드는 결과물은 인상적이지만 스스로 생각할 수는 없다. 의미 있는 무언가를 만들려면 여전히 인간적인 요소가 필요하다. 동시에 기계가 쓴 콘텐츠에 대한 사람들의 거부감도 무시할 수 없다. 정말로 AI가 인간처럼 글을 쓸 수 있다면, 인간 독자는 인간 작가를 인증할 방법을 찾을 것이다. 사람들은 봇이 쓴 의견을 읽고 싶어 하지 않기 때문”이라고 설명했다. 

AI21랩스가 추구하는 방향은 AI를 글쓰기 도구로 활용하는 것이다. 특히 평소 글쓰기 실력이 타고난 사람이 아니더라도, 비영어권 사용자, 주의력 결핍 과잉행동장애(ADHD)을 갖고 있거나 손을 자유롭게 쓸 수 없는 장애를 가진 사용자가 대표적이다. 기존에 글쓰기 활동에 제약이 있었던 사람들에게 기회를 줄 수 있다는 것이다. 반면에 현재 글쓰기를 업으로 가진 사람이 AI 시대에도 두각을 보일려면 오랜 시간을 통해 보다 높은 전문성을 얻고 창의성을 길러야 한다고 보았다. 
 

'범용성' 추구하는 오픈AI 모델과는 다른 전략을 취하다

AI21랩스는 오픈AI와 직접 경쟁하는 기업이다. 그런데 여기서 의문이 생긴다. 어째서 구글, 마이크로소프트, 메타 같이 자금이 많고 인력이 많은 곳보다 상대적으로 작고 연구 중심의 신생 기업인 오픈AI나 AI21랩스 같은 곳이 앞서 갈 수 있었을까? 

고센은 “조금 겸손하게 보자면 구글 같은 빅테크 기업이 기술력이 없다고 생각하지는 않는다. 그런 기업은 매우 조심스럽게 AI기술에 접근하기에 내부적으로 기술을 만들어도 발표를 하지 않았을 것 같다. 일종의 혁신의 딜레마다. 가령 검색 서비스에 챗GPT가 결합했을 때 구글의 광고 사업에 어떤 영향을 미칠지 알기 쉽지 않았을 것이다. 하지만 챗GPT가 출시된 이후에는 상황이 달라졌다. 지금 당장 기술을 공개하지 않으면 영향력이 무너질 수 있으니 뒤늦게라도 빅테크도 뛰어들 수 밖에 없게 됐다”이라고 설명했다. 

경쟁 기업으로서 AI21랩스가 오픈AI를 보는 시선도 주목할 만하다. 고센은 “오픈AI는 상대적으로 작은 기업이다. LLM만 봤을 때 엄청난 기술적 우위를 가지고 있다고 생각하지 않다. 하지만 오픈AI는 창의적이고 대담하게 사람들이 사용할 수 있게끔 모델 규모를 키우고 챗GPT라는 형태로 서비스를 잘 구성해서 내놓았다. 덕분에 생성형 AI 시장이 지금처럼 커졌다. 불과 6개월 전만 해도 AI21랩스는 직접 고객을 찾아다니느라 바빴는데 지금은 완전히 뒤바뀌어 많은 기업이 직접 찾아와 기술 문의를 한다. 오픈AI가 업계에 끼친 공은 크다”라고 설명했다. 

AI21랩스는 이스라엘의 오픈AI라는 별명이 있지만, AI21랩스 스스로는 오픈AI와 차별화된 요소가 많다고 주장한다. 특히 기술적으로 오픈AI는 범용 모델을 만드는 것에 집중하지만 AI랩스는 오로지 글을 읽고 쓰는 영역에만 집중하고 있고, 시간이 지날수록 해당 분야의 기술력 차이가 벌어질 것으로 보고 있다.

가령 오픈AI의 챗GPT는 코드 생성, 이미지 생성, 대화 생성 등 모든 영역에 쓰일 수 있지만, AI21랩스는 이런 영역에 관심을 두지 않는다. 여기에 모델 구조는 ‘모듈형’ 형을 추구하며 하나의 모델로 모든 문제를 해결하기보다는 모델을 작게 쪼개서 각 모델이 특정 분야의 전문성을 발휘할 수 있게 훈련하고 있다. 미라클(MRKL)이라고 불리는 이 시스템은 특정 모델은 첨삭을 잘하고, 특정 모델을 요약을 잘하도록 만들었다. 이를 통해 모델의 문제점이나 관리도 보다 쉬어진다. 
 
AI21랩스의 API ⓒ AI21랩스
 

API로 AI 모델 대중화 이끈다

최근 AI21랩스는 워드튠 같은 B2C 서비스 외에 B2B 사업도 시작했다. 누구나 워드툰에 쓰인 언어모델을 AI 개발에 쓸 수 있는 것이다. 가령 보험업계에서 문서를 읽고 요약하는 글을 쓸때, 쇼핑몰에서 제품 설명 글을 쓸 때 AI21랩스가 개발한 API 기술을 이용할 수 있다. 올 2월 기준 3만 5,000명이 넘는 사용자가 AI21랩스의 API 활용을 위해 가입했는데, 현재 고객사 이름에 삼성, 데이터브릭스, 유비소프트 등이 올라와있다. 

물론 모델 API를 공개하는 기업은 AI21랩스만 있는 것이 아니다. 현재 오픈AI도 API로 모델을 열어두었으며, 스테이블 디퓨전 개발사로 유명한 스테이빌리티AI의 경우 오픈소스 형태로 LLM 모델 ‘스테이블LM’을 공개했다. 고센은 “오픈소스 모델은 사용자 입맛에 맞게 기술을 맞춤화할 수 있다. 하지만 그 과정에서 여러 간접 비용이 든다. 대형 모델을 패키지하고 배포하고 모니터링 하는 과정은 쉬운 일이 전혀 아니다. 금융, 의료 업계처럼 IT 인력이 부족한 곳에서 굳이 그런 관리를 할 필요가 있을까? 그들에게 좀 더 편리하게 이용할 수 있는 것이 중요하다. API를 이용하면 그런 관리 요소를 줄일 수 있다. 향후 몇 년 안에 결국 API 방식으로 모델을 활용하는 방식이 주류가 될 것이다”라고 밝혔다. 

현재 생성형 AI 붐이 일어나고 있지만, 고센은 굳이 모든 기업이 직접 모델을 만들 필요 없다고 설명한다. 수천 억개의 매개변수를 직접 훈련하는 일은 매우 어려운 일이고 많은 비용이 들어가는 부분이기 때문이다. 실제로 한 미국의 분석 업체는 챗GPT 시스템을 운영하는 데 필요한 비용이 하루 약 70만 달러(약 9억 원)이라고 추측하기도 했다. 고센은 “AI21랩스는 생성형 AI 초기 시장에서 LLM을 직접 개발하는 몇 안 되는 기업으로 매우 운도 좋고 독특하다고 생각한다. 외부 기업들에게 모델을 공개하면서 기술 전파에 기여하고자 한다”라고 덧붙였다.
 
 스탠포드 대학에서 평가하고 있는 LLM 모델 운영사 ⓒ 스탠포드 대학

그렇다면 현재 외부에 공개된 여러 LLM모델 중 가장 높은 수준의 모델은 어떤 것일까? 물론 직접 사용하며 모델을 수준을 가늠할 수 있지만 고센은 학계에서 만든 벤치마크를 활용하라고 조언하다. 고센은 “현재 모델의 수준을 평가하는 것은 사실 어려운 부분이긴 하다. 그나마 가장 현실적으로 파악할 수 있는 객관적 지표는 스탠포드 대학이 만든 ‘헴(Helm)’이라는 자료이다”라고 설명했다. 
 jihyun_lee@idg.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.