AIㆍML / 애플리케이션

“영감이 샘솟는다” 오픈AI 데브데이에서 주목할 만한 새로운 툴 3가지

Sharon Machlis | InfoWorld 2023.11.09
최근 오픈AI는 미국 샌프란시스코에서 개발자를 대상으로 한 첫 대규모 공개 이벤트인 데브데이(DevDay)를 개최하고 챗봇 맞춤 설정, 애플리케이션 구축, 음성 처리를 위한 새로운 툴을 포함한 여러 가지 새로운 제품과 기능을 발표했다. 모두 생성형 AI 기술을 중심으로 하는 견고한 개발자 커뮤니티 육성에 초점을 맞춘 툴이다.
 
ⓒ Getty Images Bank

AI 자문가이자 투자자인 앨리 K. 밀러는 X(구 트위터)에 올린 글에서 “지금까지 참석한 다른 대형 기술 이벤트와 비교했을 때 오픈AI 데브데이는 ‘이 새로운 릴리스로 당장 뭔가를 만들어야겠다’라는 생각을 들게 한다는 면에서 가장 효과적이었다”면서 “빌더 활성화 점수가 10점 만점에 11점”이라고 말했다.

생성형 AI 프로젝트에 대한 호기심을 불러일으킬 만한 오픈AI의 제품 혹은 플랫폼 3가지와 이에 대항할 만한 새로운 오픈소스 대안 1가지를 살펴보자.


GPT를 사용한 챗봇 맞춤 설정

오픈AI 라인업에서 가장 눈길을 끄는 요소는 특정 작업을 위한 맞춤형 챗봇을 만드는 새로운 노코드 방식이다. GPT로 불리는 이런 봇에는 작성자가 제공한 특정 데이터를 기반으로 질문에 답하도록 하는 옵션이 포함된다. 이를 사용하면 고객 서비스, 문서 Q&A 또는 제품 데이터베이스 연결과 같은 도메인별 챗GPT 기반 봇을 훨씬 더 빠르게 만들 수 있다. 해당 기능은 이번주 중에 챗GPT 플러스(Plus) 및 엔터프라이즈(Enterprise) 사용자를 대상으로 제공된다.

오픈AI 기반 챗봇 구축은 예전부터 이미 이뤄지고 있지만, 이번에 출시된 기능은 챗봇 구축 작업을 더 쉽고 빠르게 만든다. GPT는 게시를 위한 오픈AI의 웹 플랫폼, 챗GPT 사용자 경험, 생성형 AI를 제공하는 LLM도 사용할 수 있다.

필자는 업로드된 문서 집합에 대한 질문에 LLM이 최선의 답변을 제공할 수 있도록 데이터 처리를 최적화하고 어떤 프론트엔드를 사용할지, 어디에 호스팅할지 결정하는 데 다소 오랜 시간을 소비하는 사람으로서 이 기능이 얼마나 잘 작동할지 궁금하다. 

챗GPT 엔터프라이즈 고객은 내부 전용 봇만 만들 수 있다. 개인 사용자는 봇을 비공개로 유지하거나 링크가 있는 사람에게 공개할 수 있으며, 개발자는 곧 출시될 오픈AI GPT 스토어에 자신의 GPT를 게시할 수 있다. 인기 있는 봇을 만들면 수익 배분을 받을 수도 있다. 여러 개발자가 히트작 만들기에 뛰어들 것으로 예상된다. 

다 필자는 사용할 수 있는 옵션을 살펴보고 작업에 가장 적합한 옵션을 찾는 오픈AI 플러그인 경험은 그다지 인상적이지 않았다. 새로운 스토어가 최종적으로 작동하는 방식에 대해 회의적인 사람은 필자뿐만이 아니었다. 오픈AI CEO 샘 알트먼은 스토어에 게시되는 GPT가 허용 가능한 정책을 따르도록 할 것이라고 약속했다. 그러나 구글 플레이 같은 다른 시장을 근거로 볼 때 이는 생각만큼 쉽지 않은 일이다. 어쨌든 오픈AI의 현재 인기를 고려하면 GPT 스토어가 문을 열었을 때 많은 사람이 방문하게 될 것은 분명하다.


어시스턴트 API로 쉬워지는 앱 개발

이 새로운 API는 오픈AI에 봇을 호스팅하는 대신 자체 앱을 구축하고자 하는 개발자에게 GPT 기능을 제공한다. 기본 LLM API를 사용해 앱을 코딩하는 것보다 더 쉽게 스레드 및 긴 대화 등을 처리하는 방법을 제공한다. 해당 API는 동시에 여러 함수를 호출할 수도 있다. 또한 회사 측에 따르면, LLM이 이후 단계에서 사용되는 적절한 형식의 JSON을 반환할 가능성이 더 높아졌다.

소프트웨어 문서와 같은 특정 정보에 대한 질문에 답하는 챗봇 개발자를 위한 기능으로, 텍스트를 청크로 분할하고 의미(semantic) 검색을 위한 임베딩을 생성하는 등의 작업은 백그라운드에서 처리된다.
 
오픈AI 어시스턴트 API로 구동되는 데모 앱은 코드 인터프리터를 호출해 백그라운드에서 파이썬 코드를 작성하고 실행한다. ⓒ Foundry

어시스턴트 API는 샌드박싱된 파이썬 코드를 실행하기 위한 코드 인터프리터(Code Interpreter)에도 액세스할 수 있다. 활성화된 코드 인터프리터는 LLM이 사용자의 질문에 일정한 계산이 필요하다고 판단할 경우 개입한다. 가령 오픈AI 데브데이 기조연설에서 소개된 어시스턴스 API 기반의 여행 앱 사례를 보면, 사용자가 항공편과 에어비앤비 청구서를 업로드하고 “4명이 이 에어비앤비에서 숙박할 예정입니다. 내가 부담해야 할 금액과 항공편 가격은 얼마입니까?”라고 묻자 LLM은 코드 인터프리터를 호출해서 파이썬 코드를 생성한 다음 질문에 답했다.

밀러는 트윗으로 “오픈AI 어시스턴트는 현재 오픈AI 플레이그라운드에서 사용할 수 있다. 자연어를 사용해 자기만의 봇을 프로그램할 수 있는 가장 파격적인 방법이다. 말 그대로 교과서 전체를 업로드해 나만의 가정교사를 만들 수 있고, 기술 문서를 업로드해 새로운 프로그램을 자습할 수도 있다”라고 썼다. 프로그래머는 플레이그라운드 대시보드에서 AI가 질의에 응답하기 위해 취하는 단계를 확인할 수 있다.


텍스트 투 스피치 API

오픈AI의 TTS 모델을 위한 텍스트 투 스피치(text-to-speech) 엔드포인트다. 6가지 음성이 포함돼 있는데, 음성 품질에 대한 초기 반응은 긍정적이다. MP3 형식으로 응답하지만, 다른 포맷도 가능하다. 실시간 오디오 스트리밍도 지원한다. 

오픈소스 개발자 사이먼 윌리슨은 마스토돈에 올린 글에서 “새 API를 이해하기 위해 일반적으로 내가 사용하는 방법은 그 API로 뭔가를 만드는 것”이라며, 해당 API를 통해 텍스트를 파이핑하는 CLI 유틸리티 오스피크(ospeak)를 소개했다. 텍스트 투 스피치 API에 대한 자세한 내용은 오픈AI 개발자 플랫폼 홈페이지에서, 오스피크에 대한 자세한 내용은 윌리슨의 블로그에서 확인할 수 있다.


하루 만에 등장한 대안, 랭체인의 오픈GPT

LLM으로 구축된 앱 개발을 위한 프레임워크를 제공하는 랭체인(LangChain)은 오픈AI 툴의 대안으로 오픈GPT(OpenGPT)를 출시했다. 랭체인 깃허브에는 “오픈GPT는 오픈AI의 GPT와 비슷한 경험을 제공하기 위한 오픈소스의 노력이다. 사용하는 LLM(랭체인이 제공하는 60개 이상의 LLM 중에서 선택), 사용하는 프롬프트(랭스미스(LangSmith)를 사용하여 디버깅) 및 여기에 제공하는 툴(랭체인의 100가지 이상의 툴 중에서 선택하거나 손쉽게 직접 만들 수 있음)을 더 폭넓게 제어할 수 있게 해준다. 오픈AI와 최대한 동등한 기능을 제공하기 위해 노력 중”이라고 나와 있다.

호스팅된 간단한 샘플 버전은 오픈AI 버전만큼 매끄럽지 않지만, 하루도 채 되지 않는 시간에 만들어졌다는 점은 주목할 만하다. 오픈GPT가 계속 발전하게 되면 오픈AI 생태계에 종속되기를 원하지 않는 개발자에게 매력적인 대안이 될 수 있다. 랭체인은 툴 선택 측면의 유연성을 원하지만 자체 클라우드 호스트를 관리하는 데는 관심이 없는 사람을 위한 호스팅 버전도 개발 중이다.

현재로서는 백엔드에 파이썬을 설치해서 로컬 버전을 실행할 수 있다. 프론트엔드에는 리액트, 타입스크립트 및 바이트를 사용한다. 리포지토리의 README 파일에서 더 자세한 정보를 확인할 수 있다.
editor@itworld.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.