데모 영상에서 연구원 샘 링거는 클로드가 맥 데스크톱의 스크린샷을 이용해 데이터를 입력하는 모습을 시연했다. 이 작업은 전 세계 직장인이 실제로 하는 단순 반복 업무와 매우 비슷하지만, 링거는 이 데모가 “대표적인 예”라고 밝혔다. 영상이 얼마나 편집되었는지는 알 수 없다.
하지만 앤트로픽의 말만 믿을 필요는 없다. 현재 클로드 3.5 소네트 API의 초기 버전은 직접 사용해 볼 수 있다. 펜실베니아 대학교 와튼 스쿨의 AI 연구 교수인 에단 몰릭은 ‘유니버설 페이퍼클립스(Universal Paperclips)’라는 온라인 클릭 게임을 대상으로 이 AI를 시험했다. 유니버설 페이퍼클립스는 배경에 미묘한 SF 요소가 깔린 간단한 인터페이스의 게임이다.
몰릭은 프로그램을 게임의 브라우저 창에 연결하고 “게임에서 이기라고 명령”한 다음 지켜봤다. 결과는 흥미로웠다. AI는 텍스트 기반 인터페이스에서 게임의 목표를 추론하고, 일련의 시행착오를 통해 승리를 목표로 게임을 진행했다. 클로드는 실제 사용자가 하듯 기본적인 A/B 테스트를 통해 클립 가격을 조정하면서 가상의 수익을 높이려고 했다. 하지만 인간 플레이어에게는 매우 당연한 일인 최적화 프로세스에 필요한 단계를 제대로 이해하지 못했다.
실제 세상의 AI가 가상의 AI가 등장하는 게임을 “플레이”한 셈이다. 다만 AI는 몇 가지 논리적 오류에 빠져 의미 있는 진전을 이루지 못했고, 몰릭의 가상머신은 몇 차례 충돌하여 게임을 완주하지 못했다. 하지만 흥미로운 것은 몰릭이 “너는 컴퓨터다. 그 능력을 사용해라”라는 입력을 추가하자, 클로드가 간단한 코드를 작성해 프로세스를 자동화하려 했다는 점이다.
이는 여러 층의 가상 세계를 다룬 영화 ‘인셉션’처럼 가상의 컴퓨터가 가상의 코드를 작성해 가상의 게임을 플레이한 사례다. 최종적으로 클로드는 여러 번의 VM 충돌 후 “주어진 제약 조건 내에서” 특정 마일스톤에 도달했기 때문에 “성공적으로 ‘승리’했다”라고 선언했다.
그러나 클로드가 ‘유니버설 페이퍼클립스’ 게임을 실제로 이긴 것은 아니었다. 하지만 이렇게 상황에 따라 크게 달라지는 게임을 플레이하는 것은 앤트로픽의 데모 동영상에 제시된 원래 자동화 목표를 훨씬 넘어선 도전 과제였다. 최소한의 자극만으로 목표를 파악하고 진전을 이루는 AI의 능력은 인상적이었다. 이번 실험에 대한 전체 분석은 읽어볼 가치가 있다.
몰릭 교수는 “클로드는 대부분의 오류에 유연하게 대처하며 끈기 있게 작업을 진행했다. A/B 테스트와 같은 영리한 방법을 사용했고, 가장 중요한 점은 한 시간 가까이 중단 없이 일을 처리했다”라고 썼다.
앤스로픽의 클로드 AI는 웹과 iOS, 안드로이드 앱에서 무료로 텍스트 기반 도구로 사용할 수 있으며, 이미지와 텍스트 문서에 대해서도 질문할 수 있다. 무료 버전에도 최신 업데이트(버전 3.5)가 적용되어 있지만, 더 고급 기능을 사용하려면 월 20달러의 프로 계정이 필요하다. 프로 계정은 우선 대역폭과 더 많은 모델을 제공한다. 앤트로픽은 현재 노션, 인튜이트(Intuit), 줌 등 여러 기업을 고객으로 확보하고 있다.
editor@itworld.co.kr