AIㆍML

“생성형 AI가 로봇 패러다임도 바꾼다” MS, 로봇에 ChatGPT 적용 연구

Jürgen Hill | COMPUTERWOCHE 2023.02.23
가정용 로봇을 음성으로 통제하는 것이 가까운 미래에 가능해질까? 예를 들어, “점심 좀 데워줘”라고만 하면, 사전에 따로 프로그래밍하지 않아도 로봇 집사가 부엌으로 가 전자레인지를 조작하도록 할 수 있을까? 마이크로소프트의 한 연구팀이 바로 이 비전을 연구하고 있다. 블로그 포스트에 따르면, 연구팀은 오픈AI의 AI 언어 모델인 ChatGPT를 이용해 이를 실현할 계획이다.

이론적으로는 명료해 보이지만, 실제 구현은 상당히 복잡하다. ChatGPT가 로봇을 제어할 수 있으려면 먼저 인간의 도움이 필요하다. 마이크로소프트 연구팀은 기술 백서를 통해 AI 언어 모델을 이용해 로봇 작업을 해결하는 데 사용할 수 있는 일부 설계 원칙을 제시했는데, 전용 프롬프트 구조, 고수준 API, 텍스트를 통한 인간의 피드백 등이 포함되어 있다. 연구팀은 이번 연구가 로봇 시스템 개발에 있어서 변화의 시작점에 불과하다고 강조했다. 

현재 로봇 프로그래밍의 과제는 엔지니어나 기술력이 있는 사용자가 먼저 로봇이 수행해야 할 작업의 요구사항을 로봇 시스템을 위한 적절한 코드로 변환해야 한다는 것이다. 이 코드를 적용한 후 로봇의 동작을 관찰하고 잘못된 동작을 교정해야 한다. 즉 코드를 수정해야 한다. 이 과정은 시간이 오래 걸리고 비용도 많이 든다. 이 과정을 수행하는 전문가는 로봇 공학 지식뿐만 아니라 저수준 코드도 작성할 수 있어야 하기 때문이다.
 
ⓒ Microsoft

마이크로소프트 연구팀이 ChatGPT가 로봇 프로그램의 패러다임 변화를 이끌 수 있다고 주목하는 지점이다. 미래에는 기술 지식이 없는 사용자라도 로봇의 동작을 관찰하고 자연어로 ChatGPT를 통해 로봇의 잘못된 동작을 바로잡을 수 있다. 연구팀의 설계 원칙에 따르면 ChatGPT가 이 역할을 수행할 수 있으며, AI가 다양한 로봇 시나리오에 맞는 코드를 생성할 수 있다.

연구팀은 우선, 일련의 고수준 로봇 API 또는 기능 라이브러리를 정의한다. 이 라이브러리는 특정 로봇에 따라 달라지며, 로봇 제어 스택의 기존 저수준 구현과 일치해야 한다. 또한 연구팀은 ChatGPT가 API의 기능을 추론할 수 있도록 상위 수준 API에는 설명이 포함된 이름을 사용할 것을 권장했다.

두 번째 단계에서는 로봇의 작업을 설명하는 동시에 이 목적에 사용할 수 있는 고급 라이브러리의 기능을 명시적으로 나타내는 ChatGPT용 텍스트 프롬프트를 작성한다. 프롬프트는 작업 제한에 대한 정보를 포함하거나 ChatGPT가 답변을 공식으로 나타내는 방법(특수 코드 또는 헬퍼 구문 분석 요소 사용)을 정의할 수도 있다.

사용자는 코드를 직접 생성할 필요가 없으며 ChatGPT 코드를 평가하기만 하면 된다. 코드 평가는 로봇의 동작을 직접 확인할 수도 있고, 로봇 시뮬레이터를 사용할 수도 있다. 수정이 필요한 경우 사용자는 자연어를 사용해 ChatGPT에 알리고 코드 변경을 요청할 수 있다. 만족스러운 결과를 얻으면, 최종적으로 로봇에 코드를 전송할 수 있다.
 


연구팀은 깃허브의 예제 코드를 통해 이 모든 것이 단지 이론에 불과한 것이 아니라는 것을 보여준다. 예를 들어, 연구팀은 ChatGPT를 사용해 마이크로소프트 에어심(AirSim) 시뮬레이터와 연결된 산업용 검사 시나리오를 구현했다. 이 모델은 사용자 의도와 기하학적 단서를 효과적으로 분석해 드론을 정밀하게 제어한다.
editor@itworld.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.