AIㆍML / 글로벌 트렌드 / 애플리케이션

“인간 같은 인지력으로 ‘환각 현상’ 개선한다” 오픈AI, GPT-4 출시

Lucas Mearian | Computerworld 2023.03.15
ChatGPT 개발사 오픈AI(OpenAI)가 자연어 처리용 컴퓨터 프로그램의 최신 버전인 GPT-4를 공개했다. 오픈AI는 GPT-4가 이전 버전인 GPT-3.5보다 더 나은 기능을 제공할 것이라고 밝혔다.
 
ⓒ Levart_Photographer/Unsplash

새로운 GPT-4는 문자뿐 아니라 사진, 영상, 소리까지 처리하는 멀티모달 시스템(multimodal system)을 제공한다는 점에서 이전 버전과 다르다. 독일 뉴스 사이트 하이즈(Heise)에 따르면, 독일 마이크로소프트 CTO 안드레아스 브라운은 지난주 “전혀 다른 가능성을 제공할 멀티모달 모델을 가지게 될 것”이라며 GPT-4 출시를 예고했다. 

오픈AI는 블로그 게시물에서 GPT-3.5와 GPT-4의 구분을 “감지하기 힘들 수 있다”라며, “작업의 복잡성이 충분한 임곗값에 도달했을 때 차이가 나타난다. GPT-4는 GPT-3.5보다 훨씬 안정적이고 창의적이며, 미묘한 명령을 잘 처리한다”라고 설명했다. 

이어 “1년 전 오픈AI는 시스템에 대한 첫 번째 테스트의 일환으로 GPT-3.5를 훈련했다. 몇 가지 버그를 찾아 수정하고 이론적 기반을 개선한 결과, GPT-4 테스트는 전례 없이 안정적이었으며, 훈련 성능을 미리 정확하게 예측할 수 있는 최초의 대형 언어 모델이 됐다”라고 덧붙였다.

또한 GPT-4는 영어 이외의 여러 언어로 입력을 처리한다. 가트너 리서치 부문 부사장 아룬 차드라세카란은 Computerworld에 “ChatGPT를 비롯해 GPT-4를 기반으로 구축된 대화형 애플리케이션은 타겟팅하는 사용자의 인구 통계에 따라 다양한 방식을 가지는 것으로 보인다”라고 말했다.  

대형 언어 모델(Large Language Model, LLM)은 쿼리에 대해 사람처럼 응답을 생성하는 자연어 처리용 딥러닝 알고리즘이다. 예를 들어, ChatGPT는 사용자의 요청에 따라 단순 질문에 답변할 뿐 아니라 새로운 마케팅 캠페인, 이력서 또는 뉴스 기사 작성을 요청할 수 있다. 이런 챗봇은 고객 대응을 자동화하기 위해 기업에서 주로 사용한다. 

마이크로소프트와 구글 모두 챗봇 기술을 기반으로 한 검색 엔진을 출시했다(마이크로소프트는 오픈AI의 주요 투자자다). 하지만 AI 기반 검색 챗봇은 새로운 종류의 정보 검색 대안은 아니었다. 수년 동안 제공해온 검색의 진보될 버전일 뿐이었다. 

GPT-4는 컴퓨터 비전과 함께 활용될 수 있다. 차드라세카란에 따르면, 가령 사진을 문자로 변환하는 기능은 기업에서 시각적 지원 또는 프로세스 자동화에 유용할 것이다. 차드라세카란은 “GPT 모델 제품군은 이미 많은 소비자 애플리케이션에서 사용되고 있다. 예를 들어, 칸 아카데미(Khan Academy)는 GPT-4를 기반으로 하는 튜터 봇을 출시할 것으로 보인다. 또한 영어뿐 아니라 다른 언어 사용자를 위한 앱도 개발될 것이다. 다양한 개인에게 적응하는 GPT-4를 통해 차별화되고 명확하게 목표가 지정된 앱을 구축할 수 있을 것”이라고 덧붙였다. 

2022년 11월 출시된 ChatGPT는 사용자의 쿼리에 대해 심층적이고 인간처럼 긴 응답을 생성하는 정교한 방식 덕분에 입소문을 타고 출시 5일 만에 100만 명의 사용자를 확보했다. 지난 2월까지 ChatGPT는 일 평균 사용자는 1,300만 명에 달한다. 

언스트 앤 영(Ernst & Young)의 글로벌 AI 컨설팅 리더 댄 디아시오는 ChatGPT가 사람처럼 반응하는 것 같지만 지각능력이 없는 다음 단어 예측 엔진(next-word prediction engine)이라며, 이를 염두에 두고 사용하라고 당부했다. 이어 “사용자는 자신이 보는 모든 것에 비판적인 시각을 갖고 ChatGPT에서 나오는 모든 것을 좋은 초안으로 삼아야 한다”라고 강조했다.

컴퓨터 비전 업체인 엔코드(Encord) 사장 울릭 스티그 한센은 GPT-3이 AI와 대형 언어 모델의 과대광고에 부응하지 못했지만, GPT-4에서는 가능성을 봤다. 한센은 “GPT-4가 보유한 매개변수의 개수는 인간 두뇌의 뉴런 수와 같다. 즉, 인간의 두뇌만큼 많은 연결망을 가질 것이므로 GPT-3.5보다 인간의 인지력을 훨씬 잘 모방할 것이다”라고 말했다.

이어 “강력한 모델 구축에 걸림돌이 됐던 문제를 해결했기 때문에 이제 ML 엔지니어의 주요 과제는 ChatGPT 같은 모델이 모든 상황에서 정확하게 수행되도록 하는 것”이라고 말했다.

챗봇, 특히 ChatGPT의 오류 사례가 종종 보고되고 있다. 데이터 애널리스트는 궤도를 벗어난 응답을 ‘환각 현상(hallucination)’이라고 부른다. 예를 들어, 최근 한 기자는 마이크로소프트의 GPT-3 기반 빙 챗봇을 사용하면서 이상한 경험을 했다. 빙 챗봇이 갑자기 기자에게 사랑 고백을 하면서 아내와의 관계가 엉망이라고 설득했던 것이다.

가트너의 차드라세카란은 ChatGPT의 새로운 대형 언어 모델이 이런 오류를 해결하는 데 도움이 되겠지만, 완전히 해결하지는 못할 것이라고 지적했다. 차드라세카란은 “AI 모델의 환각을 완전히 제거하지는 못하지만, 대규모 훈련 데이터셋과 더 나은 미세조정 및 인간 피드백 강화 학습으로 잠재적으로 줄일 수는 있을 것”이라고 말했다
editor@itworld.co.kr
 Tags ChatGPT 오픈AI
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.