AIㆍML

오픈AI, 더 똑똑한 언어 모델 GPT-4 공개··· “이미지 분석, 긴 글 이해 능력 높아”

Mark Hachman | | PCWorld 2023.03.16
ChatGPT 개발사 오픈AI가 차세대 대형 언어 모델 GPT-4를 15일 공개했다. 기존 ChatGPT 유료 버전에는 이미 GPT-4가 반영됐으며, 마이크로소프트의 웹 브라우저 빙 챗에도 GPT-4가 활용됐다. 

GPT-4는 이미지 데이터를 활용할 수 있다는 것이 특징이다. 오픈AI는 “GPT-4에 이미지를 입력하면 캡션을 만들거나 이미지를 분류 및 분석할 수 있다. 다시 말해 ChatGPT와 빙에서는 마치 눈을 가진 것처럼 우리 주변을 볼 수 있다. 이미지 검색 기능과 유사하게 이미지를 해석하는 능력이 있는 것”이라고 설명했다. ‘비 마이 아이즈(Be My Eyes)’라는 앱은 GPT-4의 이미지 정보 생성 능력을 보여준다. 오픈AI에서 개발한 비 마이 아이즈는 스마트폰 카메라로 이미지를 찍으면 이미지의 다양한 정보를 제공한다.
 
ⓒ 오픈AI

서사 생성 능력도 눈에 띈다. 오픈AI는 “GPT-4는 2만 5,000개 이상의 텍스트를 처리할 수 있다. 따라서 긴 형식의 콘텐츠 생성, 확장된 대화, 문서 검색 및 분석 기능을 지원한다"라고 설명했다. 이런 기능 탓에 앞으로 짧은 글을 만드는 1인 출판사는 위기를 겪을 수 있다. GPT-4로 ChatGPT의 결과 값이 길어질 뿐만 아니라 더 창의적이 될 것이기 때문이다. 

오픈AI는 “GPT-4는 그 어느 때보다 창의적이고 협력적이다. 작곡, 각본 같이 창의적이고 전문적인 창작물을 생성하고 반복적으로 수정할 수 있다. 사용자의 글쓰기 스타일도 학습한다”라고 설명했다. 

긴 글을 처리하는 능력은 웹 페이지의 많은 정보를 GPT-4에 보내는 데 도움을 준다. 가령 여러 웹 페이지 정보를 바로 프롬프트에 보낼 수 있다. 따라서 GPT-4와 ChatGPT에 더 많은 맥락 정보를 제공할 수 있을 것으로 보인다.

대형 언어 모델은 기본적으로 인간의 지능과 똑같지는 않다. 하지만 단어들 사이의 관계를 이해한다. 더 정교한 GPT-4 모델은 관계와 맥락을 훨씬 더 잘 이해한다. 오픈AI에 따르면, ChatGPT는 변호사 시험에서 백분위수 10이었는데, GPT-4는 백분위수가 90(100에 가까울수록 높은 점수를 기록)이었다. 생물 올림피아드 시험에서는 ChatGPT의 백분위수는 31이었지만, 이미지를 읽고 파악하는 GPT-4의 백분위수는 99였다. 

언어 학습 앱 개발사 듀오링고는 GPT-4를 활용한 AI 튜터 기술을 개발했다고 밝혔다. 오픈AI는 “새로운 듀오링고는 맥락을 파악해 사용자가 말하고자 하는 것과 모범 답안을 알려준다”라고 설명했다. 

오픈AI 연구진은 “GPT-4 결과물을 개선하기 위해 ChatGPT 사용자가 제출한 피드백과 실제 사용자의 의견을 반영했다”라고 설명했다. 여기에 AI 안전성을 높이고자 전문가 50여명의 의견도 담기도 했다. 물론, 안정성 문제는 시간이 지나야만 개선 여부를 검증할 수 있다. 그럼에도 ChatGPT와 빙이 GPT-4로 분명 더 똑똑해진 것은 분명하다.
ciokr@idg.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.