AIㆍML / 글로벌 트렌드

미 베스트셀러 작가들, 오픈AI 고소…챗GPT 학습에 저작물 무단 이용

Martin Bayer | COMPUTERWOCHE 2023.09.25
'왕좌의 게임'으로 유명한 판타지 소설 작가 조지 R.R. 마틴을 비롯해 존 그리샴, 조디 피코, 조너선 프랜즌, 조지 샌더스 등 수많은 베스트셀러 작가들이 챗GPT 개발사인 오픈AI를 상대로 소송을 제기할 예정이다. 워싱턴 포스트의 보도에 따르면, 미국 작가 협회가 수천 명의 작가를 대신해 소송을 제기했다.
 
ⓒ Getty Images Bank

작가들은 오픈AI와 같은 AI 개발사가 저작권이 있는 저작물을 사용해 대규모 언어 모델(LLM)을 불법적으로 학습시켰다고 주장한다. 또 "이런 알고리즘의 핵심은 대규모의 조직적인 도용"이라고 비난했다. 작가들은 라이선스 수익 손실에 대한 손해배상을 요구하고 있으며, AI 개발사가 더 이상 자신들의 저작물로 알고리즘을 학습시키지 못하게 해달라고 요구했다.

이번 소송은 생성형 AI 애플리케이션 개발에서 저작권 문제를 둘러싼 논쟁을 한층 더 격화시킬 것으로 보인다. LLM은 기본적으로 웹의 다양한 데이터로 학습되지만, 오픈AI 같은 생성형 AI 개발사는 이런 정보의 출처를 명시적으로 공개하지 않는다. 비평가들은 인터넷 포럼에서 불법으로 복제된 저작물과 텍스트가 웹에서 무료로 제공되는 데이터와 마찬가지로 학습 목적으로 사용될 것으로 추측한다.

생성형 AI 개발사를 상대로 한 소송이 이번이 처음은 아니다. 올해 초, 대형 스톡 이미지 업체인 게티 이미지가 스테이블 디퓨전 개발사인 스태빌리티 AI를 상대로 소송을 제기했다. 스테이블 디퓨전이 저작권으로 보호되는 수백만 개의 이미지와 메타데이터를 불법적으로 학습했다는 이유이다. AI가 생성한 일부 이미지에는 게티 이미지의 워터마크까지 등장한 것으로 알려졌다.

미국 로스앤젤레스의 변호사이자 개발자인 매튜 버터릭은 2022년 가을에 마이크로소프트, 깃허브, 오픈AI를 상대로 소송을 시작했다. 이들 업체의 AI 툴, 특히 마이크로소프트의 코파일럿이 개발자의 저작권을 침해한다는 것이 버터릭의 주장이다. 코파일럿은 코딩을 추적 및 분석하고 적절한 지점에서 대체 코드 블록을 제안하며, 개발자는 이를 직접 채택할 수 있다. 버터릭은 코파일럿의 작동 및 학습 방식을 비판했다. 코파일럿은 인터넷, 특히 깃허브에 있는 수십억 줄의 소프트웨어 코드를 분석해 스스로 학습하는 방식으로 기능을 개발하는데, 이 방식이 학습에 사용된 코드를 개발한 프로그래머의 권리를 침해한다는 설명이다.

워싱턴 포스트의 보도에 따르면, AI 개발사들은 구체적인 소송에 대해서는 언급하지 않고 이른바 '공정 사용'을 주장하고 있다. 인터넷에서 공개적으로 자유롭게 사용할 수 있는 데이터로 LLM을 교육하는 것은 공정 사용에 해당한다는 주장이다. 결국, 인공지능의 창작물은 인간 작가의 작품과는 분명히 다를 것이기 때문이다. 하지만 많은 작가가 이에 동의하지 않는데, AI 작품은 종종 작가들의 작품과 놀라울 정도로 비슷해 보인다고 지적한다.

생성형 AI를 둘러싼 이런 논쟁 때문에 앞으로 전 세계 법원이 분주해질 가능성이 크다. 미국뿐만 아니라 유럽에서도 AI 개발 및 사용에 대한 법적 지침을 마련하고 있지만, 아직 구체적인 법률로 시행되지는 않았다.
editor@itworld.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.