AIㆍML

줄 잇는 AI와 LLM의 저작권 침해 소송, 상대는 엔비디아

Jon Gold  | Computerworld 2024.03.12
3명의 데이터 소유자가 엔비디아를 상대로 새로운 소송을 제기했다. 대규모 언어 모델 학습에 저작권 있는 자료를 확보하기 위해 공정 사용 원칙을 지키겠다고 공언한 생성형 AI 업체에 제동을 거는 소송이다.

지난주 말 제기된 이 소는 저작권이 있는 자료(유명 작가의 소설 작품)를 대규모 언어 모델의 학습 데이터로 사용했다는 점에서 그간의 생성형 AI 업체 상대로 제기된 다른 소송과 유사하다. 압디 나즈미안, 브라이언 킨, 스튜어트 오난은 엔비디아의 니모 메가트론 LLM이 자신들의 저작권 있는 자료를 무단으로 사용한 여러 데이터로 학습했다는 소를 제기했다.
 
ⓒ Getty Images Bank

특히 108GB 용량의 북3(Books3) 데이터가 소의 핵심이다. 소장에 따르면 이 데이터는 “라이선스가 없는 방대한 저작권 자료를 호스팅하고 배포해” LLM 개발 업계에서 오랫동안 사용된 여러 섀도우 라이브러리 사이트인 비블리오티크(Bibliotik) 프라이빗 트래커의 사본이다. 저자는 금전적 손해배상과 함께 “독점적 권리를 위반해 제작 또는 사용된 모든 사본의 파기”를 요청하고 있다.’’

3명의 저자는 이미 다른 콘텐츠 전문가 단체를 대리해 주요 AI 업체에 소송을 제기하고 있는 로펌을 선임했다. 미국 코미디언이자 작가인 사라 실버맨은 지난해 7월 오픈AI와 메타를 상대로 소송을 제기했고, 또 다른 집단 소송에 작가 모나 아와드와 폴 트렘블레이가 대표 원고로 이름을 올렸다. 미국에서 연방법이 독점 적용되는 저작권 소송은 연방 법원이 심리하므로, 다른 소송과 마찬가지로 이 소송도 미국 캘리포니아 북부 연방지방법원에 제기됐다.

모든 소송의 핵심 개념은 ‘공정 사용’이다. 미국 저작권법의 예외 조항으로, 경우에 따라 허가 없이 저작물을 복제하거나 다른 용도로 쓸 수 있는 예외를 마련한 조항이다. 스탠포드 저작권 및 공정 사용 센터에 따르면, 특정 활동이 공정 사용에 해당하는지를 판단하는 법적 기준은 사용의 목적과 성격, 저작물의 성격, 사용된 저작물 양과 상당성, 저작권 소유자의 저작물 시장에 대한 사용의 영향이며, 판사는 이 4가지 요소를 검토하게 된다.

엔비디아 같은 AI 개발사는 저작권 있는 저작물을 사용하는 것은 원저작자의 사용과 크게 다르고, AI 학습을 위해 책을 사용한다고 해서 향후 독자 시장에 큰 영향을 미치지 않을 것이라고 주장할 것으로 보인다. 반면, 원고 측은 공정 사용에 반대하는 논거로 여러 저작물을 전체적으로 수집한 점과 엔비디아가 책을 사용해 상업적으로 사용한다는 점을 지적할 가능성이 크다. 엔비디아는 별다른 입장 발표를 하지 않았다.
editor@itworld.co.kr 
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.