/사진=디디다컴퍼니 제공
/사진=디디다컴퍼니 제공

메타가 2023년부터 이어진 AI 훈련 데이터 소송에서 유튜브의 불법 콘텐츠 관리 사례를 방어 논리로 활용한 사실이 밝혀졌습니다.

지난 17일 테크크런치는 메타의 AI 모델 '라마' 시리즈가 저작권이 있는 전자책 데이터세트를 훈련 자료로 사용했다는 소송이 2023년 말 시작되었다고 보도했습니다. 이 소송에서 마크 저커버그 메타 대표는 지난해 말 법정 증언을 통해 데이터 사용과 공정 이용의 관계를 설명하며 유튜브 사례를 언급했습니다.

문제가 된 데이터는 '리브젠'으로, 주요 출판사의 저작권 자료를 불법으로 공유해 여러 차례 법적 조치를 받은 플랫폼입니다. 원고 측은 메타가 해당 자료를 라마 모델 훈련에 사용했으며 이를 바탕으로 출판사들과 라이선스 협상을 진행해야 한다고 주장하고 있습니다.

최근 수정된 고소장에는 메타가 지난해에도 불법 자료 제공 사이트인 'Z-라이브러리'에서 데이터를 사용했다고 명시되어 있습니다. Z-라이브러리는 러시아 국적의 운영자들이 저작권 침해 혐의로 기소된 사례가 있는 플랫폼입니다.

저커버그 대표는 지난해 말 법정 증언에서 리브젠에 대해 잘 알지 못한다고 답했습니다. 다만 공정 이용과 관련하여 "일부 콘텐츠가 저작권을 침해한다고 해서 플랫폼 전체를 금지하는 것은 항상 적합하지는 않다"고 말했습니다. 

또한 그는 유튜브가 불법 복제된 콘텐츠를 일정 기간 호스팅할 수 있지만 이를 삭제하려는 노력을 기울이고 있다는 점을 강조하며 플랫폼 전체를 금지하는 조치가 과도하다는 입장을 보였습니다.

테크크런치는 "메타가 진행 중인 소송은 현재 미국 법원에서 진행 중인 AI 기업들과 작가, 지식재산권 소유자들 간 갈등 중 하나"라며 "AI 기업들은 저작권이 있는 콘텐츠를 훈련 데이터로 사용하는 것이 공정 이용에 해당한다고 주장하지만 다수의 저작권 소유자는 이에 반대하고 있다"고 분석했습니다.

AI 훈련 데이터와 공정 이용 문제에 대한 논란이 계속되는 가운데 이번 소송 결과가 어떤 영향을 미칠지 궁금합니다.

자료=미디어뱀부
정리=김현기 기자 khk@techm.kr

관련기사