안일운 님 /캐리커쳐=디미닛
안일운 님 /캐리커쳐=디미닛

바야흐로 인공지능(AI) 시대입니다. 일상생활을 돕는 서비스부터, 가상 연예인까지 AI가 조금씩 얼굴을 내밀고 있습니다. 
단순 고객상담 챗봇에서 시작하는가 싶더니 어느새 유명 아나운서 목소리와 말투를 분석해 대신 뉴스를 전달하기 시작합니다.

최근에는 가수 목소리와 음색, 창법을 학습한 AI가 노래를 대신 부르고 방청객이 진짜 가수를 맞추는 경연을 하기도 합니다. 친구처럼 카톡으로 일상대화를 나누는 AI는 너무 사람처럼 학습된 탓(?)에 서비스를 중단하기도 하였습니다. 

AI 서비스의 폭발적인 발전 이유는 여러가지가 있을 것입니다. 그 중 중요한 이유를 하나 들자면, 딥러닝 알고리듬들은 개념상 학습하는 데이터 형태에 제약받지 않고, 기존의 AI 알고리듬에 비해 많은 데이터만 있다면 상대적으로 더 쉽게 신경망 모델을 구축할 수 있다는 점에 있겠습니다. 

이 때문에 AI 모델을 만들기 위해서는 양질의 데이터가 필수적입니다. 그리고 인터넷은, 인류가 만든 데이터 창고 중 가장 방대하고, 전자적으로 변환돼 있어 대용량 데이터도 AI가 쉽고 빠르게 해석할 수 있습니다. 게다가 이미 어느정도 분류돼 있고, 어떤 데이터는 이미 질적으로 검증돼 있습니다.

어찌보면, 딥러닝이 발달하기 이전에 인터넷이 발달돼 충분히 데이터를 축적할 시간이 있었기에 현재의 AI가 있다고 하겠습니다. 


인터넷에 있는 데이터 써도 될까?

AI 학습을 위한 데이터를 인터넷에서 수집하다보면 의문이 들 때도 있을 것입니다. 아무리봐도 이 데이터를 만들기 위해서는 시간과 비용이 들었을 것 같은데, 이렇게 다운받아 써도 되는 걸까? 아니면 이미 인터넷에 올려놓았다는 건 누구든 써도 상관없다는 의미가 아닐까?

AI 모델 학습을 위한 인터넷상 데이터 수집에 대해서, 법률적 분석하면 여러 측면이 있을 수 있겠지만, 여기서는 저작권법의 측면에만 집중하도록 하겠습니다. 

원래 사람이 자신의 사상 또는 감정을 담아 만든 모든 형태의 창작물(글, 사진, 그림, 노래, 영화, 연극, 책, 그리고 컴퓨터 소프트웨어 등)은 저작물로서, 저작권 보호를 받습니다. 저작물을 창작한 사람은 저작권자로써, 그 저작물을 독점적으로 사용할 권리가 있고, 다른 사람에게 자신의 저작물을 사용토록 할 수 있는 권리를 가집니다. 저작권자에게 허락받지 않고 저작물을 사용하면 저작권법을 위반하게 됩니다. 

이 때문에 높은 수준의 AI 모델을 만드는 양질의 데이터를 인터넷으로 얻는 것이 저작권법에 위반되는지 여부는 최근 논쟁의 대상이 되어 왔습니다. 서울의 날씨 통계, 법조문 같은 것은 저작물로 인정되지 않기 때문에 쉽게 AI 모델 학습에 사용할 수 있지만, 인터넷에 공개된 신문기사, 토론게시판에서 오간 글과 댓글, 인터넷 쇼핑몰에 게시된 사진들은 모두 저작물이기 때문에 저작권자의 허락 없이 AI 모델로 사용할 수 있는지 논란이 있었습니다.


문체부, 입법 나선다... 써도 된다

물론 신문기사, 게시판의 글과 댓글, 쇼핑몰 사진과 같은 저작물을 AI에 학습하는 것은 사람이 이를 직접 이용하는 것과는 그 형태가 다릅니다. 저작권법에서 말하는 저작물의 이용이란, 기본적으로 사람이 그 저작물을 직접 향유하고 제3자에게 전달 및 표현하는 것에 방점을 두기 때문에, AI 학습을 위한 저작물 이용은 저작권법에서 말하는 공정이용(fair use)이 되어 저작권자의 권리로 막을 수 없다는 견해가 우세하였습니다. (이러한 해석에 AI 산업의 발전을 촉진할 산업적 필요성이 고려된 것은 물론입니다.)

결국 정부는 입법을 통해서 논란을 종결할 계획입니다. 문화체육관광부가 입법을 준비하고 있는 저작권법 전부개정안은, 인공지능 학습과 빅데이터 분석을 위해서 인터넷에 공개되어 있는 저작물을 사용할 때에는 저작권자의 이용허락을 받지 않아도 된다는 내용을 포함하고 있습니다. 

아마도 저작물이 AI 모델 학습을 위하여 사용하는 것이 저작권법에서 허용하는 저작물 이용이냐 아니냐에 대한 해석론을 마련하는 것보다도, 빠르게 AI 모델을 학습할 수 있는 환경을 만들어 국내 AI 산업을 발전시키도록 하기 위한 것이 더 중요하다고 판단하지 않았나 싶습니다. 

어찌됐든, AI 개발자들 입장에서는 가치있는 데이터를 가지고 더 다양하고 효과적인 AI 서비스를 만들어 볼 수 있는 장이 열리고 있다고 봐야 할 것입니다.

개정 저작권법의 내용 덕분에, 요즘 갈수록 중요해져 가는 '데이터'의 가치 그리고 그 본질에 대해서, 법률적으로도 그리고 비즈니스적으로도 생각해볼 수 있는 기회가 됐습니다. 

글=안일운
정리=김현기 기자 khk@techm.kr


<Who is> 안일운 님은?

법무법인 비트의 수석변호사다. 주요 업무는 IT 기업과 가상자산/블록체인 기업의 법률 자문, 투자와 M&A 자문이다. 대학에서 컴퓨터공학을 전공했다. 세계 대학생 프로그래밍 경시대회(ICPC) 한국 본선에서 입상하고 네이버 검색개발센터 과장으로 일하다가 법학전문대학원(로스쿨)에 진학, 제5회 변호사시험에 합격했다. 과학기술정보통신부 ICT 스타트업 법률 멘토 변호사, 대한변호사협회 IT 블록체인 특별위원회 위원 등으로도 활동하고 있다.