[문샷피플]두 도시 오가며 공부하던 이민소녀...구글 AI책임자로

구글 인공지능 전문가 페이페이 리

지난해 11월 다이앤 그린 구글 클라우드 사업부문책임자는 클라우드 사업부문에 흩어져 있던 머신러닝 조직을 통합해 새로운 머신러닝 그룹을 만들었다. 그리고, 이 그룹을 이끌 2명의 인공지능(AI) 전문가를 영입했다.

소셜 미디어 스냅챗 연구소장인 지아 리(Jia li)와 스탠퍼드대 인공지능연구소(SAIL) 소장인 페이 페이 리(Fei-Fei Li) 교수가 그들이다.

두 사람 모두 여성이고, 인공지능의 하위 연구 분야인 컴퓨터 비전 시스템 전문가라는 공통점을 갖고 있다.

다이앤 그린은 두 사람을 영입하면서 구글의 클라우드 사업에 인공지능이 핵심적인 역할을 할 것이며, 이들의 전문지식이 인공지능의 사업화에 기여할 것이라고 밝혔다.

로브크래프트 구글 클라우드 사업부문 프로덕트 매니저 역시 머신러닝 그룹이 연구 부문과 핵심 비즈니스를 연결하는 가교 역할을 하게 될 것이라고 말했다.

세계 최대 이미지 DB ‘이미지넷’ 구축

구글이 영입한 두 사람 중 한명인 페이-페이 리는 시각지능(Visual intelligence) 기반 인공지능 전문가로 명성을 얻고 있는 인물이다. 중국 베이징 출신인 그녀는 16세에 부모님을 따라 미국으로 이민을 왔다.

프린스턴대 물리학과를 거쳐 지난 2005년 캘리포니아공대(Caltech)에서 비주얼 인식과 컴퓨터 모델링에 관한 논문으로 공학박사 학위를 받았다. 2012년부터 스탠퍼드대 컴퓨터과학과 교수로 재직했으며, SAIL과 스탠퍼드 비전연구소장을 맡아 권위 있는 연구기관으로 키웠다.

SAIL은 MIT 산하 컴퓨터과학 및 인공지능연구소(CSAIL)와 함께 인공지능 분야의 대표적인 연구기관으로 인정받고 있다.

아메리칸 드림 실현한 페이-페이 리

가난한 이민자의 딸에서 세계적인 명문 스탠퍼드대의 테뉴어 교수를 거쳐 이제는 글로벌 IT기업 구글의 머신러닝 그룹을 이끌고 있는 페이-페이 리.

그녀의 삶은 한마디로 아메리칸 드림의 실현 과정이라고 표현할 수 있다. 미국 카네기재단은 미국 사회에 기여한 이민자를 대상으로 매년 40명 정도의 ‘위대한 이민자(Great Immigrant)’를 선정해 발표하는데, 지난해에는 페이-페이 리에게 영광이 돌아갔다.

중국 베이징 출신인 그녀는 16세에 부모를 따라 미국으로 건너왔다. 그녀의 부모는 중국에서 비교적 좋은 교육을 받았지만, 영어는 전혀 하지 못했다.

미국에 정착한 아버지는 카메라를 수리해주는 일을 했고, 어머니는 계산원으로 일했다. 페이-페이 리는 중국 식당에서 허드렛일을 해야 했다.

서툰 영어에도 불구하고 그녀는 뉴저지주 파시패니고등학교에서 수학과 과학 과목에서 우수한 성적을 받았다. 고교 선생님은 영어는 잘 못하지만 공부에 대한 열정이 남달랐던 그녀에게 친절을 베풀었는데, 이 때의 선생님에게 그녀는 아직도 고마운 마음을 간직하고 있다.

명석한 머리 덕분에 프린스턴대 물리학과에 전액 장학금으로 진학한 그녀는 고등학교 수학선생님에게 빌린 돈으로 부모님이 세탁소를 운영할 수 있도록 도움을 주기도 했다. 주중에는 프린스턴에서 공부하고 주말에는 파시패니로 돌아와 세탁소 일을 했다. 그녀는 이 때를 ‘두 도시 이야기’와 같았다고 회고했다.

1999년 프린스턴대를 졸업한 그녀는 인생의 중대한 선택을 해야 하는 기로에 섰다. 증시 황황 덕분에 골드만삭스, 매킨지 등 월스트리트 금융 또는 컨설팅 기관으로부터 입사 제안이 있었기 때문. 부모님을 부양해야 한다는 책임감에 잠시 흔들리기도 했지만 학업에 대한 열망은 더 강했다.

그녀는 한때 티벳에 가서 전통의학을 공부하기도 했다. 프린스턴대학 재학 시 ‘마틴 A.데일 장학생에 선정돼 티벳에서 전통의학을 연구할 수 있는 기회를 얻었던 것. 마틴 데일 장학생은 학생에게 2만 달러를 장학금으로 주고 독자적인 프로젝트를 할 수 있도록 지원한다. 덕분에 그녀는 프린스턴 졸업 후 티벳에서 장기간 머무르면서 티벳 의학을 공부할 수 있었다.

중국과 티벳에 대한 그녀의 관심은 일시적인 것은 아니었던 모양이다.

중국에서 사춘기를 보냈던 그녀는 일본군이 중국과 아시아 각국의 민족들에게 큰 고통을 안겨주었다는 점을 잊지 않았다. 프린스턴 재학 시에는 난징학살에 관한 국제 컨퍼런스를 조직하는 활동을 하기도 했다.

티벳에서 돌아온 그녀는 유명 공과대학인 캘리포니아공대에 진학, 인공지능과 컴퓨터신경과학을 공부하고 박사학위를 받았다. 그 사이 어머니가 모친이 암과 뇌졸중에 걸려 마음 고생을 하기도 했다.

스탠퍼드대 교수로 부임한 후에는 인공지능연구소와 비전연구소 소장으로 일하면서 인공지능 분야 대표적인 연구기관으로 키워냈다. 역경을 견디고 세계적인 인공지능 전문가로 성장한 것.

페이-페이 리가 시각지능 기반 인공지능 분야에서 큰 명성을 얻은 것은 지난 2007년 프린스턴대 카이 리 교수와 함께 시작한 ‘이미지넷(ImageNet)’이 덕분이다.

세계 최대 이미지 데이터베이스인 이미지넷은 2009년 처음으로 공개됐는데, 머신러닝 인공지능 연구 분야에서 획기적인 전환점을 만들었다는 평가를 받고 있다.

인공지능 연구자들은 웹에 흩어져 있는 방대한 양의 이미지와 동영상을 바탕으로 이미지를 효과적으로 인식할 수 있는 기술을 연구했다. 이를 위해서는 잘 정리된 많은 양의 이미지 데이터베이스가 필수적이다.

페이-페이 리는 아마존의 ‘메카니컬 터크’라는 크라우드 소싱 시스템을 활용해 이 머신러닝 기술을 지원하는 이미지 뱅크를 만들었다. 전 세계 각국에 포진해 있는 5만 명에 가까운 작업자(Turker)들이 10억 장에 달하는 후보 이미지를 카테고리별로 분류하고 일상적인 영어 단어로 라벨링하는 작업을 수행했다.

또 객체와 사물 이미지를 2만2000개의 범주로 분류한 후 1500만 장에 달하는 방대한 이미지 데이터베이스를 만들어 외부 연구자들이 활용할 수 있도록 공개했다.

이미지넷의 풍부한 데이터베이스는 머신러닝 알고리즘인 ‘CNN(컨볼루션 신경망)’ 기술의 발전에 기폭제 역할을 했다.

그녀는 2015년 TED 강연에서 “이미지넷의 방대한 데이터와 현대의 CPU 및 GPU 기술에 힘입어 CNN 기술이 아무도 예상치 못한 방식으로 발전했다”면서 시각지능을 갖춘 인공지능 시스템이 특정 사진을 보고 사람처럼 문장으로 표현할 수 있는 ‘컴퓨터 비전 모델’을 개발하는 데 성공했다고 말했다.

그녀는 컴퓨터 알고리즘이 복잡한 콘텐츠의 사진 이미지를 보고 사람처럼 문장이나 말로 표현할 수 있는 인공지능 시스템 개발에 힘을 쏟고 있다.

“사람이 세계를 인식하는 방식과 동일한 방식으로 세계를 인식할 수 있는 비전시스템을 개발하겠다"는 게 그녀의 꿈이다. 아직은 초보적 수준이지만, 사람과 같은 비전 시스템을 개발하겠다는 그녀의 꿈은 점점 현실화될 것이다.

인공지능 발전의 중추, 시각지능

인공지능 분야에서 시각 지능이 중요한 이유는 무엇일까? 페이-페이 리는 시각적인 능력은 ‘일반 지능(general intelligence)’을 구현하는데 매우 중요한 요소라고 말한다.

지질학적 대사건인 ‘캄브리아기 대폭발’은 5억4200만 년 전에 지구상에 갑자기 다양한 종류의 동물이 출현한 현상을 일컫는다. 학자들은 갑자기 동물의 숫자가 폭발적으로 증가한 원인으로 동물의 진화된 시각 능력을 지목하고 있다.

동물들의 시각 능력이 빠르게 발전하면서 동물들이 짝을 보다 쉽게 찾을 수 있고, 먹잇감을 사냥할 수 있는 기회도 많이 얻었다. 당연히 동물의 생존 가능성이 높아졌다.

페이-페이 리는 시각 능력의 진화가 5억4200만 년 전에 동물의 생존 가능성을 높인 것처럼 시각지능이 인공지능 발전에 중추적인 역할을 할 것이라고 전망한다. “학습은 인간지능의 중요한 부분인데, 컴퓨터에게 시각 지능을 제공하는 것이야말로 학습을 위한 필수적인 경로”라는 것이다.

페이-페이 리는 사람이 세계를 인식하는 방식과 동일한 방식으로

세계를 인식할 수 있는 비전시스템을 개발하겠다는 꿈을 갖고 있다.

아직은 초보적 수준이지만, 그녀의 꿈은 점점 현실화될 것이다.

페이-페이 리는 실세계에 있는 객체들의 다양한 변이들이 인공지능에 큰 혼란을 주는데, 고도로 학습된 컴퓨터 비전 시스템은 인공지능 분야에서 캄브리아기 대폭발과 같은 큰 혁신을 가져다줄 것이라고 확신하고 있다.

‘다양성’이란 가치도 인공지능 분야에서 매우 중요하다는 게 그녀의 일관된 믿음이다. 가령 구글 이미지 검색에서 영어로 ‘grandma’라는 단어를 치면 백인 여성들의 이미지들이 주르륵 뜬다. 아프리카계 미국인이나 라틴계 여성들의 이미지는 별로 보이지 않는다. 인공지능에 인종적인 편견이 관여될 수 있다는 의미다.

이미 인공지능 분야 연구에서 성적인 불평등은 매우 심각한 수준이다. 미국 대학 컴퓨터과학 전공자 중 여성 비율은 지난 1984년 37%에서 현재 18% 수준까지 떨어졌다.

페이-페이 리가 소장으로 있던 스탠포드 인공지능연구소 연구원 15명 중 여성은 오직 1명이고 스탠퍼드대 컴퓨터과학과 교수 중 여성은 단 5명이다. 전문가들은 인공지능 분야의 높은 남성 비율을 ‘sea of dudes’라는 말로 표현하고 있을 정도다.

페이-페이 리는 인공지능 분야의 다양성 부재가 인공지능 시스템의 ‘편견’을 조장 및 강화할 수 있다고 경고한다.

인공지능이 흑인을 고릴라로 잘못 인식하는 것 역시 인공지능 분야에 백인이 압도적으로 많다는 점과 무관치 않다. 페이-페이 리는 인공지능 연구의 다양성 부재가 3가지 측면에서 문제가 있다고 비판한다.

경제적인 측면에서 보면 자동화와 머신러닝 부문이 국내총생산(GDP)에서 차지하는 비중이 점차 높아지는데, 전문 인력의 부족으로 어려움을 겪을 수 있다는 것. 다양성 부재는 또한 창의성과 혁신의 저해요인으로 작용할 수 있다.

다양한 배경을 갖고 있는 사람들이 인공지능 연구에 유입될 때 창의력이 생기고 혁신을 꾀할 수 있다는 것이다.

다양성의 부재는 정의와 공정성 측면에서도 부정적 영향을 미친다. 인공지능시스템에 이미지를 확인하고 음성을 인지하는 방법을 훈련시키려면 방대한 양의 데이터셋이 필요한데, 남성 중심의 컴퓨터 과학자들이 만들어내는 데이터세트는 편견과 불공정, 부주의를 용인할 가능성이 크다는 얘기다.

페이-페이 리는 인공지능이 기본적으로 사회에 봉사하는 응용 학문이라고 생각한다. 인간주의적인 AI 연구 방법론이 필요한 이유다. 인간주의적 AI 연구는 기술의 중요성에 대한 깨달음을 주면서 동시에 다양한 그룹의 학생과 기술자, 그리고 혁신자를 참여시키는 중요한 접근 방법이다.

페이.페이 리는 머지않은 미래에 시각 지능을 갖고 있는 인공지능 로봇이 재난 현장에서 사람을 직접 구조하는 일이 가능할 것으로 보고 있다.

대형 복합 재난이 발생할 때 긴급 구조대원이나 적십자 대원 대신 시각 지능을 갖추고 있는 인공지능 로봇들이 현장의 잔해 더미 속에서 사람을 수색할 날이 멀지 않았다는 말이다.

<본 기사는 테크M 제46호(2017년 2월) 기사입니다>

키워드

테크M의 최신소식 및 정보를 E-mail 서비스로 받아 볼 수 있습니다.