IBM 인공지능 왓슨, 과대광고일까? 성장통 중일까?

[MIT선정, SMART 50] IBM

[MIT선정, SMART 50] IBM

MIT리뷰는 최고의 스마트 기업 리스트에 IBM을 39위로 올렸다. 이는 제약업계를 중심으로 인공지능 왓슨의 회의론이 고개를 들고 있는 가운데 나온 것이라는 점에서 의미가 있다. MIT리뷰는 IBM이 왓슨의 능력을 과장한 것은 사실이지만 이는 머신러닝의 학습특성상 불가피한 면이 있으며 여전히 IBM은 의료 분야를 혁신할 수 있는 데이터를 가장 많이 갖고 있다고 분석했다.

[테크M 독점제휴=MIT테크놀로지리뷰]

의사인 폴 탱은 무릎 수술을 받은 아내의 주치의에게 아내가 언제쯤 정상 생활로 돌아올 수 있느냐고 물었다. 의사가 모호하게 대답을 피하는 것을 보고 탱은 무척 놀랐다. 대부분의 의사들이 환자가 언제쯤 일상적인 생활을 하게 될 지 모른다는 사실을 발견한 것.

탱은 의사로 일하면서 IBM 왓슨헬스의 최고의료혁신 책임자를 겸하고 있다. 왓슨헬스는 IBM이 미래를 걸고 있는 기계학습 시스템, 왓슨을 위한 의료 응용프로그램을 만든다.

탱은 의사들이 얻지 못하는 정보를 왓슨이 제공할 수 있을 것이라고 말한다. 그의 아내 같은 환자가 언제쯤 고통 없이 걷고 계단을 올라갈 수 있는지 같은 것 말이다. 심지어 사진 판독과 조직 검사를 통해 최적의 치료법을 제안할 수도 있다.

의료 분야는 기계 학습 시장에서 가장 인기있는 분야다. CB인사이츠에 따르면 2013년 이후 적어도 106개의 스타트업이 이 분야에 새로 뛰어들었다.

왓슨은 2011년 퀴즈쇼 제퍼디의 우승과 유례없는 홍보에 힘입어 다른 어떤 스타트업 보다 주목을 받았다. 그러나 최근 왓슨 관련 소식은 그리 긍정적이지 않다. 수많은 홍보 기사를 냈던 MD앤더슨 암센터와의 협력은 올해 예기치 않게 끝났다.

IBM의 매출은 감소했고 주가 역시 교착상태에 빠졌다. 분석가들은 왓슨이 실제 어떤 가치가 있는지에 의문을 표하고 있다. 벤처투자사인 소셜캐피털의 창업자 차매스 팔리합티야는 지난 5월 CNBC와의 인터뷰에서 “왓슨은 아무것도 아니다”라고까지 말했다.

그러나 왓슨에 대한 대부분의 비판은, 심지어 MD앤더슨 병원에서 나오는 것 조차 왓슨의 기술 문제 때문인 것 같지는 않다. 그보다 IBM이 왓슨의 미래에 대해 과도하게 낙관론을 편 데 대한 반발에 가깝다.

왓슨헬스는 여전히 인공지능의 의료 분야 적용에 선두에 있는 것으로 보인다. 왓슨이 충분한 결과를 내놓지 못한 이유 중 하나는 왓슨이 ‘훈련’하려면 특별한 데이터가 필요하기 때문. 많은 경우 그런 데이터는 충분하지 않거나 구하기 힘들다.

이는 왓슨만의 문제는 아니다. 의료분야에 기계학습을 적용하려는 모든 이들이 겪고 있는 난관이다.

비록 왓슨이 데이터 부족과 접근 문제로 어려움을 겪고 있지만 왓슨의 경쟁자들이 겪는 고통은 더 크다. 데이터를 구할 수 있는 가장 좋은 방법은 기술 면에서 보수적인 거대 의료기관과 협력관계를 맺는 것이기 때문.

IBM은 다른 스타트업과 애플, 구글 등 경쟁자에 비해 거대 기관의 IT책임자와 임원들과의 신뢰면에서 우위에 있다. MD앤더슨과의 문제에도 불구, IBM은 아직도 확실한 강점이 있다. 의학분야 인공지능 개발에 필수적인 데이터를 갖고 있는 의료기관과 생명과학 회사들을 왓슨의 품 안으로 끌어들이고 있는 것.

과장광고가 MD앤더슨과의 결별 초래

MD앤더슨과의 결별은 왓슨에 대한 과장을 일삼은 IBM이 자초한 것처럼 보인다.

MD앤더슨 암센터와의 협력은 2012년 시작됐다. 모든 환자의 증상, 유전자 정보, 병리 보고서를 왓슨이 읽고 그 환자에 대한 기록과 논문을 종합해 진단과 치료법을 정하는데 도움을 주는 게 목표였다.

양 측 모두 왓슨의 능력에 대해 과도한 희망을 가졌다. IBM은 2013년 ‘새로운 컴퓨터의 시대가 열렸다’며 포브스의 기사를 통해 왓슨이 “임상 시험에 도전하고 있고” 몇 달 내에 환자들에게 사용될 수 있을 것이란 인상을 풍겼다.

2015년, 워싱턴포스트는 왓슨이 “기계와 인간 사이의 집단 지성 모델”을 만들고 있다는 IBM 왓슨 담당자의 말을 인용, 이 시스템이 “의사가 할 수 없는 일을 하도록 의사처럼 훈련 받고 있다”고 썼다.

지난 2월, MD앤더슨 암센터를 운영하는 텍사스대학은 IBM에게 3900만 달러를 지불했음에도 불구, 프로젝트 중단을 발표했다(애초 이 사업은 240만 달러의 계약이었다). 4년간 이들은 파일럿 테스트 이상의 능력을 가진 도구를 만들지 못했다.

병원은 왓슨에 대한 구체적인 의견은 밝히지 않았지만 프로젝트의 운영과 자금조달에 관한 내부 갈등이 있었던 것으로 보인다.

물론 이 사실이 왓슨에 문제가 없음을 증명하는 것은 아니다. 사실 문제는 이 사건에서 드러난 것보다 더 심각하다.

왓슨의 문제를 알려면 먼저 기계학습 시스템이 어떻게 훈련되는지 이해해야 한다. 왓슨은 방사선 사진에서 암을 찾는 등 문제를 맞추는 확률을 높이기 위해 내부 프로세스를 계속 바꾼다. 그러려면 왓슨의 답이 맞는지 알아야 하고 이를 많이 할수록 왓슨의 정확도는 더 높아진다.

엑스레이 사진에서 종양을 찾는 과정은 상대적으로 간단하다. 그러나 유전자 변이와 질병 등 기존 의학에 답이 없는 획기적인 문제에 대해서는 결국 닭과 달걀의 문제에 봉착한다.

어떤 전문가도 데이터를 적절하게 걸러내고 정리해줄 수 없다면 어떻게 왓슨을 훈련시킬 수 있을까.

뉴욕 메모리얼 슬론-케터링 암센터의 계산 병리학자 토마스 푹스는 “자율주행 자동차 개발을 위해 사진의 나무와 교통신호를 기계가 인식할 수 있게 표시하는 일은 누구나 할 수 있지만 의료분야는 훈련 데이터에 이름을 붙이는 단순한 일에도 수십 년간 훈련된 전문가가 필요하다”고 설명했다.

왓슨이 해결해 주기 바랐던 모든 분야에서 이런 까다로운 문제가 등장했다. 이는 기계학습 솔루션을 개발하는 모든 회사에 적용되는 문제다.

엄청난 양의 데이터로 왓슨을 훈련시킨 다음 한 명의 환자에게 유용한 약간의 정보라도 끄집어내려면 누군가 수천 가지의 사례를 직접 정리해야만 한다. 질병과 유전자의 연관관계를 파악하기 위해 왓슨은 특정 질환을 앓은 수천 명의 환자 데이터와 DNA 정보를 알아야 한다.

하지만 유전자-환자 기록의 조합은 쉽게 구할 수 없다. 많은 경우 데이터가 적절한 형태가 아니거나 아예 없다. 그렇지 않으면 수십 개의 다른 시스템에 데이터가 분산되어 있어 다루기가 어렵다.

정기검진에서 초기 질병을 감지하지 못해 치료할 기회를 놓친다면, 결국 병이 깊어져 응급실을 찾거나 전문의를 만나게 된다. 환자의 건강 상태는 나빠지고 더 큰 비용을 치뤄야 하는 것이다.

일차 진료 의사이자 IBM 왓슨헬스 최고 의료책임자인 아닐 자인은 “의료비의 약 삼분의 일은 불필요한 비용”이라고 말한다. 이 때문에 많은 사람들이 기계 학습이 이 문제를 해결할 수 있는 방법이라고 여기고 있다.

그러나 의사가 정말로 환자를 도우려면 왓슨이 의료기록을 통해 알 수 있는 것과 탱이 “건강을 결정짓는 모든 사회적 요소”라고 하는 것의 관계를 파악해야 한다.

여기에는 환자의 약물 복용과 몸에 나쁜 음식에 대한 절제 여부, 생활 환경의 질 등도 포함된다.

그러나 지금 어떤 병원이나 의료기관도 충분한 수의 환자에 대해 이와 관련한 믿을만한 데이터를 가지고 있지 못하고 있는 실정이다. 또 다른 문제는, 병원이 최근의 데이터 기반 의료의 도입에 열의를 보이지 않고 있다는 것.

클리블랜드클리닉의 매니쉬 콜리는 “의료분야는 당황스러울 정도로 새로운 기술을 느리게 받아들인다”고 말한다.

IBM은 트루벤 헬스 어낼리틱스, 엑스플로리스, 파이텔 등 여러 개의 데이터 보유기업을 사들였다. 이들은 모두 병원과 환자 집단을 망라하는 거대한 데이터를 실제로 다루고 있는 회사다. 심지어 MD앤더슨과의 결별 후에도 IBM은 환자 데이터와 관련된 협력업체를 늘리고 있다.

그 중 하나가 900명에 달하는 일차 진료의사들이 가입돼 있는 보스턴의 보험사 아트리우스헬스다. 이들의 목표는 수많은 진료 정보와 의료 기록, 논문에서 특정한 환자에게 필요한 핵심 정보를 찾아내는 왓슨 기반의 시스템을 개발하고 검증하는 것.

아트리우스의 최고 의료책임자 조 키무라는 “일차 진료 의사가 모든 관련 정보를 찾아보는 것은 매우 부담스러운 일”이라고 말한다. 그는 전자의무기록 시스템 도입 때문에 비표준 포맷으로 엄청난 양의 환자 데이터가 만들어져 결과적으로 문제 해결이 더 어려워졌다고 지적한다.

가장 치명적인 것은 환자 기록에서 중요한 상당수 내용이 문장으로 이뤄져 있어 기존 소프트웨어는 이를 정리하지 못한다는 점.

하지만 왓슨은 제퍼디를 위해 개발한, 문장에서 의미를 추출하는 자연어 처리 능력을 갖고 있다. 이상적으로는 이 시스템이 환자가 중병을 앓지 않도록 의사를 통해 도움을 줄 수 있다. 키무라는 “왜 우리는 골반 뼈 골절 환자 치료에만 초점을 맞춰야 하느냐”며 “언제쯤 환자들의 낙상 확률을 예상하고 그들이 다치지 않도록 예방치료에 더 힘을 기울여야 한다”고 강조한다.

왓슨헬스는 주정부의 지원을 받아 6개 카운티 2000여 명의 의료 제공자와 일하는 센트럴뉴욕 케어연합과 제휴를 맺었다. 이를 통해 응급실을 통해 입원했다 퇴원한 환자의 재입원 비율을 25% 줄인다는 목표다. 이 제휴는 수많은 환자 데이터에 대한 잠재적 접속 권한을 포함하고 있다.

이런 데이터를 얻는 또 다른 방법이 있다. 환자 본인에게서 직접 데이터를 얻는 것. 구글 알파벳의 의료부문 자회사인 베릴리는 듀크대, 스탠포드대학과 제휴를 맺고 1만 여 명의 자원자에게서 고도로 구조화된 건강 데이터를 받고 있다. 이 데이터베이스는 병원 방문을 통해 만들어지는 데이터 외에 웨어러블 모니터링 기기에서 나오는 데이터까지 포함한다. 이 작업으로 쓸만한 결과가 나오려면 10년 이상 걸릴 수 있지만, 이 계획은 데이터 구축에 큰 전진이 될 것이다.

메모리얼 슬론-케터링 암센터의 푹스팀은 조직검사 슬라이드를 해석할 수 있는 인공지능 시스템을 만들려 하고 있다. 그러려면 확진 정보와 다른 중요 데이터가 연계된 수많은 슬라이드가 필요하다. 이 때문에 이들은 월 4만 개의 슬라이드를 직접 만들고 있다. 푹스는 “다른 어떤 기관보다도 많은 숫자지만 생물의 다양성 때문에 매우 많은 손이 필요하다”고 말했다.

심지어 MD앤더슨 암센터 조차 왓슨과의 협력이 끝났음에도 모든 암센터 등록 환자를 대상으로 1700여 종의 데이터를 수집하는 대형 프로그램을 시작했다. 이를 이끄는 앤디 푸트리얼 박사는 이런 환자 정보와 연구 결과를 결합한다면 왓슨 같은 시스템의 능력을 높이는 데 매우 큰 도움이 될 것이라고 말했다. 그는 “모든 데이터가 수집되면, 머신러닝을 통해 치료법 별로 어떤 사람이 효과를 보고 어떤 사람은 그렇지 않은지 결정하는 요소를 밝힐 수 있다”고 설명했다.

IBM은 협력기관을 통한 데이터 수집에 박차를 가하고 있다. 암 진단과 치료 분야에만 메모리얼 슬론-케터링, 마요클리닉, 하버드와 MIT가 공동설립한 브로드 인스티튜트, 그리고 의료 진단분야 대기업인 퀘스트 다이아그노틱스가 있다.

메모리얼 슬론-케터링과 협력해 논문을 분석하고 치료 결정에 도움을 주는 시스템을 개발, 플로리다의 주피터메디컬센터와 중국 및 인도의 병원에서 시험하고 있다. 신약 개발 분야에서는 배로우신경과학연구소와 협력, 그동안 연관관계를 몰랐던 5개의 루게릭병 유발 유전자를 찾았다. 또 온타리오 뇌연구소와 함께 21개의 잠재 신약 후보를 발견했다.

언젠가는 왓슨이 의료분야의 개선과 비용 절감에 도움을 주게 될까?

인공지능 의료 전문 벤처캐피털 베세머벤처파트너의 스테픈 크라우스는 아마 그럴 것이라고 말한다. 그는 “왓슨의 기술은 모두 다 존재한다"며 "주가를 높이기 위해 없는 내용을 떠드는 것과는 거리가 멀다”고 말했다.

하지만 크라우스 역시 비현실적인 계획이나 약속(그 중에는 IBM이 직접 내놓은 것도 있다)을 조심해야 한다고 말하는 대부분의 전문가와 같은 의견이다. 그는 “지금 당장은 불가능하다"며 "향후 5년 내에도 어려울 것이고 의사를 대체하지도 못할 것”이라고 말했다.

<본 기사는 테크M 제52호(2017년 8월) 기사입니다>

[MIT선정, SMART 50] IBM

키워드

테크M의 최신소식 및 정보를 E-mail 서비스로 받아 볼 수 있습니다.