대장암과 왓슨, 그리고 마이너리티 리포트

황대용 교수의 튼튼대장습관!

건국대학교병원 대장암센터장/황대용 교수

‘왓슨’이라 불리는 인공지능이 암 진단 및 치료방침을 정해주는 분야로 범위를 확장하기에 이르렀다. 최근 국내 한 병원에서 이를 재빨리 도입하여 대장암 환자를 포함한 80여명의 암 치료에 이를 이용하였고, 이후 지방의 다른 대학병원도 왓슨의 도입에 박차를 가하고 있다는 얘기를 들었다.

향후 의료계에서 이에 대한 다양한 의견들이 개진될 것으로 보이는데, 당장은 왓슨의 충격이 너무 큰 탓인지 암 진단이나 치료법을 왓슨에게 전적으로 맡기자는 의견들이 다수 제시되고 있다. 이와 더불어 의학 교육 역시 기계가 범접하기 어려운 인문학을 강조하는 쪽으로 방향을 제시하고 있는 것 같다. 과연 인공지능에게 암 진단과 치료를 맡기고 의사들은 환자의 감성을 어루만지는 역할을 수행하는 것만이 미래지향적일까?

2005년 필자가 근무했던 병원의 협력병원이었던 뉴욕 메모리얼 슬로언 케터링 암센터(Memorial Sloan Kettering Cancer Center, MSKCC)와 매년 진행하던 국제 암 심포지엄을 개최했다. 강의를 맡은 그 쪽 의료진은 간 수술의 세계적인 대가인 블룸가르트(Blumgart)를 비롯한 내로라하는 유명인들이었다.

그때 종양내과 의사인 살츠(Saltz) 박사의 강의를 들을 기회가 있었다. 지금까지 나온 최신의 대장암 치료법은 무엇인지가 초미의 관심사였다. 하지만 그의 강의는 우리가 기존에 알고 있는 대장암 가이드라인에 영향을 준 임상 연구의 문제점에 관한 내용들로 구성되어 있었다. 해당 임상 실험들에 얽힌 뒷 얘기와 그에 따른 오류들에 관한 신랄한 비평이 주된 강의 내용이었다. 강의를 다 듣고 난 뒤, 그 유명한 임상 실험에 이렇게 많은 오류들이 있다는 것에 잠시 머리가 멍해졌다.

실제 대장암 수술 관련 연구들도 이러한 오류에서 자유롭지 못하다. 대장암 분야에서 논란이 되고 있는 복강경 수술에 관한 부분의 예를 들면 다음과 같다. 임상 연구는 전향적이면서도 무작위적인 연구가 가장 큰 영향력이 있다.

대장암에서 복강경 수술의 안정성에 대한 논란이 한창이던 2000년대에 스페인의 한 의료진이 결장암에서 복강경 수술과 개복술 비교의 장기 성적에 대한 연구결과를 의학잡지인 ‘란셋(Lancet)’에 최초로 발표하였다. 비록 일개 의료진의 경험이지만 꽤 많은 수의 환자를 대상으로 하여 무작위적인 방법으로 최초로 이루어진 장기간의 연구라는 취지가 받아들여져 권위 있는 학술지에 발표된 것이다. 하지만 이 연구는 그 이후 너무나 많은 편견과 문제점들이 부각되어 최초의 연구라는 것 외에는 의미가 없는 것으로 전락하고 말았다. 이후 같은 내용을 주제로 하여 미국의 여러 병원 의사들이 모여 연구가 진행되었고, 그 내용이 2004년 ‘뉴잉글랜드 저널 오브 메디슨(New England Journal of Medicine, NEJM)’에 발표되었다. 이 연구를 근거로 미국 대장외과학회 가이드라인의 결장암 수술 관련 내용에 “복강경 수술이 하나의 대안이 될 수 있다”는 내용으로 일부 수정되었다. 하지만 이 연구 역시 발표 이후 통계 오류가 발견되어, 결장암에 관한 복강경 수술의 안정성이 충분히 입증되었는가에 대한 비판에 직면하기도 하였다.

필자가 1997년 미국에 대장암 연구를 위해 교환교수로 있었던 시기의 이야기이다. 필자가 오기 이전 팀의 연구는 실험용 쥐의 간 동맥에 항암제를 투여하면서 혈관수축제를 동시에 투여하면, 혈관수축제를 투여하지 않은 경우보다 간 전이 부분에 항암제가 좀 더 많이 침투한다는 것을 객관적으로 입증한 것이었다. 이 연구는 1998년 학술지인 ’저널 오브 서지칼 리서치(Journal of Surgical Research)’에 게재되었다. 필자의 연구 주제는 이 연구의 후속으로 간 동맥에 혈관수축제를 같이 투여한 쥐가 항암제만 투여한 쥐보다 더 오래 살 것인지에 대해 연구하는 것이었다. 

하지만 실험 전에 이들 결과를 놓고 계산을 해보니 혈관수축제가 같이 투여된 경우, 간 전이 종양에 항암제가 상대적으로 더 많이 투입된 것은 맞지만, 일차방정식을 이용하여 계산한 결과, 항암제의 절대 양은 혈관 수축이라는 변수로 인해 혈관수축제를 사용하지 않은 간 전이 종양에  더 많이 들어간다는 것을 반증하게 되었다. 이 입증이 맞다면 후속 연구는 우리가 원했던 것과 반대의 결과를 가져올 것이 자명하였다. 입증 자료를 검토한 주 연구자 밀솜(Milsom) 박사는 필자의 반증 결과를 흔쾌히 받아들이며, 의미 없는 후속 연구에 비용과 노력을 들일 뻔 했다고 안도하였다. 이후 그 연구 주제를 완전히 덮고 새로운 연구를 진행할 수 있게 해 주었다.

그 당시에 연구하던 대장암 세포의 간 전이 분야에서, 간에 대장암 세포가 옮아간 뒤 초반에는 암 세포가 주위의 영양분을 간 세포로부터 바로 흡수하는 방식으로 공급받다가, 간 전이 암이 1mm 크기가 되면 간 동맥으로부터 영양을 받게 된다는 얘기가 모든 연구자료에서 한결같이 언급되어 있었다. 이것의 본래 근거자료가 무엇인지 확인하기 위해 계속 연구자료들을 거슬러 올라갔더니 마지막 부분에서 이에 대한 단서의 고리가 사라져 버렸다. 결국 누군가 처음(의도했든 의도하지 않았든 간에 근거 없이) 기술한 내용이 수십 년 동안 아무런 비판 없이 인용되어 오고 있다는 사실을 깨닫게 되었다.

왓슨의 기능을 처음 들었을 때, 희귀 질병의 진단이나 치료에는 상당한 도움이 될 것이란 생각이 들었다. 평소에 자주 접하지 못하는 희귀 질환들은 진단도 어렵고 치료법도 정립이 되어있지 않은 경우가 많기 때문이다. 의료진도 자주 접하지 못한 병이라면 여러 의학 자료들을 다시 찾아 확인하는 절차가 필요한데, 이럴 때 인공지능의 역할은 큰 도움이 될 것으로 보였다.

2012년부터 메모리얼 슬로언 케터링 암센터(MSKCC)에서는 주로 폐암과 관련된 내용을, MD앤더슨 암센터에서는 백혈병과 관련된 내용들을 왓슨에게 학습시켜 그 연구결과를 발표하고 있다.

왓슨이 환자 치료 결정에 있어 의료진에게 도움을 주는 역할을 할 수는 있겠으나, 최근 기사에 나온 바와 같이 의료진과 상반된 의견이 나오는 경우 환자가 왓슨의 결정을 선호한다는 내용은 넌센스다. 이는 왓슨의 학습 방향이나 용도에 관해 심도 있는 고찰을 하지 않은 섣부른 적용이라는 생각 때문이다. 인간이 왓슨을 가르치는 교사이고, 왓슨은 지식 습득을 하는 학습자로 봤을 때, 교사가 아닌 학습자의 판단을 더 우선시 하는 것은 자칫 오류를 불러일으킬 수 있는 소지가 다분하다.

또한, 왓슨의 지식 습득에 얼마나 많은 시간을 의료진이 투자하고 관여하였는지도 관건이 되겠다. 미국의 두 유명 암센터에서 행해진 학습결과들이지만 눈코 틀 새 없이 바쁜 저명한 의료진들이 과연 왓슨 학습에 실제로 어느 정도 참여하였을까 하는 의구심이 드는 것은 과연 기우에 불과할까? 앞서 지적한 여러 연구 자료들의 오류 처리는 실제로 하였는지, 하였다면 어떤 방법으로 하고, 이를 어떻게 조정하였는지 등도 충분한 논의가 필요한 부분이다.

암 치료에 있어 왓슨의 진단이나 치료의 정확도 등에 대한 검증은 최대의 논란거리 중 하나이다. 왓슨과 의료진이 암 환자들을 대상으로 치료법 비교를 실험하는 것은 아마도 윤리적 문제가 있을 것이므로 현실적으로 불가능할 것이다. 검증 방법을 위한 개인적인 의견은, 왓슨과 또 다른 형태의 인공지능을 동일한 의료진이 동시에 학습시켜 이를 비교하는 것, 혹은 서로 다른 그룹의 의료진이 왓슨을 학습시켜 이들의 학습결과를 비교하는 것 등이 보다 현실적일 수 있겠다.

앞에서 여러 의학 연구들의 오류에 대해 논하였듯이, 왓슨을 비롯한 인공지능은 어디까지나 진단이나 치료결정의 보조 역할을 해야 한다. 만약 의료진과 상반된 결정이 도출되었다면, 왜 그런 결과가 나왔는지에 대한 오류를 찾아내는 것은 의료진들의 몫이다.

왓슨의 등장으로 인해 환자를 인간적으로 보듬는 의료진의 인문학적 측면에 의학교육의 초점을 맞추는 것도 필요하겠지만, 그 보다는 많은 의학연구들의 문제점과 오류를 발견할 수 있는 깊은 성찰과 지적 능력, 즉 이러한 학습과 연구를 위한 노력이 한층 더 필요한 시기이다. 결국 왓슨을 학습시키는 것은 우리 인간이기 때문이다.

새삼 2002년에 개봉한 스티븐 스필버그 감독의 ‘마이너리티 리포트’라는 영화가 떠오른다. 2054년 미국 워싱턴에서 범죄 예방을 위해 세 명의 예지자들의 예지에 따라 살인이 일어나기 전에 범죄를 미리 예방하는 시스템에 대한 내용이다. 하지만 예지자들의 의견이 일치하지 않는 마이너리티 리포트의 존재는 결국 시스템의 오류를 지적하는 것으로, 이를 이용한 범죄로 인해 결국 미국 전역에 이 시스템을 도입하려던 계획은 무산되어 버린다.

과연 왓슨은 암 환자의 ‘마이너리티 리포트’를 어떻게 처리할 것인가?

* 본 칼럼의 내용은 헬스조선의 편집방향과 일치하지 않을 수도 있습니다.

황대용 교수의 튼튼대장습관!

우리나라 암 발생률 1위 대장암, 대장암에 관한 상식 및 사례 중심의 건강정보를 제공합니다.

서울대학교 의과대학 졸업 및 동대학원 박사학위 취득
건국대학교병원 의학전문대학원 외과학교실 교수
건국대학교병원 대장암센터장
건국대학교병원 외과과장, 대장항문외과 분과장
건국대학교병원 암센터장
대한대장항문학회 편집위원회 위원장, 대학외과학회 편집위원회위원
전 서울아산병원 외과 임상강사
전 원자력병원 외과과장, 대장암분과장
  • Copyright HEALTHCHOSUN.COM
맨 위로