韓 보건의료 빅데이터 ‘세계최고’

문제는 ‘정책과 사회적 합의’

언론사

입력 : 2018.12.06 12:12

4차산업혁명 빅데이터시대, 한국의료계가 움직인다. <사진: 포토 애플=메디포토>

[헬스코리아뉴스 / 임효준 기자] 4차 산업혁명은 대한민국에 절체절명의 기회다. 그리고 가장 앞 선에 의료계가 있다는 것이 우리에게 던져진 숙제다. 빅데이터 시대의 시간대는 과거 라이프스타일 시간대와 완전히 다르다. 수많은 데이터의 엄청난 힘이 몰려오고 있다.

4차 산업혁명 빅데이터 시대의 길은 정해져있다. 처음 빅데이터 시대에서 DL(알파고), AI(인공지능)시대로 넘어가 커넥딧 헬스케어 (Connected Healthcare System) 단계로 간다.

구글의 알파고와 AI, 세계 제약회사에 우리가 한참 늦었지만 전 국민을 대상으로 가진 보건의료데이터의 활용에 따라 바이오헬스케어에서 단번에 앞설 수 있고 선도할 수 있다.

지난 2016년 프랑스에서 ‘올메사르탄’ 성분의 처방을 받은 프랑스인들이 장 질환이 유발돼 진료급여정지가 되며 전 세계적으로 논란이 된 적이 있다. 국내에서도 이 성분의 급여 제한여부로 시끄러웠을 때 단 8분 만에 해결된 사례가 있다. 아주대 박래용 교수가 보험공단의 보건의료 빅데이터를 활용해 우리나라 사람 체질에는 장 질환이 발생되지 않는다는 것을 밝힌 것.

보건의료 빅데이터 기술의 경우 경제적 가치가 미국은 연간 3000억 달러(맥킨지 앤 컴퍼니), 우리나라는 최소 8690억 원에서 최대 2조650억(한국보건사회연구원)으로 추정되고 있다.

우리나라는 전국에 각기 다른 3만 3000여 개의 의료기관을 통해 임상진료에서 생성된 방대하고 복잡한 데이터들이 일부 혹은 가공 처리돼 건강보험, 심사평가원, 질병관리본부, 국립암센터 등에 법적 근거에 따라 수집되어 있다.

정부는 이러한 공공데이터를 가지고 보건의료 빅데이터 R&D 지원사업 및 헬스케어 빅데이터 쇼케이스 구축 등에 활용하고 있다. 어려운 국내 경제 상황을 반전시킬 미래 먹거리 아이템인 빅데이터 활용도에 따라 보건산업 일반부터 바이오산업에 이르기까지 그 영향력은 막대하다.

보건 의료와 의료정보정책

반면, 공공 데이터를 활용하기 위해서는 넘어야한 산들도 많다. 개인정보보호 법령과 보건의료 관련 법령 준수가 있어야만 한다. 일부 법령에서 한정적인 목적으로 보건의료 빅데이터를 이용할 수 있는데 연구목적으로 기관 간 개인정보 통합(보건의료기술진흥법)이나 심뇌혈관질환의 원인 규명을 위한 코호트 조사(심뇌혈관법) 등이 있다.

핵심은 ‘국민 개인의 건강데이터를 가지고 얼마나 공공의 이익을 위해 활용하느냐’이다. 정보소유주체인 본인 당사자가 건강데이터에 대한 접근, 관리 및 통제권한부여 및 건강데이터의 2차 활용에 대한 투명한 공개와 거부권 부여 등이 제도화되면서 동시에 ‘공공의 이익을 위한 빅데이터 활용’이 균형을 이뤄야만 한다. 그래야 비로소 보건의료 빅데이터 활용에 대한 환자와 시민의 안정적인 신뢰구축이 가능하다.

아울러 개인정보는 연구 등 수집목적 외에도 이용하기 위한 효과적인 기술로 비식별화가 제시되고 있는데 미국은 국가생명건강통계위원회가 비식별화 관련 12개 권고사항을 발표하고 공공 및 민간부문의 컴퓨터과학, 법률, 데이터분석, 개인정보보호 등 전문가가 참여해 도출한 비식별화의 지침·연구·교육 및 정책 분야에 대해 실질적으로 권고하고 있다.

EU는 2018년 5월 시행된 개인정보보호규정에서 명확하게 가명처리를 규정 하는 등 비식별조치 법제를 갖추고 있어 우리나라 정책에도 참고할 필요가 있다.

지난달 30일 한국보건의료연구원(원장 이영성)이 주관한 ‘제2차 의료정보정책 공개포럼’이 있었다.

포럼을 준비했던 한국보건의료 연구원 미래보건의료 정책연구단 주예일 씨는 “빅데이터 활용을 위한 의료정보정책에서 이해관계자들의 합의가 가장 중요하다”며 “단순히 의사들의 진료 편의가 아니라 국민 개개인의 건강을 치료하고 더 나아가 예방할 수 있다”고 밝혔다.

주 씨는 포르투갈 보거누 산하 ‘의료정보 공유사업 위원회’ 위원장 엔리케 마틴스 교수가 말한 “(빅데이터 활용을 위해선) 정책 결정자의 의지가 중요하다”고 재차 강조했다.

의료정보정책 자문위원회 위원장 겸 서울대학교 김영기 명예교수는 ‘의료정보정책과 디지털 헬스케어를 위한 거버넌스 제언’이라는 기조발표에서 “데이터를 산업발전에 이용하게 되거나, 과학기술 발전에 활용할 경우 범부처 사업이 돼 관리주체의 구분이 애매모호하다”고 지적했다.

김 교수는 “진료 데이터에 대한 사회적 인식과 합의에 있어 법적 근거가 불확실하다”며 “이를 관리할 수 있는 공공적 거버넌스가 필요하다”고 밝혔다.

건양대학교 김종엽 교수는 “의료기관 간 진료정보교류에서 벗어나 개인이 하나의 객체로 데이터를 주고받기 위해서는 보다 폭넓은 데이터 표준화가 필요하다”면서 “개인정보 보호에 대한 이슈도 해결해야할 문제”라고 말했다.

성균관대학교 삼성융합의과학원 이병기 교수는 “대한민국은 세계적으로 우수한 ICT 기술과 의료 서비스 및 기술을 보유하고 있다”면서도 “의료정보 분야에서 선진국에 비해 정보 표준화가 뒤쳐져 데이터 활용률이 매우 저조한 편”이라고 비판했다.

이 교수는 “표준전문가의 육성에 투자가 이뤄져야한다”며 “세계적 표준화 추세를 거스르고 우리만의 표준 체계를 수집하는 경향이 있어 시급히 개선되어야 할 점”이라고 지적했다.

공통데이터모델(CDM)

개인정보를 보호하면서 동시에 보건의료 빅데이터를 분석하는 방법으로 공통데이터모델(CDM;Common Data Model)도 하나의 대안으로 제시되고 있다.

CDM은 의료 데이터 표준 기술로 원 데이터를 제공하는 게 아니라 익명화해 연구자나 기업에 필요한 통계 데이터만 공유한다.

아주대학교 의과대학 의료정보학과 박래웅 교수는 지난달 5일 건강보험심사평가원이 주최한 ‘보건의료빅데이터 미래포럼’에서 오몹(OMOP) CDM과 관련해 “최근까지 19개국 15억 명의 데이터가 CDM으로 변환됐다”며 “개인 식별정보가 없어 가장 강력한 개인정보보호 시스템”이라고 말했다.

박 교수는 오몹 CDM가 정형 데이터에 국한돼 분석 가능하고 데이터 표준화와 관련한 정보 누락의 비판에 대해서도 “최근 정형데이터에서 비정형데이터로 모델을 확장하고 있다”며 “국가 차원에서 보건의료 데이터 분석 기반 틀로 채택하는 나라가 늘고 있다"고 지적했다.

과학기술정보통신부는 국가전략프로젝트로 282억 원을 투입하는 ‘정밀의료병원정보시스템(P-HIS)에 CDM을 적용한다. 클라우드 기반 전자의무기록(EMR)에 CDM 기능을 넣어 표준화를 구현할 계획이다.

3년간 357억 원을 투입해 개발하는 인공지능(AI)의 의료시스템 ‘닥터 앤서’에도 CDM 적용을 검토하고 있다.

산업부도 지난 5월 분산형 바이오헬스 빅데이터 사업단을 출범해 2020년까지 39개 병원 5000만 명 의료데이터를 CDM으로 전환키로 했다.

복지부도 범부처 차원에서 CDM 프로젝트를 추진하지만 시각차가 있다.

복지부 박정환 사무관은 “국민건강 증진이라는 차원에서 공익적 연구에 초점을 맞추고 부족한 연구자들을 늘리고 관련 연구 과제를 넓히고 있다”며 “CDM도 의료 데이터를 보호하고 활용하는 방법 중 하나”라고 설명했다.

박 사무관은 “의료데이터기술 중에는 CDM 말고도 개별적인 정보는 열지 못하게 보호하면서도 분석내용을 연구자에게 제공되는 ‘프라이버시 보존컴퓨팅’도 있다”며 “연산속도가 느려 기술발전에 시간이 좀 걸리지만 또 다른 의료데이터기술이며 (복지부는) 포트폴리오 투자 차원에서 다양하게 연구와 지원을 하고 있다”고 강조했다.

그는 “가장 중요한 것이 사람이다. 공공데이터 개선과 활용을 위한 인프라 구축에 집중하고 있다”고 말했다.

또 복지부는 지난 7월 13일, 보건복지부 차관을 위원장으로 하고 의료계·학계·연구계·법·윤리·개인정보보호 전문가, 환자단체 및 시민사회단체 위원, 보건의료 분야 공공기관 위원 등 총 18명으로 구성된 ‘보건의료빅데이터정책심의위원회’를 발족했다.

복지부는 위원회 활동과 함께 지난해 12월부터 시민사회 정보공개정책을 추진해 홈페이지를 통한 열린 논의도 활발하게 전개해 지난 11월 30일 ‘보건의료빅데이터시범사업’ 계획을 확정했다.

복지부 관계자는 “최초로 시도해서 합의점을 찾아 설계도를 완성한 만큼, 열린 논의를 통해 (시범사업에서) 방향성과 운영 척도 등의 내용도 공유하고 법제개선에도 힘쓸 것“이라고 밝혔다.

빅데이터 활용, 성공모델 코아제타

정부가 심평원에 있는 공공데이터를 개방함으로써 생긴 4차산업 비즈니즈 성공 모델이 바로 ‘코아제타’이다. 빅데이터의 가치는 결국 의사결정에서 중요한 판단 근거라며 ‘근거·데이터 중심의 경영, 데이터 리더쉽’을 표방한 기업이다.

2012년도에 창업해서 손익분기점을 넘기고 해마다 30%씩 성장해 40개 이상 국내외 제약회사를 고객으로 바이오헬스케어분야에서 수익을 내고 있다.

는 제약 연구원 출신 약학박사로 20년 넘게 연구를 해오면서 빅데이터를 가공해서 사용가능한 컨덴츠로 바꾸는 독자적인 기술로 승부했다.

이 대표는 “데이터를 바라볼 때 전문가의 통찰력이 중요하다”며 “어떤 사람에게는 엄청나게 중요한 데이터가 한낱 쓰레기로 보이기 때문”이라고 말했다.

우리 정부가 의료보험 제도를 통해 전 국민의 건강상태를 정형화해 데이터베이스 한 것은 마치 4차 산업혁명을 준비한 것처럼 잘한 것이지만 이제부터가 문제다.

1년에 10~15억 만 기가바이트가 생성되는데 복사하는 데만 한 달이 걸리고 대표적으로 보건의료 데이터가 쌓이는 국민건강보험공단과 건강보험심사평가원의 시각차도 크다.

건강보험공단에 보내진 데이터 중에는 국민이 보험적용대상을 구분하는 자격정보 등이 포함되어 개인정보 문제가 불거진다.

그래서 의사 처방만 있는 심평원에서 개인정보를 삭제하고 표본데이터 145만 명의 표본을 활용하고 있는 것이 코아제타의 현 수준이다.

이 대표는 “아직도 우리나라는 제약회사분야에 제대로 된 AI가 없다”며 “다른 나라에서는 법을 풀어서 바이오헬스까지 발전하고 있는 것에 비하면 너무 안타깝다”고 말했다.

빅데이터 단계에서 알파고와 AI 단계로 가기 위해서는 IN PUT 데이터가 주어져서 OUT PUT 데이터 결과가 이어져 수많은 데이터가 예측될 수 있어야만 한다.

그래야 경우의 수를 따지면서 알파고와 AI 단계에 접어들고 이것이 바로 바이오 헬스케어 단계로 가는 것이다.

핵심은 ‘약 처방에 대한 환자의 상태’가 같이 움직여야하는 것.

그는 “제약회사에서는 인풋 데이터인 처방데이터만 있고 아웃 풋 데이터인 환자의 상태 데이터가 없고 우리나라에서는 처방데이터는 심평원에 있고 환자의 상태데이터는 병원에 있어 따로 놀고 있다”고 했다.

결국 인공지능으로 발달할 수 없고 결국 바이오 헬스케어단계로 넘어갈 수 없다.

그는 해외 국가의 네가티브 시스템을 부러워한다.

“우리나라는 포지티브 시스템을 하다 보니 정해준 법대로 사업을 해야만 하니 창의성도 없고 속도도 더디다”면서 “이것 말고는 뭐해도 좋다는 해외 네가티브 시스템으로 바꿔야만 지식정보산업에서 4차 산업혁명을 주도할 수 있다.”

그는 정부가 심평원을 통해 과감하게 공공데이터를 개방·확대하는 한편, 새로운 법이 아닌 기존법의 확대해석만 하지 않아도 한층 국내 빅데이터 산업이 발전 할 것이라고 말했다.

그는 “과거의 없었던 비즈니스와 시스템을 과거의 기준으로 재단하려고 하니 향상 문제가 된다”며 “시각을 탈피하고 전향적으로 바뀔 때 글로벌시대에 경쟁우위를 확보하게 된다”고 강조했다.

이어 “의료데이터의 표준으로 CDM을 거쳐 마이데이터 시대로 가서 주도권이 개인에게 주어지면 더욱 바람직 할 것”이라고 말했다.


헬스코리아뉴스 임효준 기자 admin@hkn24.com

  • * Copyright ⓒ 헬스코리아뉴스 All Rights Reserved.
  • * 본 기사의 내용은 헬스조선의 편집방향과 일치하지 않을 수도 있습니다.
     
    인기뉴스 의료계뉴스 최신뉴스
     
     
    의료행사전체보기+
    의료 건강 전문가를 위한 의료 건강 뉴스레터 신청