방대한 공공의료 데이터도 "꿰어야 보배"…다양한 활용 모색
방대한 공공의료 데이터도 "꿰어야 보배"…다양한 활용 모색
  • 오지혜 기자
  • 승인 2021.07.16 13:15
  • 댓글 0
이 기사를 공유합니다

보건산업진흥원 브리프, 건보공단 심평원에만 6조4000억건…빅데이터 사업 아직은 '진행형'

공공의료 데이터가 쌓이고 데이터 3법도 통과되면서 공공기관 내의 다양한 의료 정보 빅 데이터를 활용하는 새로운 서비스 활용방안이 모색되면서 국민 건강에 크게 이바지할 것으로 전망했다.

한국보건산업진흥원은 ‘대한민국 공공의료정보시스템과 공공헬스케어 빅 데이터의 현황과 미래’(저자, 한양대학교 간호학부 박정민 교수) 브리프를 14일 공개했다.

공공기관 의료정보 빅 데이터는 ▲국민건강보험공단 ▲건강보험심사평가원 ▲국립암센터 ▲질병관리청 전 국민 영양조사 ▲근로복지공단 산재보험 및 고용보험 ▲한국의약품안전관리원 의약품 이상 사례 보고시스템 등이 산재해 있다. 가장 중요한 이슈는 이 자료들을 통합하여 질병 예방 및 치료 트렌드를 파악하여 국민 건강을 증진시키는 것이다.

일단 기반 자료는 넘친다.

전 국민 건강보험이 시행된 1989년도부터 보험 청구를 위해 청구 데이터 형태로 방대한 임상데이터가 저장되어 있다. 또 최근에는 4대 공공의료 빅 데이터를 통합하여 보건의료 빅 데이터 연계 플랫폼을 제공하고 있다. 이는 공공의료 정보시스템의 데이터 측면에서 매우 고무적인 일이며 상호보완적인 빅 데이터를 연계해서 의료 질 향상 및 보건의료 정책의 개선에 크게 이바지 할 수 있을 것으로 기대된다. 건강보험공단과 심사평가원에 따르면 두 기관이 보유한 의료 빅 데이터는 각각 3조4000억건과 3조건으로 약 6조4000억건에 이르는 데이터를 확보하고 있다.

현재 보건의료 빅 데이터 플랫폼은 2015년 정책연구를 기반으로 2018년 7월 시범사업 단계로 시행되고 있다. 이는 기존에 의료 빅 데이터의 한계점이라고 제시되었던 빅 데이터 간 통합, 개인정보 보호 등의 문제를 다소 해결한 플랫폼으로 각기 다른 건강정보 데이터가 하나로 합쳐진 빅 데이터 플랫폼을 제시함으로써 기존에 보건의료 빅 데이터 간 단절된 부분을 연계하여 빅 데이터에 입각한 건강증진이라는 측면에서 고무적일 수 있다.

보건의료 빅 데이터 플랫폼은 4대 공공데이터(질병관리청 국민건강영양조사, 국민건강보험공단, 건강보험심사평가원, 국립암센터)를 통합하고 데이터 기반 질병 예측과 정책 수립을 통해 국민의 건강증진에 이바지 하고자 제공된 플랫폼으로 연구자는 폐쇄망 분석센터를 통하여 데이터를 분석할 수 있다.

한편 국가방역체계 강화를 위해 시작된 방역연계 범부처 감염병 연구개발 사업은 2018~2022년 동안 진행되는 연구 사업으로 400억원이 투입될 예정이다. 이 연구는 한국형 통합 감시 체계 구축 등으로 감염병 사전대비 고도화 연구, 현장대응 신속성 및 방역현장 업무 효율 및 안전성 강화 연구, 현장 대응 신속성 및 방역 현장 업무 효율 및 안전성 강화 연구 및 보건의료 빅 데이터 관련 방역 연구를 수행함으로써 국가방역체계와 연계된 국가 감염병 R&D 강화 제시하여 국민의 감염병 예방 및 관리에 목적이 있다.

국민건강보험공단=대한민국의 약 2%에 해당하는 100만명 표본 데이터로서 2002년~2015년까지의 데이터를 공공의료 데이터로 개방하고 있다. 데이터에는 건강검진 정보, 약품 처방내역, 진료내역을 공공데이터 포털과 국민건강보험자료 공유서비스를 통해 개방해서 제공하고 있다.

현재는 표본 코호트 2.0으로 제공되고 있고 자격 및 보험료, 출생 및 사망률, 진료, 건강검진, 요양기관 자료 등 표 형식으로 19개 분야 데이터가 제공되고 있다.

건강보험심사평가원=건강보험심사평가원과 국민건강보험공단이 보유하고 있는 데이터 구성은 매우 유사하다. 하지만 건강보험공단 데이터는 코호트 연속형 데이터로 연속형 연구에 적합하나 건강보험심사평가원의 경우는 표본 데이터로서 종단데이터(longitudinal data)가 아니므로 질병의 유병률 등과 같은 단면 연구에 보다 적절하다. 또 국민건강보험공단 데이터는 100만명, 건강보험심사평가원 데이터는 150만 명을 기준으로 설정하고 있다.

국민건강보험공단 데이터와의 차이점은 건강보험심사평가원의 자료는 검진자료가 불포함 되어 있지만 비급여 항목에 관련된 일부 데이터, 의약품 안심 서비스(DUR) 정보, 의약품 유통관리 정보, 진료 적정성 평가 등에 관련된 데이터가 일부 포함되어 있다. 비슷하면서도 다른 두 기관은 모두 맞춤형 데이터 신청이 가능해 이 경우에는 전수 데이터 분석이 가능하다.

국립 암 센터=2002년부터 국립암센터 암 예방검진센터(개인 검진 및 공단검진)을 방문하는 수검자를 대상으로 코호트 자료다. 이 자료에는 암 검진자 코호트 검사, 암 과거력, 가족력, 종양표지자, 검진 결과 등의 데이터가 포함된 방대한 코호트 데이터로 암 환자의 추적관찰을 통해 암 발생 및 사망 정보를 수집할 수 있고 이를 이용하여 암 위험요인 및 예방정책에 유용하게 활용될 수 있다.

또 암 진료 및 임상 데이터, 연구데이터, 기관연계 데이터, 암 발생 및 사망 데이터, 국가 암 관리사업 데이터, 국가 공공 데이터를 국가 암 데이터센터를 통하여 데이터를 재생산 하고 가치 창출을 할 수 있는 플랫폼 체제로 암 빅 데이터센터가 개설되어 있다.

질병관리청=국민건강영양조사는 1995년에 전국적으로 시행되는 건강 및 영양조사로서 현재는 매년 192개 지역의 25가구를 확률표본으로 선정하여 조사하여 국민 건강 및 영양 상태에 관한 현황 및 추이를 파악하는 조사다. 국민건강영양조사의 특징으로는 생애주기별 특성(소아, 청소년, 성인)에 따라 조사가 가능하여 연령에 따른 데이터 분석이 가능하다는 점이 장점이다. 국민건강영양조사는 웹사이트에서 무료이용이 가능하며 자료의 양이 많지 않아 SPSS 등의 통계 프로그램도 이용이 가능하나 매년 표본을 추출하게 되므로 단면연구만 가능하여 추적 관찰연구 등이 불가능하다.

질병의 진단 코드, 영상정보 및 약제 처방 코드 등의 데이터가 없어 제한점도 있다.

근로복지공단=보험ㆍ복지ㆍ의료 등 1500억건 이상의 데이터를 활용하여 2021년 노동복지 빅 데이터 센터를 설립할 예정이다. 공단에 속해 있는 기관별 데이터를 연계하여 ‘노동복지 빅 데이터망’ 구축하여 보험, 복지, 의료 등을 연결하여 활용할 예정이다. 한 예로 2020년 2월 산재보험과 고용보험의 빅 데이터를 활용하여 ‘지능형 재활 지원시스템’을 도입하였다. 지능형 재활 지원시스템은 산재 노동자의 나이, 상병명, 상병부위, 장해정도, 직종, 고용형태, 임금 등을 분석해서 매년 11만여명의 산재 노동자에게 맞춤형 재활 서비스 및 치료종결을 제공하여 68.5%였던 작년의 산재 노동자 직업 복귀율을 70%대로 증가하는 데 역할을 기여했다.

한국의약품안전관리원=의약품 이상 사례 보고시스템을 활용하여 약물 이상 반응 등을 포함하여 이상 사례가 발생하였을 때 WHO-ART(World Health Organization Adverse Reaction Terminology)를 사용하여 체계적으로 구축한 데이터베이스 기반 시스템이다. 이는 제조, 수입업체에서 제공되는 이상 사례 외에 약품을 실제적으로 투약한 병ㆍ의원의 이상 사례를 포함하고 있어 의약품의 안전성 정보 수집·관리 및 모니터링과 같은 의약품 안전관리가 가능하다.

이 데이터는 KAERS를 통해 필수 정보 4가지(의심되는 증상, 복용한 의약품 정보, 환자 정보, 보고자 정보)를 포함하여 수집된 자료로 연 1회 업데이트 되며 무료 활용이 가능하다. 또 KAERS 데이터는 국제 약물 감시 프로그램과 호환되고, 세계보건기구-약물 부작용 모니터링센터(웁살라 모니터링센터)로 데이터가 보내진다.

한편, 브리프에 따르면 전 세계 건강 데이터와 관련된 시장은 약 146억 달러(약 15조원)이며 연평균 21.26% 성장률을 보이는 거대 시장으로 커지고 있다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.