열려있는 정책플랫폼 |
국가미래연구원은 폭 넓은 주제를 깊은 통찰력으로 다룹니다

※ 여기에 실린 글은 필자 개인의 의견이며 국가미래연구원(IFS)의 공식입장과는 차이가 있을 수 있습니다.

오태광의 바이오 산책 <85> 바이오의학/의료 산업의 AI 활용 본문듣기

작성시간

  • 기사입력 2024년09월24일 16시35분
  • 최종수정 2024년09월02일 11시39분

작성자

  • 오태광
  • 국가미래연구원 연구위원,주)피코엔텍 상임고문,전 한국생명공학연구원장

메타정보

  • 1

본문

 바이오산업은 크게 3가지로 분류하고 있는데, 의학/의료 산업은 Red Biotechnology, 농식품, 축산산업은 Green Biotechnology, 산업, 에너지 및 환경 바이오를 White Biotechnology로 구분하고 있다. 최근에는 향장품 산업인 Pink Biotechnology를 따로 구분하여 4가지로 구분하기도 한다. 

 

의학/의료 산업을 헬스케어(Healthcare) 산업으로 표시하여 진단/예방/치료 이외에 건강관리로 식이. 운동, 생활 습관, 수면 등 인간의 생리현상에 관련된 모든 분야를 의학/의료 바이오산업(Red Biotechnology)이라 한다. 의학/의료 바이오 분야는 유전체 해독에서 시작으로 만들어진 유전체 데이터베이스(Data Base), 유전체를 기반으로 한 단백체, 대사체와 이들 기술 간의 연결된 연결체(Connectome)는 막대한 빅 데이터를 만들어 수많은 생명현상을 확인 및 예측하고 대응하는 방안이 인공지능으로 마련되어 가고 있다. 이를 근거로 유전자를 천을 재단할 때, 가위로 잘라서 없애고 바꾸고 붙이는 유전자 편집기술, 다른 생명체 유전체 간의 조합에서 발견되는 새로운 기능을 확인하는 Microbiome 기술을 비롯하여 미분화한 세포와 진화된 세포의 기능을 파악할 수 있는 줄기세포 기술 등의 최첨단 기술도 인공지능기술도 급속한 진화를 하고 있다.

 

복잡다단한 생체현상과 의학/의료 산업에서 발생하는 수많은 데이터를 분석하고, 각 데이터 간의 연관성을 효율적 해석을 하는 작업은 인간의 두뇌로 해결하기는 거의 불가능한 작업을 인공지능기술을 활용하여 최첨단 바이오 자료로 발전시켜서 많은 결과를 만들고 있다. 하지만, 현재까지의 기존 의학/의료자원을 컴퓨터의 정보로 사용하기 적합한 자원으로 정형화하는 데 큰 노력이 필요하다. 이런 이유로 비교적 단순한 분석이나 인간의 오감으로 판단하기에 실수가 많은 분야에 대해서 우선 적으로 인공지능을 활용해 왔다. 인간지능을 이용하여 유전체, 단백체, 대사체 및 연결체에 대한 봇물이 터지듯 쏟아지는 데이터들을 획기적 처리하는 인공지능이 속속 등장하고 있어서 우리를 놀라게 하고 있고, 심지어는 인간의 능력을 뛰어넘는 특이점이나 오히려, 인간이 차지하고 있는 일자리를 걱정하고 있다. 바이오의학/의료 분야의 현재 인공지능의 사용과 앞으로의 전망분석은 현재뿐만 미래의 우리를 재조명할 수 있을 것으로 생각한다.

 

<의학/의료 바이오 기술의 인공지능 이용>


의학 및 의료용 헬스케어 분야의 인공지능 활용은 획기적으로 확장되고 있어 <그림 1.>에 보는 바와 같이 바이오 헬스 기업, 헬스케어-IT기업, 의료 진단기관 및 제약 회사가 병원을 중심으로 생태계를 구축하고 있다. 바이오기업은 헬스케어 IT 기업들이 분석할 수 있는 과학적, 임상적 연구 자료를 제공할 수 있고 한편, 분석 결과를 활용하여 개인 맞춤형 의료기술을 개발하는 역할을 한다. 또한, 헬스케어-IT 기업은 바이오 데이터를 분석하여 환자와 의료진에게 첨단치료 기술을 제공하고, 환자의 질환 관리를 위한 사용정보를 제공할 수 있다. 인공지능으로 분석한 결과는 진단기관 및 병원에 효율적이면서도 정확한 질병에 대한 정보를 제공하여 치료효율을 높일 수 있다. 제약사는 진단 및 임상 치료 데이터를 손쉽게 분석하여 해결책을 만들 수 있어서 기존에 비해 저렴하게 신약 개발을 가속화 할 수 있다.

 

2aa9d5b8740bedc316f7fa03d5d752a2_1725244            그림 1. 인공지능 활용 헬스케어 분야 혁신생태계 

                    (출처; Frost & Sullivan(2017), 한국바이오 경제연구센터 재구성)

 

 이렇게 다양한 헬스케어 기관들이 인공지능을 활용하고 있는데, 진단기관들은 앞선 주요 사용자가 되어서 주로, 심층 학습(Deep Learning)과 패턴인식을 이용하여 진단 시간을 단축하게 할 수 있을 뿐만 아니라, 의료효율을 빠른 속도로 높일 수 있는데, 특히, 암 진단 분야에서 인공지능을 사용하는 빈도가 빠르게 증가하고 있다. 미국의 Mayo Clinic과 같은 병원들도 앞선 인공지능을 사용하여 조기진단과 환자 맞춤형 치료계획을 제공하는 인지 컴퓨팅(Cognitive computing)을 활용하고 있다. 신약 개발을 위한 임상시험 과정과 평가 절차를 인공지능을 활용하여 만들어서 사용하는 시간을 효율적으로 단축할 수 있다. 

 

Gauss Surgical 같은 바이오기업은 심층 학습, 패턴인식 등의 인공지능기반 솔루션을 사용하고 있고, Pfizer, Novartis, Merck와 같은 다국적 기업도 고급 인공지능 기술들을 활용하여 신약 개발 시간을 단축하고자 많은 글로벌 임상시험과 안전성 평가를 인공지능을 활용하여 진행하고 있다. 하지만, 성공적인 인공지능 사용을 위해서는 대용량 의료 및 건강기록을 처리하는 데이터마이닝(Data mining)을 통해 정형화한 데이터를 만드는 필수적 과정이 필요하다. 

 

또한, 효율적이고 근거 있는 치료 결정을 향상하는 분야에 인공지능을 사용하고 있다. 실제로 인공지능을 사용할 시, 현재 헬스케어 비용은 50% 절감할 수 있었고, 환자치료에 인공지능 적용하면, 50% 이상의 개선 효과(Bio Economy Report Issue 10(2018), 인공지능 트렌드와 헬스케어분야 활용현황)가 있다고 한다. 하지만, 아직도 여전히 많은 비구조화 데이터로 구성되어있는 의료진 수기(手記)기록, 영상 및 방사선 기록 등이 사용되고 있어서 컴퓨터가 읽고 계산할 수 있는 정형화한 데이터로 만드는 효율적 기술이 필요하지만, 여기에는 여전히 많은 한계점이 있다.

 

<바이오 의학/의료의 인공지능 연구 경향>


 의학/의료 생명공학 분야의 인공지능 연구 경향은 크게 4가지 분야에 주력하고 있는데, 첫 번째는 약물 표적식별 인공지능은 유전체 데이터, 단백질 상호작용 데이터 등을 효율적으로 분석하여 잠재적인 질병 치료 표적을 식별할 수 있어야 하고, 진화된 기계학습(Machine Learning) 알고리즘 개발로 인간 능력으로는 분석할 수 없는 패턴과 상관관계를 식별할 수 있게 하여야 한다. 두 번째는 인공지능으로 약물 스크리닝(Dug Screening)하는 데는 질병 표적에 대한 잠재적 약물 활성을 분석하여 최적의 효과적인 약물을 탐색할 뿐만 아니라 기계학습 알고리즘을 이용하여 약물의 표적인 질병 특성으로 약물 효과를 예측할 수 있어야 한다. 세 번째 인공지능으로 심전도, CT Scanning이나 MRI 이미지 등과 같은 이미지를 분석하는 스크리닝(Imiage Screening) 기술은 의료 이미지 인공지능 분석으로 인간의 오감이나 경험으로는 구분할 수 없는 비정상적인 이상을 식별할 수 있어야 한다. 인공지능으로 의료 이미지를 분석하여 미세한 징후의 질병도 진단하고, 심층 학습(Deep Learning) 알고리즘으로 이미지 구조를 자동 분할 및 분류하여 데이터화 할 수 있어야만, 지능형 진단이 가능하게 된다. <그림 2.>참조

 

2aa9d5b8740bedc316f7fa03d5d752a2_1725244    그림 2. 컴퓨터 알고리즘을 활용한 이미지의 인공지능형 진단의 예 

            a) 코로나19 환자의 CT 이미지를 Deep Learning 기술을 활용한 예

            b) 인공지능기술을 적용 영상 이미지 분류 및 분석하여 정확한 진단과 치료

               방법 도출 (출처 팬토믹스 홈페이지)

 

네 번째는 모델링 인공지능으로 예측된 전자 건강기록, 웨어러블(Wearable)기기의 측정데이터 등 다양하게 분석된 건강 관련 데이터로 개인의 건강 상태를 예측하고, 개발된 기계학습 알고리즘으로 개인이 걸릴 확률이 높은 질병을 예측할 뿐만 아니라 특정 치료 방법을 제시하고, 치료에 따른 치료되어가는 효과를 예측할 수 있어야 한다. 

 

한편, 신약 개발 시 인공지능을 사용하면, 더 짧은 시간에 정확할 뿐만 아니라 더 저렴한 비용으로 효율적으로 신약의 개발이 가능하여 의료/의학 분야의 혁신적인 발전이 가능하게 할 것이다. 실제로 지금까지 신약 개발하여 미국 FDA에 허가받는데, 최소 약 10~15년이 걸리고, 연구비용은 약 3억~26억 US$(약 4,000억~3조 4,600억 원) 이상 필요한데, 인공지능을 사용할 시 연구 기간은 1/2, 연구비용은 1/4까지 감소할 수 있어서 있다고 한국 약제학회(2023.9.15)에서 발표하였다. 신약을 허가를 받고 제품의 제형, 제조 공정설계에도 인공지능의 활용이 가능하여 신약 개발에 인공지능을 사용하는 기업이 2023년 현재 800개 이상으로 늘어났고, 2023년까지 신약 개발을 위해 인공지능에 투자한 비용이 2023년 3월까지 이미 600억 US$에 육박하고 있으며, 2023년 말까지는 적어도 2,410억 US$로 확대할 것으로 전망된다. 

 

신약을 찾는데 가장 먼저 개발하여야 할 사항은 질병의 병인(病因)이 되는 바이오마커의 선정이 중요하지만, 실제로 적절한 바이오마커를 선정하는 데는 여전히 어려움이 크다. 하지만, 인공지능을 사용하면 수없이 많은 데이터에서 분석하기 때문에 바이오마커 개발도 쉽게 찾을 수 있을 것으로 예측 하고 있다. 바이오마커를 근간으로 하는 방법으로 신약을 개발한다면, 해당 바이오마커에 해당한 환자에게는 쉽게 치료가 될 수 있지만 같은 질병이라도 병인이 다르면 치료가 되지 않을 가능성이 크다는 단점이 있다. 또한, 지금까지 개발된 신약들은 한 개 또는 두 개 정도의 바이오마커에 효능이 있는 신약을 탐색할 수 있어서, 실제 환자에게 치료제로 사용 시 다른 병인(바이오마커)에 의해 발병된 환자에게는 신약의 효능이 없는 속수무책인 경우가 많다. 실제, 암 치료제는 주로 바이오마커를 중심으로 신약이 개발되었기 때문에 환자에게 투여 시 개발된 바이오마커와 같은 바이오마커로 병발 된 약 25%의 환자에게만 효능이 있어서 나머지 다른 바이오마커가 병인인 75%의 환자에게는 효능을 기대하지 못하기 때문에 인공지능을 활용한 가능한 한 많은 병인(바이오마커)에도 치료가 가능한 신약 연구는 절실하다.

 

하지만, 현재까지는 주로, 저분자의 화학합성 의학 약물에 대한 신약 개발에서는 지금까지 연구 경우가 아주 많아 데이터가 풍부하여 인공지능을 활용하면 적중할 확률이 아주 높았지만, 최근 많은 관심이 커지고 있는 고분자의 단백질 신약과 같은 바이오의약품 개발에는 기개발된 바이오의약품 수가 화학합성 의약품과 비교해 너무 적어서 아직은 인공지능을 활용하는데 한계성이 크다. 즉, 지금까지 미국 FDA에서 허가를 받아 출시된 바이오의약품이 불과 2,000여 종밖에 되지 않아서 인공지능을 심층 학습(Deep Learning)시킬 데이터로는 너무 적어서 정확한 예측 결과를 얻을 수 없기 때문이다. 

 

홍콩의 미국 벤처인 인실리코 메디신(Insilico Medicine)은 자체 개발한 인공지능 모델(AI Model)인 “생성모델 기반 강화학습(Generative Tensorial Reinforcement Learning)”으로 일반적으로 4~5년 동안에 수백만 US$가 들어가던 작업을 46일 만에 15만 US$로 성공한 예가 있고, 미국 아톰 와이즈(AtomWise)사도 24시간 만에 7,000종의 기존 약물의 재창출 후보 분석하여 바이러스 병인 에볼라 치료제 후보물질 개발에 성공하였다. 특히, 영국의 베네볼런트(Benevolent)사는 기존의 류머티즘 관절염 치료제인 “바리시티닙”을 코로나19 치료 효과를 인공지능으로 예측하고 임상시험에서 검증하여 2021년 7월 미국 FDA에서 정식 승인을 받았다. 신약 개발에 사용되는 데이터가 부족한 바이오의약품 경우나 여러 가지 병인에 효과가 있는 신약들과 같은 조건을 쉽게 해결하는 새로운 인공지능 플랫폼의 개발은 앞으로 매우 중요하다고 생각한다. 

 

<바이오 의학 연구에 인공지능 협업의 예>


 한 개의 제약업체가 점점 복잡해지는 인공지능의 활용과 바이오 연구를 혼자 다 하기에는 시간과 비용이 너무 많이 들고, 전문적인 면에서도 효율성이 없어서 바이오 연구와 인공지능 플랫폼 개발 연구를 협업이나 공동연구가 필요하다. 국내, 이수앱지스(ISU Abxis)사와 팜 캐드(PharmCADD) 사의 공동 연구를 예로 소개하고자 한다. 팜 캐드 사는 인공지능 신약 개발 프로그램인 “Pharmulator”를 활용하여 약물 후보군을 찾고, 이수앱지스는 화합물을 화학 합성한 후, 효능을 입증하는 방식으로 신경 섬유종증(Neurofibromatosis) 1형 개발을 하고 있다. 팜 캐드 사에서 개발된 파뮬레이트는 물리학 기반 인공지능 신약 개발 플랫폼으로 저분자 화학물질에서 리보핵산(RNA) 백신개발, 약물전달시스템(DDS), 병원성 단백질을 아예 제거하는 프로탁(PROTACs)약물 개발 등으로 활용범위를 확장하였다. 

 

혁신적인 파뮬레이트 신약 개발 플랫폼(Platform)은 4개의 인공지능과 1개의 대량 도킹(Massve Docking(MD))으로 구성되어 있는데, 하나씩 설명하면 아래와 같다. ① 신약 개발에 중요한 바이오마커 단백질 3차 입체구조 최적화와 RNA의 구조를 예측할 수 있는 인공지능 (Protein 3D Structure Optimization/RNA Structure Prodiction) 개발한다. ②약물 창출(Drug Generation)은 40만 개의 약물로 전 훈련(Pre-train)을 거친 알고리즘으로 심층신경망 분석하여 신규약물을 디자인한다. ③독성 예측 인공지능(Toxicity Prediction)은 독성이나 여러 갈래 반응(Side reaction)이 생기는 곁가지 효과(Side effect)를 밝혀서 목표 표적에서 벗어난 결과(Off-target) 및 장기간(Long term) 독성을 예측할 수 있게 한다. ④양자 계산(Quantum Calculation) 인공지능으로 100,000개의 양자(Quantum) 화학 데이터를 만들 수 있었다. ⑤2시간 동안에 10,000개 정도의 물질을 바이오마커 대량 도킹(Massive Docking)할 수 있는 개발된 인공지능으로 표적 적중 물질(Hit compound) 탐색 가능하였고, 가상 스크리닝과 분자동역학 시뮬레이션(Virtual Screening and MD Simulation)을 할 수 있었다. 

 

즉, 파뮬레이트는 4개의 인공지능과 대량 도킹 시스템으로 구성되어 빠르고, 정확하고 효율성이 높은 인공지능 근거 인실리코 신약 개발 플랫폼(AI based In silico Drug Discovery Platform)을 개발하였다. 그림 2.에 보는 바와 같이 이수앱지스와 팜 캐드 사에서 개발된 인공지능을 이용하여 개발된 신종 코로나19 감염증 mRNA 백신은 이미 임상 3상을 앞두고 있고, 항암제, 항응고제, 자폐스펙트럼장애 치료제 등에 신약을 개발하는 파이프라인을 구축하고 있다.

2aa9d5b8740bedc316f7fa03d5d752a2_1725244그림 3. 팜 캐드에서 개발한 물리학 기반 인공지능 시약 개발 플랫폼

               (출처 ; 이수캐스트(이수그룹 공식 블로그), 2022.10.5., 팜 캐드 홈페이지)

 

<맺 는 말>


 인간 삶에 직간접적 연관이 있는 의학/의료 산업인 의학/의료 산업(Red Biotechnology) 기술은 인간이 구성하는 DNA/RNA뿐만 아니라 유전자에서 생산되는 복잡다단한 수를 세기조차 어려운 수많은 고분자와 저분자 물질들의 연관 관계를 인간이 오감을 통한 뇌 기능으로 분석하고 결론을 내리는 데는 거의 불가능하였다. 하지만, 고도로 개발된 컴퓨터의 계산능력과 엄청난 기억 능력을 이용한 인공지능을 활용하면 빠르고 정확한 솔루션을 얻을 수 있어서 현재 기술로도 이미, 불과 10~20년 전에는 상상도 할 수 없었던 엄청난 좋은 결과를 얻고 있다. 인공지능이 아직은 완벽하지 않을 수도 있지만, 현재도 무한한 속도로 계속 스스로 진화할 수도 있어서, 인간 능력을 뛰어넘는 특이점에 대한 인간의 두려움이 크다. 

 

단지, 해독된 인간유전체를 기반으로 단백체(Proteomes), 대사체(Metabolomes) 간의 연결체(Connectome) 등의 다양한 오믹스(OMICS) 기술은 각각의 결과도 이미 엄청난 양의 빅 데이터(Big Data)이지만, 이들 간의 2~3개 이상의 수 없이 많은 연결체를 만들기 시작하면 상상할 수 없는 빅 데이터의 홍수를 만들 수도 있을 것이다. 의학/의료의 빅 데이터를 인공지능의 기계학습 알고리즘(Algorithms)으로 분석하면 수많은 질병의 근본적인 기전을 이해할 수 있어서 치료뿐만 아니라 잠재적인 치료 표적과 병인(病因)을 알 수 있어서 질병을 미리 예방할 수도 있어서 결국 인간의 수명은 최근 획기적으로 늘어나고 있다.

 

결국, 의학/의료 분야에는 획기적이고 비교적 간편한 신약 개발과 개인 맞춤형 의학/의료로 정밀의료(Precision medicine)달성으로 정확한 진단 및 적절한 질병 치료/예측이 가능하다. 연결체가 인간 내에서만 가능한 것이 아니고, 인간과 다른 동식물, 미생물, 바이러스 등과 다양한 연결체의 데이터가 만들어질 수도 있다는 점이 새로운 미래 가치를 창출할 수도 있지만, 우려한 특이점에 대한 대책 없이 도달한다면 재앙이 될 수 있다는 점을 간과해서는 안 된다.​ 

<ifsPOST>

1
  • 기사입력 2024년09월24일 16시35분
  • 최종수정 2024년09월02일 11시39분

댓글목록

등록된 댓글이 없습니다.