열려있는 정책플랫폼 |
국가미래연구원은 폭 넓은 주제를 깊은 통찰력으로 다룹니다

※ 여기에 실린 글은 필자 개인의 의견이며 국가미래연구원(IFS)의 공식입장과는 차이가 있을 수 있습니다.

오태광의 바이오 산책 <84> 미래융합기술의 요체, 인공지능-바이오 기술 (AI-Biotechnology as Key technology for Future Convergences) 본문듣기

작성시간

  • 기사입력 2024년09월10일 16시32분
  • 최종수정 2024년09월02일 11시24분

작성자

  • 오태광
  • 국가미래연구원 연구위원,주)피코엔텍 상임고문,전 한국생명공학연구원장

메타정보

  • 2

본문

미래 국가경쟁력에 꼭 필요한 중요한 기술로 인공지능과 첨단바이오가 1, 2위로 꼽히고 있다. 과학기술 정책연구원(STEPI)이 일반인 800명과 과학기술정책 전문가 200명 등 모두 1,000명을 대상으로 한국의 혁신정책에 대한 인식 조사(2019~2022)를 실시, 그 결과를 발표(2023)하였는데 핵심 내용은 다음과 같다.

 우선 전략적으로 경쟁력이 확보되어야 하는 기술 분야가 일반인은 첨단바이오(25.4%), 인공지능(24.9%), 우주ᐧ항공ᐧ해양(20.4%) 순으로 나타났고, 전문가는 인공지능(34.5%), 첨단바이오(25.5%), 첨단로봇ᐧ재료(11.0%), 우주ᐧ항공ᐧ해양(10.5%) 순으로 조사(과학기술정책 Brief(2023.01.25.))되었다. 일반인이나 전문가가 모두 1, 2위는 첨단바이오와 인공지능을 택하였고, 1위 기술로는 전문가는 인공지능, 일반인은 첨단바이오 기술을 추천했지만, 모두 1, 2위를 인공지능, 첨단바이오로 선택한 것으로 인공지능과 첨단바이오 기술의 중요성을 충분히 인식할 수 있었다.

 

인공지능과 첨단바이오 기술은 이미, 기술 간 융합이 많이 진행되어서, 융합된 기술을 구분하기 어렵다. 특히, 첨단바이오에서 쏟아지는 수많은 데이터를 기반으로 인공지능의 빠른 검색과 연관관계 설정은 새롭거나 융합된 분야를 더 정교하고 효과적으로 매우 빠른 속도로 만들 수 있다. 첨단바이오 기술의 가장 근본적인 문제점인 수많은 데이터 내용과 복잡한 바이오 자료 간의 연관분석이 어려운 한계점을 인공지능을 활용함으로써 아주 짧은 시간에 해결할 수 있게 하였다. 데이터 분석이 진행되는 동안도 순간 순간 훨씬 많은 데이터 축적되고 있어서, 인간의 힘으로는 분석이 어렵지만, 인공지능은 더 많은 각도에서 데이터를 더 빠른 속도로 분석할 수 있어서 이제는 사람이 알지 못하는 새로운 알고리즘(Algorithm)을 창출할 수 있을 정도로 발전하고 있다.

 

빠른 속도의 기술적 진화는 심지어 인간의 생각 영역을 뛰어넘어서 인간조차 위협을 느끼게 하는 특이점(Singularity)을 뛰어넘을 수 있다는 우려도 있지만, 실제로는 인류가 걱정하고 있는 기후변화, 감염병, 환경오염, 자원 부족 등 직면하고 있는 초거대 난제도 쉽게 풀어줄 수 있을 것으로 기대하고 있다. 또한, 인공지능을 이용한 다양한 글로벌 바이오 이슈를 해결할 수 있는 신규 솔루션(Solution)을 제시하는 첨단바이오 기술도 New Biotechnology 지(2023.2)은 Google 사의 AIY(Artificial intelligence Yourself)라는 주제로 “AI for all ages” 또는 “AI for life”란 제목으로 바이오 기술을 위한 인공지능의 발전 경향을 소개하고 있다. 

 

의학/의료분야는 약물 표적 식별, 약물 및 이미지 스크리닝, 예측 모델링을 통한 효율적 신약 개발 및 의료서비스 질(質)의 획기적 향상을 목표로 하고, 농업/임업 생명공학 분야에 식량안보, 분자육종, 농업 빅데이타, 해충 및 질병, 예측/환경 모델링, 자원 관리 등의 연구를 목표로 하고 있다. 생명 정보 분야는 지금까지 1종류의 생물 체내 유전자, 저/고분자물질 작용을 연구하는 패턴에서 다생물 간 또는 생물과 토양, 공기, 태양광 등의 환경과 상호 연관성을 분석하는 것은 물론, 생물 종류 간의 유전체, 단백체, 대사체 및 연결체를 분석하는 마이크로바이옴(Microbiome) 연구, 생물과 무생물의 연관관계인 환경 바이옴(Ecobiomes)을 분석할 수 있게 되었다. 

 

이런 초대규모의 생물간, 무생물-생물간 데이터 분석은 지금까지는 상상하기 어려운 신규분야 창출도 가능하고, 나아가서는 분석이 어려워 모호한 분야도 명확하게 해답을 얻을 수 있게 한다. 인공지능과 첨단바이오 기술의 융합은 현존하는 지구상에 존재하는 생물의 생존을 위협하는 문제점이나 더 높은 효율성 있는 방안의 제시가 가능하고, 특히, 더 빠르게 더 능률적으로 더 효율성 있는 대응책을 만들 수 있을 것이다. 시간이 지나면서 데이터의 양이 점차 증가할수록 인공지능은 획기적 분석/결정 능력이 진화하여 자체 인공지능이 스스로 알고리즘을 진화할 수 있다는데 인간 능력을 뛰어넘을 수 있다는 부정적인 우려도 있지만, 철저한 관리가 된다면 인류의 발전에 긍정적으로 사용할 수 있다고 생각하면서 긍정적인 기대를 한다. 

 

<인공지능기술로 미래 첨단바이오 솔루션을 제공 >


 현재, 바이오 기술은 인간 유전체(Genome)를 비롯한 수많은 생명체의 유전체를 저렴하게 해독할 수 있어서 관계되는 고분자인 생물 유전체(Genomics) 및 단백체(Proteomes)와 저분자인 대사체(Metabolomes)의 물질을 중심으로 같은 생물체 내에 고분자 간, 저분자 간, 고분자-저분자 간 상호연관을 연구하는 연결체(Connectome)는 물론 다른 생물간, 심지어는 생물과 무생물 간의 상호관계를 연구할 수도 있다. 최근, 지금까지는 전혀 관계가 없을 것으로 추정되는 뇌(Brain)와 창자(Gut)도 서로 연결체를 형성하여 뇌에 일어나는 질병과 장에 존재하는 미생물 군(Microbiota)이 연관되어 있다는 뇌-장 축(Brain-Gut Axis)이 연구되어서 뇌에서 발생하는 파킨슨, 알츠하이머 등과 같은 질병도 장내 미생물과 관계있다고 밝혀지고 있다. 즉, 엄청나게 방대한 데이터베이스가 각각의 분야에 연구/조업 등에 대한 데이터가 시간이 지남에 따라 폭발적으로 늘어나고 데이터 간의 연결이 되면서 지금까지 알 수 없었던 새로운 사실을 밝혀내고 있다. 

 

수없이 많은 연결체를 만들어 내는 막대한 데이터베이스는 저장부터 정제, 분석, 공유를 통해서 정보화되는데, 이제, 인간의 힘으로는 데이터의 정리조차 불가능하게 되었다. 연구로 축적된 데이터베이스를 컴퓨터 언어인 디지털화하고, 잘 개발된 ICT 기술을 접목하여 처리 속도를 가속 화할 수 있을 뿐만 아니라, 새로운 알고리즘을 개발하여 신규 요인을 추출할 수도 있다. 뿐만 아니라, 오류가 없는 정확한 양질의 결과를 얻을 수도 있게 되었다, 디지털 빅 데이터를 활용한 인공지능으로 의약품 제조는 물론 다양한 저분자 화합물과 고분자인 DNA/RNA/단백질 기능분석/생산을 통해서 생물 체내의 각종 생리활성기능을 단시간에 아주 정확하게 분석하여 적절하고 효율적인 답을 얻을 수 있다. 나아가서는 지금까지와는 다르게 데이터 간의 연결 분석을 통해서 한 가지 장기에서 일어나는 현상뿐만 아니라 장기간의 연결체 분석도 가능하여 바이오 분야의 연구에 전혀 다른 접근에 의한 해결책도 얻을 수 있게 되었다. 결국, 의료(Red), 농식품(Green), 산업바이오(White) 및 향장품(Pink)바이오를 포함하는 바이오산업 전반의 모든 기술이 인공지능이 강력한 도구로 사용되고 있고 이제 사람의 손으로 해결할 수 없는 부분에 바이오 분야의 최첨단 솔루션은 물론 미래를 향한 첨단 미래바이오 기술 개발까지도 가능하게 되었다. 


<인공지능의 개념과 알고리즘(Algorithm)>


 인공지능(Artificial Intelligence, AI)은 영리(Smart)한 방식으로 업무를 수행할 수 있는 기계라는 광범위한 개념이고, 기계학습(머신러닝, Machine Learning)은 기계가 기존의 데이터를 가지고 스스로 학습하여 진화된 결과를 얻을 수 있는 기술을 의미한다. 또한, 인공신경망(Artificial Neural Networks)은 생물체의 뇌 신경망(Brain Neural Network)의 신경전달과정에서 영감을 얻은 생체모방 기술로, <그림 1>과 아래와 같이 세포의 뉴런(Neuron)처럼 여러 개가 합쳐서 망을 이루는 것을 모방하였다. 생물 신경은 생체의 다수의 감각 기관에서 신경망이 검지하여 얻은 다수의 신경망이 중첩되어 받아들인 정보가 뉴런을 통해 뇌로 전달된다. 이후 뇌는 뉴런 정보를 종합/판단해서 다시 명령을 내리게 된다. 이처럼 인공신경망은 생물 신경처럼 여러 개의 뉴런이 연결되면서 복잡한 연산 등을 수행하게 되는데 이와 같은 두뇌의 정보 처리 과정을 모방해서 만든 알고리즘이 바로 인공신경망이다. 즉, 한 개의 입력층(Input)과 출력층(Output) 사이에 다수의 신경 시냅스(Synapse) 같은 다수의 은닉층(Hidden layer)이 있는 입력, 연합, 반응하는 다층 퍼셉트론(Muti-layer perceptron)이 있고, 여러 정보가 입력되면 정해져 있던 함수의 과정을 거쳐 새로운 값을 내놓게 되는 것이다. 

2aa9d5b8740bedc316f7fa03d5d752a2_1725243 그림 1. 생물신경과 인공신경망 

         출처 ; 용어로 알아보는 우리시대 DATA 

 

콘볼루션 신경망(Convolution Neural Networks, CNNs)은 신경세포인 뉴런이 여러 개 연결된 인공신경망 형태 기계학습의 세부 방법이다. 콘볼루션 신경망의 문제점은 서로 다른 작은 변이 들을 손쉽게 다루기는 어려워 모든 가능한 변이를 다루기 위해 대규모의 학습 데이터가 필요하다. 하지만, 심층 학습(Deep Learning)의 선구자인 Google서의 Geoffrey Hinton가 2017년 캡슐 회로망(Capsule networks, GapsNet)을 개발하여, 수행력 부족 또는 보안 공백을 보완하여 모든 변이에 대한 학습을 받지 않고 더 적은 데이터를 가지고 일반적인 패턴을 식별해낼 수 있는 우수한 결과를 얻었다. 

 

인공지능 관련 중요 기술과 적용은 <표 1>과 같고 학습 방법은 기계학습(Machine Learning, ML), 심층 학습(Deep Learning)이 주로 사용되고 있다. 새로운 생명공학 기술과 바이오 물질의 생산과정을 인공지능으로 해결하기 위해 디지털 전환(Digital transformation)을 하게 되는데, 기본적인 디지털 전환의 개념 정립은 물론이고 연구개발부터 제품생산을 하는데 효율성, 정확성, 속도 개선 등으로 완전히 새롭고 파괴적인 제품과 서비스를 제공하는 알고리즘을 개발하고 있다. 디지털 전환과정은 시간이 지남에 획기적으로 많아지는 바이오 빅 데이터를 능동적으로 계속 업로드(Upload)하면서 받아들여지는 방식으로 기술이 진화되고 있다. 특히, 자동으로 작업을 하여 획기적인 발전을 가속 화하여, 바이오 인공지능의 개발과 사용은 폭발적으로 증가하여 인공지능-바이오 기술의 융합을 통해서 독자적인 분야로 발전할 것으로 예상한다. 인공지능의 개념은 구체적으로 학습, 문제해결, 의사 결정은 인간의 지능으로 결정하는데, 지능형 인공시스템으로 인간 두뇌의 도움 없이 기계적으로 결정하고 만드는 인공적 지능(Artificial Intelligence) 체를 말한다.

 

     표 1. 인공지능 관련 기술과 헬스케어 분야의 적용

2aa9d5b8740bedc316f7fa03d5d752a2_1725243 출처 ; Frost & Sulivan(2017), 한국바이오경제연구센터                      

 

 인공지능을 구성하는 하위 집단으로 기계학습(Machine Learning, ML)이 있는데, 디지털 데이터 패턴(Pattern)과 이해(In sight)를 활용하여 특정한 명령 없이 컴퓨터 스스로가 작업하여 훈련한다. 기계학습은 데이터를 학습하며 새로운 데이터 레이블을 결정하고 패턴을 찾는다. 기계학습의 한 분야로 최첨단 인공지능 기술로 떠오르는 딥러닝은 인공신경망을 기반으로 데이터를 학습하고 데이터에 내재 된 핵심적인 패턴을 찾으며 고도의 추상화 작업을 시도한다.

 

  또한 기계학습의 하위분야인 심층 학습(Deep Learning, DL)은 컴퓨터의 많은 디지털 데이터를 이용하여 사람처럼 스스로 학습할 수 있는 능력을 컴퓨터에 부여하기 위해서 인간 뇌의 신경 전달과정을 묘사하여 인공신경망(ANN, Artificial Neural Network)을 구축하여 신경이 전달되는 것처럼 작동하여 컴퓨터가 스스로인지, 추론, 판단을 할 수 있게 한다. 심층 학습 방식은 입력층, 은닉층, 출력층으로 구성되며 입력에 입력된 데이터는 은닉층을 거치며 데이터 분류 및 패턴을 추출을 진행하며 고유한 추상표현을 생성한다. 이러한 은닉층의 수가 많아질수록 네트워크는 더 깊어지고 복잡한 패턴을 학습하고 기능한다. 은닉층의 수가 많은 경우를 심층신경망(Deep Neural Net, DNN)이라고 하고, 심층신경망을 사용한 학습을 심층 학습이라고 한다. 

 

심층 학습 모델은 데이터 학습에 매우 복잡한 계산이 필요하여 많은 시간이 소요되고 고성능 컴퓨팅 시스템이 필요했기 때문에, 인공지능 연구 초기에는 주목을 받지 못했다. 하지만 컴퓨터 하드웨어가 발전됨에 따라 막대한 데이터 저장 공간을 가진 메모리 장치와 강력한 연산 능력을 갖춘 Graphics Processing Unit (GPU) 가 등장하여 복잡한 연산에 걸리는 시간이 단축되었다. 특히 빅 데이터의 등장은 심층 학습에서 데이터를 학습하고 분석하는 데 필요한 데이터를 제공한다. 이로 인해 심층 학습은 주목을 받으며 최신 인공지능 기술로써 대부분 인공지능에 사용되며 활발히 연구되고 있다.

 

심층 학습 방식은 바이오, 화학 및 의약 분야에서 기존 컴퓨팅 시스템으로는 불가능하였던 방대한 데이터를 분석할 수 있어서 화합물 구조 분석, 단백질 분석, 약물 활성 및 신약 개발에 많이 적용되고 있다. 이세돌 9단을 바둑으로 이긴 알파고(AlphaGo)도 심층 학습을 기반으로 하는 컴퓨터 프로그램이다. 초기에는 사람이 둔 바둑 기보를 학습하여 이세돌 9단을 이겼는데, 이후, 아예 바둑 두는 방법을 학습시킨 알파고 마스트(Master)는 스스로 컴퓨터 내에서 수없이 많은 대국으로 하여 이제는 인간과 대국을 하는 것이 의미가 없게 만들었다. 바둑분야에서는 이미 인간을 뛰어넘는 특이점을 넘어서 경이롭게 생각도 했지만, 예상대로 사람들은 불안감을 느끼고, 나중에는 인간의 일자리마저 위협을 받게 될 것이라고 상상하게 된다. 

 

바이오 분야에 수를 셀 수 없이 많은 데이터도 컴퓨터가 심층 학습을 하면 사람이 생각하지 못한 부분까지 독자적으로 찾을 수 있는 능력까지 갖추게 되어 혁명적인 첨단바이오 기술 개발도 가능하지만, 결국 같은 경향으로 특이점에 대한 위험도를 생각하지 않을 수는 없다. 하지만, 생명에 대한 무한한 가능성에 현재 인간은 얼마나 이해하고 있을까? 라는 의문을 가지면서 인공지능이 어떤 한정된 분야에 대해서 특이점을 가진다고 해도 이를 다각적인 판단으로 조절하는 가능성은 인간에게 있다고 생각한다. 인간이 할 수 없는 거의 무한대의 컴퓨터 내 심층 학습으로 사람에게 필요하고 유익한 결과만 얻을 수 있는 가칭 “올바른 학습(Upright Learning)”도 가능하다고 상상해 본다.

 

<맺 는 말>


 인공지능이 우리에게 다가온 것은 2016년 3월 9일에서 15일까지 구글 딥마인드(Google DeepMind)가 개발한 바둑 인공지능 알파고(AlphaGo)와 이세돌 9단 간의 5번기의 바둑대국에서 알파고가 4대 1로 승리함으로 모두를 놀라게 했다. 이때까지만 하여도 단지 바둑 명인들이 대국한 기보들을 인공지능 알파고가 학습하여 대국하였고, 이세돌 9단이 바둑을 두면 알파고는 구글 클라우드에서 알파고 프로그램을 돌려서 컴퓨터의 아주 빠른 계산 능력으로 대국 중에도 아주 짧은 시간에 수만 번 시뮬레이션하여 최적의 바둑 수를 결정하여 대국하였다. 하지만, 그 후 만들어진 알파고 마스트(AlphaGo Master)는 바둑 명인들의 기보 없이 인공지능이 스스로 바둑을 두는 원리를 학습하고 스스로 하루에 수십만 번이라도 학습하여 이제 인간의 바둑 실력으로는 도저히 대국조차 할 수 없을 정도로 발전하였다. 인간이 30년 동안 하루에 4시간씩 바둑대국을 2번씩 한다고 가정하면 결국, 21,900(30X2X365=21,900) 번의 대국을 할 수 있을 것이다. 하지만, 인공지능 알파고는 하루에 수십만 번의 대국이 가능하다고 하니 학습하는 대국 수로 계산하면 알파고는 사람이 30년 동안 하루도 쉬지 않고 끊임없이 대국하는 대국 수를 하루에도 10배 이상할 수 있다는 엄청난 사실에 놀랄 수밖에 없어서 가까운 장래에 인간의 능력을 뛰어넘는 특이점(Singularity)을 걱정하기에 이른다. 

 

최근, 출시된 인공지능 챗봇인 ChatGPT 등은 대규모 언어모델(Large Language Model, LLM)로 언어생성 능력이 고도로 발전하여 과학자들의 생각을 정리하고 코드를 작성하고 많은 연구 문헌을 요약하여 연구조교로 사용하는 등으로 대중이 이미 사용할 수 있어서 긍정적인 효과도 크지만, 인간이 쓴 글과 구분이 어려워 투명한 과학이 어려워 윤리적 사용에 기준이 필요하다는 인식이 확산하고 있다.(Nature, Tools such as ChatGPT threaten transparent science; here are our ground rules for their use(2024.1.24.)) 이미, 인간의 언어능력에 견줄 정도로 발전하였고, ChatGPT로 미국 의사면허 시험(USMLE)을 한 결과 모든 시험에서 50% 이상의 정확도를 보여주었고, 최소 4개의 사전 인쇄 또는 출판된 논문에 이미 ChatGPT를 저자로 인정하고 있어서 단시간에 중요한 요점을 파악하는 데는 큰 장점이 있다.

 

결국, 바이오 과학 분야에 ChatGPT를 사용하여 질문을 했을 때 30년 이상 전공한 과학자보다 더 정확하고 쉽게 설명할 수 있다는 데, 소름이 돋는 것을 느꼈다. 그렇지만, 모두 비관적이고 패배적으로 생각하기보다는 일어날 수 있는 모든 경우를 고려하고 긍정적으로 인공지능의 능력을 인간이 잘 조절하면서 윤리적으로 활용한다면, 지금 인류가 직면하고 있는 지구상의 난제를 해결할 수 있고 나아가서는 인간의 삶의 질과 풍요로움을 더욱 구가할 수 있을 것으로 긍정적인 생각을 하여 본다. 

<ifsPOST>

2
  • 기사입력 2024년09월10일 16시32분
  • 최종수정 2024년09월02일 11시24분

댓글목록

등록된 댓글이 없습니다.