열려있는 정책플랫폼 |
국가미래연구원은 폭 넓은 주제를 깊은 통찰력으로 다룹니다

※ 여기에 실린 글은 필자 개인의 의견이며 국가미래연구원(IFS)의 공식입장과는 차이가 있을 수 있습니다.

오태광의 바이오 산책 <6> 생명체의 설계도 ‘유전체’ 본문듣기

작성시간

  • 기사입력 2021년07월06일 17시00분
  • 최종수정 2021년07월04일 09시00분

작성자

  • 오태광
  • 서울대학교 특임교수, 주)피코엔텍 상임고문

메타정보

  • 6

본문

인류 역사상 최초 생물 유전체 해독은 1995년 병원성세균인 헤모필러스 인플렌자(Haemophilus influenzae)로 시작되었고, 2003년 인간유전체가 해독되면서 Post genome시대를 열게 되었다. 현재는 약 330건 이상의 생물 유전체가 미국 국립생물정보센터(NCBI)에 의해 완전히 해독되었고, 인간 유전체 해독은 우리나라에서도 10,000명 이상이 분석되었다. 

인간유전체가 해독된 후, 유전체가 생물체를 만드는 ‘생명의 청사진(Blueprint, 설계도)’이라고 정의하면서 마치 건축물을 지을 때 설계도를 보고서 건축을 하듯이 유전체 정보로 각기의 생명체를 쉽게 만들 수 있으리라고 생각하였다. 실제 인간유전체 해독 발표에 중요한 역할을 한 크라이거 벤터(Craig Venter)가 기본적인 세균인 대장균(E. coli) 유전체 크기의 약 1/4정도 밖에 되지 않은 마이코플라스마(Mycoplasma)라는 아주 작은 세균을 2010년 유전 정보에 따라 생명체를 만드는 과제를 시작하였고, 2021년에는 세포분열을 통한 자손을 번식시킬 수 있는 인공생명체를 만드는 데 성공하였다. 

생물체가 가지는 모든 유전 정보의 총합을 그 생물의 유전체라고 하는데, 유전 정보를 구성하는 염기를 처음부터 끝까지의 연결된 염기서열 총합을 의미한다. 유전체에는 단백질을 만드는 암호화된 유전자 서열(Coding sequence)과  유전자 사이에 존재하면서 아직 기능을 모르는 비 암호화 서열(Non-coding sequence)로 구성되어 있고, 이외에 세포 내 에너지 등을 만드는 중요한 기능을 가진 미토콘드리아(Mitochondria)에는 따로 자체 유전자를 가지고 있다. 

 인간과 같은 지능이 높은 고등생물은 유전체 크기와 단백질 수가 가장 클 것으로 생각했는데, 실제로는 인간 유전체가 30억 염기쌍인데, 간단한 원생동물인 아메바(Amoeba dubia)는 사람보다 200배나 많은 DNA를 가지고 있고, 우리가 나물로 즐겨 먹는 고사리는 아메바보다 더 많은 유전체를 가지고 있다. 

유전자 밀도(Gene density)는 DNA 염기서열 1.0 Mb(Mega base :106개 염기쌍)당 만들어지는 유전자 수(기능단백질 유전자 수/총 DNA 염기서열<Mb>)로 표시한다. 간단한 생물체인 대장균을 예로 들면, 4,6 Mb 염기서열로 만드는 기능단백질 수는 4,400개로 대장균의 유전자 밀도는 48 (4,400/4.6=48)이다. 인간유전체 경우는 30억(3,000Mb) 염기서열로 만들 수 있는 기능 단백질 수는 약 20,000만개 정도로 유전자 밀도는 6.67(20,000/3,000)로 나타났다. 

대장균에 비해서 인간은 652(3,000/4.6=652)배나 큰 유전체를 가졌는데도 유전자 밀도는 대장균에 비해서 현저히 낮은 것을 알 수 있다. 인간이 30억 염기쌍을 가졌음에도 만드는 기능 단백질 수로는 인간유전체의 보다 652배나 작은 대장균에 비해 겨우 4.5(20,000/4,400)배 밖에 되지 않아서 이상하게 생각하였다. 유전자 밀도를 인간과 대장균을 비교하면 아래 그림과 같이 대장균은 대부분이 기능 유전자(단백질, 붉은색)로 되어 있는데, 인간의 경우는 반복되는 DNA요소가 많고 기능 유전자 부분는 극히 적은 것으로 나타난다. 인간의 유전자 밀도가 낮은 것은 아직은 기능을 알 수 없는 반복되는 98%의 비 암호화 서열 때문이다.

293eca0cec738c03039716445236e59c_1625357

 결국 기능을 알수 있는 기능단백질을 암호화(Coding DNA)하지 않는 98% 비 암호화 서열(Non-Coding DNA)은 기능과 용도가 없어서 유전체분석 초기는 쓰레기라는 의미의 “정크 DNA(Junk DNA)” 라고 비하하였다. 하지만, 염기서열의 변화 없이 어떤 형질이 후손에게 전달되는 후생 유전학적 유전(Epigenetc inheritance) 등이의 새로운 사실이 밝혀짐에 따라서 현재로는 전혀 기능이 없다던 쓰레기 유전자의 중요한 기능이 점차 밝혀지고 있다., 특히 유전체 연구에 대한 시각이 크게 바뀌어 심지어 ‘다시 시작이 되어 가고 있구나!’ 라는 생각을 하면서 이번 바이오 산책을 시작하고자 한다. 

 

판도라상자 유전체(Genome)를 열다. 

 

  기능성 단백질을 중심으로 한 유전 정보 획득기술이 가속화됨에 따라 인간을 좀 더 큰 생명체 전체의 유전 정보인 유전체를 얻고 싶은 욕망에 눈을 돌리게 된다. 세계에서 최초의 생명체 유전체 해독은 1995년 헤모필러스 인플렌자(Haemophilus influenzae)에 이어서 원 핵 미생물인 대장균(Eschericha coli)을 해독하여 발표하게 되면서 시작되었고, 이후 더 진화되고 유전체 크기가 큰 고등생물이 해독되어 발표되었다. 

 

최초의 진핵 미생물인 효모(Saccharomyces cerevisia) 유전체가 1997년에 해독되고 연이어 선충, 초파리가 해독되었다. 2001년에는 최초 식물 유전체로 애기장대가 해독됨과 동시에 인간유전체의 초안(Draft)이 발표되었다. 마침내, 2003년 13년간 막대한 38억 US$의 비용으로 인간유전체를 백인을 대상으로 분석 완료하였다.

 

 한국인의 인간유전체는 2009년 서정선(마크로젠) 교수와 박종화(울산과기대) 교수가 각각 따로 한국인 인간유전체를 발표하였다. 서정선 교수팀은 2016년 거의 완벽한 인간 유전체 해독을 했는데, 지금까지 인간 유전체 해독에 어려운 점인 190개의 공백 부분 중 105곳은 완벽하게 해독하였고 72곳은 93%까지 해독하여 지금까지 발표된 인간유전체 해독 중 가장 완벽하다는 평가를 받고 있다. 

 

현재의 인간 유전체 해독은 많은 사람의 인간유전체를 해독하는 방향으로 발전하여 1만 명, 10만 명 인간 유전체를 해독하는 대형 프로젝트가 시작되었고 우리나라도 박종화 교수가 한국인 인간 유전체 10,000명 해독을 2021년에 끝내었다. 한꺼번에 많은 인간 유전체를 해독할 수 있게 된 이유는 차세대 유전자 분석기술(Next Generation Sequencing)이 개발되어 가능했다. 이 기술은 아주 빠르고 저렴하게 (1,000$) 유전체를 분석할 수 있었고, 이런 결과로 짧은 시간에 아주 많이 분석된 인간 유전체 빅 데이터(Big data)를 만들어 Post genome 시대를 여는 계기가 되었다. 

 

얼마나 빨리 저렴하게 인간 유전체를 분석할 수 있는가? 2003년 처음 인간유전체를 해독하는 데는 무려 13년이 걸렸는데 현재는 하루 이내로 분석할 수 있어서 약 5,000배 이상 빠르게 분석할 수 있고, 특히 당시는 단 한 사람만 분석 가능했는데 지금은 원하는 사람 수만큼 동시에 분석할 수 있다. 분석 비용은 2003년 1인 분석 비용이 38억 달러가 들었는데 현재는 1,000 달러로 3,800만 배 저렴하게 분석할 수 있다. 분석비용를 처음과 현재를 비교하여 설명하면 현재 3억 원짜리 페라리 스포츠카를 단돈 100원으로 살 수 있을 정도로 획기적으로 저렴해졌다. 

 

인간 유전체 중 기능이 갖는 단백질을 생산하는 유전자(Coding DNA)는 전체 유전체에 2% 정도이고 나머지 98%는 기능과 용도가 없는 유전체를 Non-Coding DNA로 “정크 DNA(Junk DNA)”라고 쓰레기로 표시했다. 하지만 현재는 쓰레기가 아닌 RNA 전사에 사용될 뿐만 아니라 후생 유전(Epi genomic) 조절, 배아의 성장 발달, 암 발병, 진화하여 유전자의 다른 용도로 활용 변경 등 중요한 역할이 속속 밝혀지고 있어 새로운 시대가 열리고 있다. 

 

유전체 해독 결과 발표 후, 유전체를 생물체의 청사진이라고 말하면서 금방 생명을 창조할 수 있는 것처럼 신의 영역을 도전할 수 있다고 쉽게 말을 했는데, 사실 아직까지 2% 정도 기능을 알고 있는 유전자 부분도 생명 창조는 이제 시작 단계이다. 현재 기능을 모르는 98%를 인간이 모르기 때문에 쓰레기 DNA라고 표현한 인간의 오만함은 정말로 아이러니(Irony)다. 

 

필자도 1995년 대장균 유전체가 발표된 후 대장균 연구를 하면 비평적인 사람은 모두 끝난 연구를 한다고 냉소적으로 평하기도 했는데, 현재도 대장균에 대해 모르는 점이 아주 많고 중요한 전문 저널에 여전히 많은 연구논문이 발표되고 있다. 

 

인간 게놈 프로젝트(human genome project)가 2001년 끝난 후 유전자 지도의 초안이 발표되면서 기능이 있는 유전자 수는 약 25,000개 정도로 예상되었으나, 2013년 공개된 인간 유전체 염기 정보에 관한 최신판인 GRCh38에 의하면 사람의 기능 유전자 수는 최종적으로 19,950개로 발표되었다. 과학자들은 우선 작은 생물체부터 사람의 힘으로 인공생명체를 만들려는 시도를 2010년에 시작하였고, 2016년 크레이그 벤터 연구소(J.Craig VenterIn stitute)에서는 세상에서 가장 작은 게놈을 가진 합성 박테리아(Syn 3.0)를 만들어 사이언스(Science) 저널에 발표하였고 2021년 자손을 퍼트릴 수 있는 완벽한 생명체를 만들었다. 

 

이번에 인공생명체를 만든 마이코플라즈마(Mycoplasma)는 원핵생물 중에서도 가장 작은 유전체로  유전자 수는 473개이며, 전체 DNA 길이는 53만 염기쌍을 재현하기는 성공은 했지만, 여전히 유전자의 30%를 차지하는 149개는 전혀 기능을 알 수 없어서 생명현상을 만드는 필수 유전자 set을 만들지 못해 아직은 아주 작은 생물도 완전히 인공화에는 성공하지 못했다고 판단했는데 2021년 많은 노력으로 인공생명체를 번식하는 데는 성공하였다. 가장 간단한 세균인 대장균의 유전체의 1/4크기이고 인간과 비교하면 0.03%의 크기여서 마이코플라즈마 인공생명체 합성도 단지 가능성을 확인하였고 아직도 해결해야 할 문제가 아주 많고 더 발달 된 생물의 인공화는 아주 먼 길로 느껴진다. 

 

유전체(Genome) 해독 후의 응용

 

 수많은 생물 종(種)들의 유전체가 해독되면서 바이오산업은 급격한 발전과 혁신을 이루면서 바이오 황금시대가 도래하였다. 지금까지 인간은 단지 우연히 그렇게 되었다고 생각하고 있던 왼손잡이, 특이한 귓바퀴(붙은, 둥근 귓바퀴), 귀지(물 귀지, 마른 귀지), 편두통, 대머리, 하지 불안 증후군, 음치 등의 사소한 것까지 개인 유전체에 유래된다는 것을 알게 되었다. 

 

하지만 무엇보다 중요한 것은 개인 유전체 기반의 개인의학(Personal medicine)이 등장하여 새로운 건강관리 시스템이 정립되었다. 의학 분야는 진단과 치료 분야에 획기적 발전을 가져와서, 정밀의학(Precision medicine)이 자리 잡으면서 사회 전반이 유전체(Genome to Society)에 영향을 받아서 질병 치료(Illness)에서 종국에는 예방을 통한 복지(Wellness) 구현 사회로 발전되고 있다. 이런 사회적 변화는 개인적 개성(Privacy), 개인 식별(Discrimination), 지적 재산권(Patent), 보험(Insurability), 고용(Empolyability) 등에도 영향을 미쳐서 산업, 경제 모든 분야에도 큰 변화를 가져왔다. 

 

인간 유전체 30억 염기쌍을 풀어서 하나씩 적어 가면 아주 작은 글씨로 빽빽하게 적혀있는 전화번호부 수백~수천 권 정도에 해당하고, 한 인간이 가진 60조 개의 세포는 살아가는 동안 쉽지 않고 재생, 성장, 번식하면서 세포내에서는 1천권에 가까운 전화번호부를 수도 없이 계속 복사하여 재생, 성장하여 자손에게 전달하고 있다. 하지만, 30억 염기쌍을 수도 없이 복사하다 보면 실제로는 지극히 어렵지만 잘못 복사될 확률도 있다. 

 

이런 유전체 복사가 수만 수억 년 일어나다 보면 아주 작은 변화가 모여서 결국 생물 다형성(Polymorphism,多形性)을 형성할 수도 있을 것이다. 인간 유전체 30억 염기쌍 중 1개의 염기서열이 달라진 것을 SNP(Single Nucleotide Polymorphism, 단일 염기 다형성)이라 하는데 각 개인에 따라 한 개 염기가 달라진 위치가 각각 달라서 SNP를 이용하면 개인 식별이 가능하여 범죄 수사, 친자확인 등에도 이용한다. 

 

보통 단백질은 20개의 아미노산으로 이루어져 있고 아미노산을 암호화하는 염기는 3개로 구성되어 유전자에 저장되어 있다가 단백질합성 시는 3개의 염기를 읽어서 1개의 아미노산을 특정화하고 이런 아미노산이 길게 서열화한 것이 단백질이다. 염기가 1개 바뀐 SNP가 인체의 중요한 기능을 하는 단백질 중에 있는 아미노산의 3개 염기 중 1개가 바뀐다면 인체의 표현형이 완전히 달라지는 경우도 많다. 염기 SNP의 1개의 변화로 표현형이 달라진 예는 수도 없이 많아서 모두 예를 들 수는 없을 정도이고, 인체의 건강, 습성, 질병 발생 등에 큰 영향을 미친다. 

 

 몇 가지를 예를 들면, 술에 강한 사람은 알데하이드 탈수소 효소가 487번째 아미노산이 GAA 염기로 구성되어 글루타민이란 아미노산으로 특정되고 있는데, GAA가 AAA로 염기 한 개가 실수로 바뀌면서 라이신이라는 아미노산으로 바뀌면 알데하이드 탈수소효소가 역할을 할 수 없게 된다. 이렇게 되면 간에서 알코올을 분해할 수 없어서 술을 전혀 마실 수 없거나 술에 아주 약한 사람이 된다. 특히, 심한 경우는 술이 독으로 작용하여 조금만 마시어도 생명에 위협을 받아 앰뷸런스에 실려 갈 수도 있어서 30억 개 염기 중 단 1개만 바뀌어도 엄청난 일이 벌어질 수 있다. 

 

비슷한 예로는 바닷가 가까운데 살아온 남방계 아시안은 옛날부터 소금이 흔해 충분히 섭취할 수 있어서 신장에서 먹은 소금을 빨리 오줌으로 배출하였다. 하지만, 북방계 아시안은 바닷가에서 멀리 떨어져 살아서 소금이 아주 귀해 먹기 힘들어 신장에서 Adducin이라는 소금 배출 기능이 있는 단백질의 1개의 염기가 바뀌어 표현되는 아미노산이 달라짐에 따라서 소금을 재흡수하여 다시 사용할 수 있었다. 

 

결국 Adducin이란 단백질의 염기가 한 개 바뀌어 소금 재흡수 활성이 커지면 적은 소금을 먹고도 북방계 아시안은 살아갈 수 있도록 진화하였다. 하지만, 작은 양의 소금을 먹더라도 재 흡수되어 혈액 내 염분 농도가 높아지면 현재와 같이 어디서든지 소금을 먹는 데는 문제가 되지 않은 환경에서는 고혈압 등과 같은 성인병에 걸릴 확률이 높아질 수도 있다. 

 

이런 현상은 머리카락의 굵기, 마른 귀지/물 귀지, 당뇨병, 치매, 유방암, 뇌 혈전 질환 등 수 없이 많은 예가 있다. 마른귀지/물 귀지도 북방 아시안 사람은 주로 마른 귀지를 만들어 실제 귀후비지가 팔리고 있는데, 서양인은 물귀지여서 면봉으로 제거하여 귀후비기를 볼수 없다. 이 경우도 비슷하게 단지 30억 염기중 단 1개의 염기가 달라진 데서 기인한다. 

 

또한, 질병이 걸렸을 때 약물에 대한 치유 반응성은 약물이 작용하는데 필요한 기능성 단백질이 개인의 SNP 차이에 따라 달라질 수 있어서 치료를 위해서 약을 먹었을 때 반응이 달라진다. 실제 항암제는 단지 25%의 환자에게는 치유 효과가 있지만, 나머지 75%는 치료 효과가 없고, 비슷하게 치매치료제도 70%가 약효가 듣지 않는데, 즉, 약의 종류에 따라 개인에게 반응이 차이가 있다는 이야기다. 

 

초기에 약은 주로 실증효과를 근거(Data-riven medicine)로 한 예측의학에서 유전체 해독 이후, 정확한 조준(Shotgun medicine)을 할 수 있게 하는 유전체 근간 정밀의학 (Precision medicine)이 가능하다. 이제 개인 유전체 시대가 완성되면 예방의학이 활성화되고 복약도 개인에 맞는 약, 정확한 용량을 필요한 정확한 시간에 처방받을 수 있게 되어 치료율을 크게 높일 수 있는 개인 맞춤형 의료시대가 이미 시작된 것이다.

 

맺음말 

 

 유전체 이야기는 인간 전체와 지구상의 모든 생명체를 포함하는 지극히 광범위한 분야라서 본고에서는 전체의 흐름을 설명하였고, 차후 바이오 산책을 계속하면서 여러 분야의 구체적이고 재미있는 현상을 계속 탐험할 생각이다. 인간유전체가 해독된 후 생명의 설계도, 청사진 등 많은 이야기가 있었고, 청사진을 가지면 쉽게 건물을 건축을 할 수 있듯이 생명체도 쉽게 만들어 인간이 신의 영역에 도전한다고 생각하였었다.

 

 과연 그렇게 생각할 수 있을까? 간단한 집을 지을 때도 지은 집의 균형, 미적 판단, 외부환경에 대한 저항성 및 사는 사람의 개성 등에 따라서 집을 짓는 재료, 집의 위치, 방향이 달라지지만 단순한 청사진에 모든 것들을 담기는 어려울 것이다. 아직까지는 유전체를 이루는 모든 단백질의 완벽한 기능도 완전히 모르고 있고, 각 단백질의 단순한 기능은 밝혀졌지만, 중복된 여러 기능이나 단백질 기능 간 복잡한 Network와 조절기능은 아직은 초보적 단계로 생각한다. 

 

전체 유전체 중 단백질을 나타내는 유전 정보는 불과 약 2% 정도이고 아직 기능이 모르는 98%를 쓰레기(정크) 유전체라 표현했는데, 연구가 진행되면서 쓰레기에서 황금을 찾듯이 생명체의 기능이 조금씩 밝혀지지만 아직은 어떤 방향으로, 어디까지. 어떻게 갈지도 확실하지 않아서 이제, 단지 시작하였을 뿐이라고 생각한다.

<ifsPOST>

 

 

 

 

6
  • 기사입력 2021년07월06일 17시00분
  • 최종수정 2021년07월04일 09시00분

댓글목록

등록된 댓글이 없습니다.