비교유전체학

비교유전체학

[ comparative genomics ]

비교유전체학은 특정 생물체의 유전체 염기서열을 다른 생물체들의 유전체 염기서열과 컴퓨터 분석 (in silico) 기술을 통하여 비교하는 연구 분야이다. 유전체 염기서열 비교를 통해 특정 생물체와 기존에 알려진 다른 생물체의 유사성과 동일성을 확인할 수 있다. 이 때 비교하는 생물체 간의 염기서열이 다르더라도 유전자 코돈 중복성으로 인하여 동일한 아미노산 서열을 가지기도 한다. 단백질을 구성하는 아미노산 서열은 단백질 영역(protein domain)이라고 하는 기능적 모듈로 분류할 수 있다. 비록 모든 아미노산 서열이 유사하지 않더라도, 특정 단백질 영역을 가지고 있다면, 그것으로 그 단백질의 기능을 예측할 수 있다. 일반적으로 아미노산 서열이 50%이상 동일성을 갖는 단백질들은 서로 유사한 기능이 있다고 말하고, 70% 이상의 아미노산 서열 동일성을 갖는 단백질 간에는 같은 기능을 가진다고 말한다. 최근 차세대 염기서열 분석(Next Generation Sequencing, NGS)을 활용한 대용량 염기서열 분석이 가능해지면서, 비교유전체학은 다양한 분야에서 여러 방향으로 활용되고 있다.1)2)

비교유전체학을 통해 생물체의 유전체 염기서열을 서로 비교하고 유사한 단백질 영역을 확인하여 세포 내 존재하는 단백질들의 종류와 기능을 유추할 수 있다. 유전체와 단백질체의 조절 기작을 이해할 수 있다면, 질병 치료, 농업 및 바이오 물질 생산성 등 실제 의학 및 산업적으로 응용되고 있는 모든 분야에 큰 진전을 이룰 수 있는 잠재성이 존재하기 때문에 매우 중요하다.

RAST server를 이용한 유전체 비교 예. (출처: 김봉수/한림대)

목차

진화연구에서 비교유전체학

생명체의 진화는 오랜 기간 서서히 일어나기 때문에, 그 과정을 인간이 직접 관찰하는게 불가능하지만, 비교유전체학은 각 생물체 간의 유전체 염기서열을 바탕으로 생물학적 기능의 유사성뿐만 아니라 진화생물학적인 관계도 확인할 수 있게 해 준다. 진화라는 과정을 통하여 그 환경에 유리하게 염기서열이 변형된다면, 그 과정 동안 보존되는 유전체 내 특징들이 존재하게 되고, 이는 공통적 조상으로부터 소실되지 않고 남아있어 염기서열 분석을 통해 진화적 관계를 유추할 수 있게 된다. 일반적으로 진화와 종 다양성 연구의 핵심 유전체 정보로 유전자는 작은 단위체 rRNA (small subunit rRNA) 유전자를 사용하여 진화 양상을 추적할 수 있으며, 원시 생명 형태를 이해하는 데 많은 실마리를 제공할 수 있다.

오르토로그와 파라로그

생물 간의 근본적인 차이와 진화의 원천적 요인은 유전체 염기서열의 변화이다. 유전체 염기서열은 오랜 진화의 과정을 통하여 변화되는 부분도 존재하게 되고, 변화되지 않는 부분도 존재한다. 따라서, 진화적으로 가까울수록, 유전체 내에 보존된 서열이 많고, 생물체가 살아가는 데 필요한 필수적인 요소일수록 잘 보존되어 있다. 이렇게 잘 보존된 유전자를 상동 유전자(homologous gene)라 하고, 이들의 그룹을 유전자족(gene family)이라 한다.

비교유전체학을 통하여 많은 상동 유전자들은 유전자 중복(gene duplication)과 염기 서열의 돌연변이로 인해 생겨난 것이 밝혀졌다. 오랜 진화 과정을 통하여 유전체 변화는 더 복잡하고 다양한 형태로 나타난다. 한 종 내에서 발견되는 상동 유전자는 특정 시기의 유전자 중복 등의 결과로 나타난다. 유전자 중복이 일어나고 시간이 지나면서 염기서열이 변화하게 되는데, 이 과정을 통해 조금씩 다른 기능을 가지도록 진화할 수 있다. 이를 파라로그 유전자(paralogous gene)라고 하며, 대표적인 예로 lactate dehydrogenase (LDH) 이성체를 들 수 있다. 이와 달리 여러 다른 종들에서 발견되는 상동인 유전자들로, 종 분화 혹은 훨씬 먼저 발생한 진화 과정에서 같은 유래를 가지는 유전자들을 오르토로그 유전자(orthologous gene)라고 한다. 예를 들어 Lactobacillus의 LDH는 사람의 LDH 이성 체들과 오르토로그라고 할 수 있다.

유전체 진화와 유전 형질의 종간 이동

지금까지 다양한 생물체 영역에서 많은 생명체들(특히 미생물들)의 유전체 분석이 이루어져 왔고, 이러한 정보를 바탕으로 유전체 정보를 서로 비교하는 비교유전체학적 접근이 많이 진행되고 있다. 그 결과 흥미로운 점들이 많이 발견되었는데, 예를 들어 고균DNA 복제, 전사번역에 관련된 유전자들은 세균보다는 진핵생물의 유전자와 더 비슷하다는 사실이 확인되었다. 고균의 대사에 관련된 유전자들이 세균의 유전자와 굉장히 비슷한 점을 생각한다면 매우 놀라운 점이 아닐 수 없다. 유전자, 유전자 그룹, 유전자족, 혹은 유전체 수준에서 빠른 속도로 대량의 정보를 비교하기 위해서 컴퓨터를 이용한 생물정보학적인 분석 방법이 이용되고 있다. 대표적으로 각 생물체의 특정한 염기서열(예, 리보좀 RNA(rRNA) 염기서열)을 비교하여 계통분류학적 관계를 확인할 수 있고, 이를 기반으로 모든 생물체의 유전체는 공통 조상의 유전체로부터 진화됐음이 밝혀졌다. 흥미롭게도 이와 더불어 특별한 유전체 진화 과정도 관찰할 수 있는데, 이는 생명체 진화 과정에서 서로 다른 종 간의 유전형질이 이동되는 현상이 나타났음을 유전체 비교 분석 과정을 통하여 확인할 수 있다.

비교유전체학 분석 프로그램

비교유전체분석을 수행하기 위해서는 우선 비교하고자 하는 생물체 종들간의 유전체 염기서열을 확보하여야 한다. 확보된 염기서열은 조립(Assembly), 주석달기(annotation), 비교 종들간의 유전체 염기 배열(alignment)등의 순서를 통해 비교를 하며, 비교된 결과는 다양한 프로그램을 통해 확인할 수 있다. 유전체염기서열 비교를 위해 가장 많이 사용되고 있는 프로그램은 아래와 같다.

ACT (Artemis Comparison Tool) - 유전체간의 유사한 부위의 비교를 BLAST를 통해 시각화하는 프로그램으로 2개 또는 몇 개의 유전체를 비교할 때 가장 유용하며, 차이가 나는 부분을 찾아내고 확대할 수 있다. 3)

Mauve - 단일염기다형성 (SNPs), 차이가 나는 영역, 상동 영역을 보여주는 유전체 정렬 프로그램으로, Mauve Contig Metrics를 사용하여 참조유전체와 비교하여 조립된 품질 (assembly quality)를 확인하는데 사용할 수 있다. 4)

BRIG (BLAST Ring Image Generator) - 원형의 지도를 통해 종들간의 BLAST 비교를 통한 유전체차이를 시각화해주는 프로그램으로, 많은 종의 유전체들을 비교하는데 적합하지만, 입력해야 하는 항목이 12가지가 넘기 때문에 작업을 수행하는데 어려움을 느낄 수도 있다. 5)

이외에도 다양한 프로그램들을 모아놓은 Omic tools 6)에서도 비교유전체분석 프로그램을 찾을 수 있다.

Bacillus subtilis BEST195과 8종의 B. subtilis 유전체 비교. 각 유전체는 MUMer를 이용하여 정렬을 하였다. 바깥 쪽 검은 선은 BEST195유전체의 완전하지 않은 영역을 나타내고, 두번째 부터 9번째 까지 색이 있는 고리는 다른 종의 유전체가 BEST195 유전체와 정렬되어 있는 부분을 나타낸다. 중앙의 내부 원은 G+C 함량이 표시가 된다. 이 그림은 DNAPlotter를 사용하여 만들었다. ()

집필

김봉수/한림대학교

감수

이정신/강원대학교

참고문헌

1. Kamada M, Hase S, Fujii K, Miyake M, Sato K et al., 2015. Whole-genome sequencing and comparative genome analysis of Bacillus subtilis strains isolated from non-salted fermented soybean foods. PLoS One. 10(10): e0141369.
2. Jhonson TJ, Wannemeuhler YM, Scaccianoce JA, Johnson SJ, Nolan LK. 2006. Complete DNA sequence, comparative genomics, and prevalence of an IncHI2 plasmid occurring among extraintestinal pathogenic Escherichia coli isolates. Antimicrob. Agents Chemother. 50(11): 3929-3933.
3.
4.
5.
6.

동의어

비교유전체학, Comparative genomics, comparative genomics