유전체학

유전체학

[ genomics ]

유전체학은 유전체의 구조, 기능, 진화, 지도작성, 편집에 중점을 두어 연구하는 여러 학문 분야가 관련된 생물학 분야이다. 단백체학, 전사체학, 상호작용체학 등과 같이 생물정보학의 한 분야이기도 하다.

목차

유전체와 유전체학의 특성

유전체는 한 생물의 모든 유전자들을 포함하는 전체 DNA를 말한다. 그 생물의 특성은 유전체에 의해 부여되어, 생체 부분을 만들고 유지하는 데 필요한 정보를 포함하고 있다. 대부분 경우에는 DNA 유전체이나 일부의 바이러스는 RNA 유전체를 가진다. 사람의 유전체는 두 부분으로 구성되어 핵 유전체는 44개(22쌍)의 상염색체와 2개(1쌍)의 성염색체 (X, Y)에 유래하고, 모두 약 45,500개 정도의 유전자가 있으며, 이에 더해 약 37개의 유전자를 포함하는 미토콘드리아 유전체(mitochondrial genome)로 구성된다. 이와 같은 구성은 진핵 생물 경우에는 전형적이며, 다만 식물의 경우에는 이에 더하여 200여 개의 유전자를 포함하는 엽록체 유전체(chloroplast genome)가 추가된다.

유전체학은 유전체, 즉 생명체 내의 모든 유전자들의 구조 및 기능 등을 밝히는 연구를 말한다. 유전체학은 유전자 및 유전체 DNA의 내용을 파악해 내는 구조 유전체학과 유전자의 기능과 코딩하는 단백질을 밝혀내는 기능 유전체학, 종간의 유전적 유사성을 통해 구조와 기능을 해석하는 비교 유전체학으로 구분된다. 주로 유전자 지도작성, 돌연변이생물(형질전환생물, 유전자제거생물, 화학적돌연변이생물, 자연돌연변이생물)의 생산 및 분석, 질병유전자 및 특수형질과 관련한 원인 유전자구명, 분자표지인자(DNA marker) 개발연구 등을 포함한다.

전사체, 단백질체, 대사체와 비교를 통한 유전체의 특성(출처: )

유전체 분석

유전체 분석의 한 예로 인간유전체사업을 들 수 있다. 인간의 유전체는 약 16 Kb 크기로 작고 간단한 미토콘드리아 게놈과 선형의 24가지의 염색체 DNA로 나뉘어져 있고, 총합이 약 3.2 x 106 Kb에 해당하는 아주 많은 양의 핵 게놈으로 구성된다. 1981년에는 인간 미토콘드리아 진핵기관의 유전체 염기서열분석이 완성되었고, 이후에는 간단한 진핵생물의 염색체를 대상으로 한 염기서열분석이 시도되었다. 이러한 결과에 자극을 받아 미국을 중심으로 핵 유전체를 대상으로 한 인간유전체사업이 되었으며, 2003년에 최종 완료가 선언되었다. 이를 계기로 인간 개개인을 대상으로 한 유전체 염기서열 분석 작업이 활발하게 이루어지고 있다.

유전체 분석은 아래와 같은 방법과 과정으로 진행된다.

염기서열 결정(sequencing)

전통적인 사슬 종결 염기서열 결정법 (chain termination sequencing), 샷건 염기서열법(shotgun sequencing), 대용량(high-throughput), 대량평행(massively parallel) 전략을 사용하는 차세대 염기서열 결정법(next-generation sequencing) 등을 주로 사용하여 유전체 전체 DNA의 염기서열을 결정한다.

염기서열 조립(assembly)

유전체의 올바른 조립을 위해 중요한 유전체 지도 작성. 이 과정에는 연관분석이나 가계도분석이라 불리는 유전적 지도 작성(genetic mapping), 또 하나의 주요 접근은 DNA 분자를 직접 다루는 물리적 지도 작성하는 과정을 수행한다. 조각단위로 얻어진 염기서열들은 위와 같이 작성된 유전자 지도를 참고하여 염색체에서의 순서 모양으로 조립한다. 염기서열을 충분하게 많은 양을 확보한 경우에는 유전자 지도를 참고하지 않고도 염기서열끼리 겹치는 서열 정보를 이용하여 조립을 할 수 있다. 대부분의 진핵세포 경우에 염색체 상당부분을 차지하는 고반복서열은 염기서열 조립 중에 난관에 해당하며, 이를 해결하기 위해 다양한 재료와 방법이 이용된다. 경우에 따라서는 이를 모두 해결하지 못하기도 한다.

주석 달기(annotation)

유전체 서열에서 유전자를 파악하고, 유전자 구성을 분석하는 등의 유전체 주석 달기(genome annotation)를 수행하며, 실험적 자료를 이용하고, 예측을 검증하며, 생물정보학 도구를 많이 이용한다.

전산화 작업(sequencing pipelines and databases)

유전체 분석 결과에 해당하는 방대한 정보를 데이터 베이스로 기록하고 정리하여, 효율적인 활용을 위한 전산화 작업을 수행한다.

인간유전체 외에도 여러 많은 미생물, 동물, 식물들의 유전 정체를 분석하는 작업들이 이미 완성되었거나 현재 진행 중이다. 이러한 유전자 기술이 응용되면 의료 현장에서 치료나 농작물의 품종 개량에 도움이 될 것이라고 기대할 수 있으므로, 미국을 중심으로 일본이나 유럽 등에서 빠른 성과를 목표로 연구를 하고 있다.

식물 유전체분석

식물 연구분야에서 대표적인 모델인 애기장대는 2001년에 속씨식물 중 최초로 유전체 분석이 완성되었다.1) 이후에 를 비롯한 여러 식물의 유전체 분석이 완성되거나 진행되고 있다. 2017년 8월 기준으로 236 속씨식물의 유전체 염기서열 분석이 완료되었으며,2) 이로써 속씨식물 64목(order) 중 32목(50%)의 염기서열 정보가 확보되었다. 이들 대부분은 경제적으로 중요한 가치를 지니고 있는 것들이 주로 포함되어 있다.

참고문헌

1. Huala E, Dickerman AW, Garcia-Hernandez M (2001) The Arabidopsis Information Resource (TAIR): a comprehensive database and web-based information retrieval, analysis, and visualization system for a model plant. Nucleic Acids Research 29: 102–105
2. Fei C, Wei D, Jiawei Z등 (2018) The Sequenced Angiosperm Genomes and Genome Databases. Frontiers in Plant Science 9: 418-431