유전체

유전체

[ genome ]

유전체는 한 생명체의 전체 유전 물질을 지칭하며, 주로 DNA로 구성되어 있다. 일반적으로 핵 내에 존재하는 유전자들의 집합을 의미하지만 미토콘드리아와 엽록체 내에도 자체 유전체를 가지고 있다. 사람을 포함한 다양한 생물의 전체 유전체 정보가 밝혀지면서 생명 현상을 유전체 수준에서 연구하는 것이 가능해졌다.

목차

어원 및 정의

유전체(genome)라는 용어는 유전자(gene)와 염색체(chromosome)의 합성어로 한스 빙클러(Hans Wincker)에 의해 1920년에 제안되었다. 최근 생물학 연구에 전사체(transcriptome), 단백질체(proteome), 대사체(metabolome) 등과 같이 어떤 종류의 전체를 의미하는 접미사로 "-ome"을 사용하고 있는데, 유전체는 한 생명체의 유전 물질 전체를 의미한다. 즉, 유전체 내에는 생명체를 구성하고 유지하는데 필요한 모든 유전자의 정보를 저장하고 있으며, 각각의 생물 종은 자신만의 독특한 유전체를 가짐으로써, 종의 특이성 및 다양성을 가지게 된다. 독일어식으로는 게놈, 영어식으로는 지놈이라고도 불린다.

유전체의 구성 및 종류

대부분의 생명체는 유전체가 DNA로 구성되어 있으며, RNA 바이러스의 경우 예외적으로 RNA가 유전체를 구성한다. 유전체는 일반적으로 핵 안에 저장된 전체 DNA를 의미하지만, 미토콘드리아 또는 엽록체와 같은 세포내 소기관 내부에도 DNA가 존재하여 자체의 유전체를 가지고 있다. 유전체는 보통 핵 안에 생물종 마다 일정한 수의 염색체로 나뉘어져 있다. 체세포의 핵 안에 존재하는 유전체는 선형의 이중가닥 DNA로 이루어진 여러 개의 염색체가 한 쌍씩(이배체: diploid) 존재하지만, 일부 생명체는 동일한 염색체가 3개씩 (삼배체: triploid) 또는 4개씩 (사배체: tetraploid) 존재하는 경우도 있다. 생식세포의 핵 안에는 체세포의 핵에 존재하는 염색체의 절반만 가진 유전체를 가지고 있다. 한 세포 내에는 수백 개에서 수천 개씩 존재하는 미토콘드리아와 엽록체가 있으며 이들은 핵이 없는 박테리아와 마찬가지로 일반적으로 선형이 아닌 구형의 DNA 이중가닥 구조로 이루어진 유전체로 이루어져 있다. 하나의 미토콘드라 또는 엽록체 내에는 일반적으로 수 개에서 수십 개의 유전체가 존재한다.   

전체 유전체 정보의 해독

한 가지 생물종으로부터 전체 유전체 정보를 밝힌다는 것은 일차적으로 전체 DNA 염기 서열을 밝힌다는 것을 의미한다. 한 개체 내에 존재하는 모든 세포는 특별히 예외적인 경우를 제외하고 핵 안에 동일한 정보를 지닌 유전체를 가지고 있다. 따라서, 잎에서 분리한 DNA에서 분석한 유전체 정보는 같은 개체 내의 다른 조직으로부터 분리한 DNA의 유전체와 같은 정보를 가지고 있다.

유전체의 전체 DNA 염기서열 분석을 위해서는 막삼-길버트 방법(Maxam-Gilbert sequencing)과 생어 방법(Sanger sequencing)과 같은 고전적인 방법을 이용하거나, 최근 개발된 차세대 염기서열 분석 방법(next-generation sequencing)과 같은 대량발굴 탐색법(high-throughput)을 이용한다. 1970년대 말 바이러스의 유전체 분석이 최초로 보고되었으며1)2) 1990년대 중반부터 다양한 생명체의 유전체 정보가 해독이 되었다. 1995년 생명체에서는 최초로Haemophilus influenza 박테리아의 유전체 정보가 밝혀졌으며,3) 사람을 포함한 다양한 동물과 식물의 전장유전체 정보가 해독되었다.(표1)

표1. 유전체 정보가 해독된 주요 생물종의 특성
생물 종 (학명) 유전체 크기 (염기쌍) 유전자 개수 특징
대장균 (Escherichia coli) 4,600,000 4,288
효모 (Saccharomyces cerevisiae) 12,100,000 6,294 진핵생물에서 최초로 밝혀진 유전체
애기장대 (Arabidopsis thaliana) 135,000,000 27,655 식물에서 최초로 밝혀진 유전체
초파리 (Drosophila melanogaster) 175,000,000 13,600
사람 (Homo sapiens) 3,289,000,000 20,000

전체 유전체 정보가 해독된 생물종들은 수백만 개에서 수십억 개의 다양한 유전체 크기를 가지고 있지만, 유전자의 개수는 수천 개에서 수만 개로 이루어져 있다. 예를 들어, 대장균의 유전체는 460만개의 DNA 염기 쌍이 4,000여개의 유전자를 암호화하고 있다. 사람은 대장균보다 70배 이상 많은 32억개의 DNA 염기 쌍을 가지고 있지만, 2만여개의 유전자만을 암호화하고 있다. 이러한 이유는 사람의 유전체에는 유전자를 암호화하지 않은 많은 반복서열이 존재하기 때문이다. 식물에서 가장 큰 유전체 크기를 가지고 있는 멜란티움과(Melanthiaceae)의 Paris japonica는 무려 사람보다 거의 50배 많은 1500억개의 DNA 염기 쌍으로 이루어져 있을 것으로 추정된다. 2017년까지 225종의 식물로부터 전체 유전체 정보가 해독되었다. 

유전체 활용분야

하나 또는 일부 유전자의 기능을 하나씩 밝히는 것을 전통적인 유전학으로 정의한다면, 전체 유전자들의 집합인 유전체의 분석을 통해 유전자들의 기능을 연구하는 학문분야를 유전체학이라고 부른다. 유전체학 분야에서는 DNA 염기서열을 대량발굴탐색할 수 있는 차세대염기서열분석 기법을 활용하여 다양한 생물종의 유전체의 구조를 밝히고 있다. 유전체가 암호화하고 있는 유전자들을 발굴하고 기능을 연구하기 위해서는 대용량의 데이터를 분석하는 생물정보학이 활용되고 있다. 또한, 이미 밝혀진 유전체들간의 상호비교를 통해 비교유전체학적 연구와 유전체 진화학 등이 활발하게 연구되고 있다. 한편, 유전체가 밝혀진 생물종 내에서는 개체간 또는 집단간의 유전적 변이를 연구가 용이하여 질병원인 유전자를 포함한 다양한 유용 유전자들에 대한 연구가 가능하다.   

참고문헌

1. Fiers W; Contreras, R.; Duerinck, F 등 (1976) Complete nucleotide-sequence of bacteriophage MS2-RNA – primary and secondary structure of replicase gene. Nature, 260: 500–507 
2. Sanger, F.; Air, G.M.; Barrell, B.G 등 (1977) Nucleotide sequence of bacteriophage phi X174 DNA. Nature, 265: 687–695 
3. Fleischmann R; Adams M; White O 등 (1995) Whole-genome random sequencing and assembly of Haemophilus influenzae Rd. Science, 269: 496–512