유전체학

유전체학

[ genomics ]

유전체학 (genomics)은 유전체의 염기서열을 결정하는 연구, 유전체의 구조를 분석하는 연구, 유전체의 기능을 밝히는 연구, 유전체의 진화를 밝히는 연구 등을 이용하여 생명체의 유전체 (genome)를 연구하는 학문이다. 여기서 유전체란 체세포나 개체에 존재하는 유전 물질 혹은 유전자들의 완전한 세트를 말한다.

목차

유전체학이란 단어의 기원

유전체학은 유전체를 뜻하는 genome과 어떤 학문을 뜻하는 접미사인 -ics가 결합된 단어이다. –ics가 붙어있는 학문의 예는 많다. 예를 들어 physics (물리학), politics (정치학), mathematics (수학) 등이 그 대표적인 사례이다. 유전체를 뜻하는 genome이라는 용어도 유전자를 뜻하는 gene과 염색체를 뜻하는 chromosome의 두 단어를 합친 신조어다. 최근 분자생물학이 빠르게 발전하면서 새롭게 생겨나는 학문분야 또는 연구방법을 지칭하기 위한 신조어가 생겨나고 있다.

유전체학이라는 용어는 1986년에 인간 유전체 연구를 위해 가졌던 모임에서 잭슨 연구소 (Jackson Laboratory)에 근무하던 유전학자인 토마스 로더릭 (Thomas Roderick)이 만들어낸 단어라고 한다 (1).

인간의 전체 유전체 지도를 작성하기 위해 미국의 Bethesda에서 열렸던 국제학회에서 예일대학교의 프랭크 러들 (Frank Ruddle), 존스 홉킨스 대학교의 빅터 맥커식 (Victor McKusick), 잭슨 연구소의 토마스 로더릭 (Thomas Roderick)이 소규모의 회동을 가졌다. 이들은 학회 일정 중 학회장 근처에 있는 맥도날드에 가서 맥주를 마시면서 토론을 하다가 새로운 학술지를 만드는데 의견 일치를 보았다. 논의 끝에 토마스 로더릭 (Thomas Roderick)이 신생 학술지의 이름으로 유전체학이라는 이름을 제안했다고 한다. 이때부터 유전체학이라는 이름이 쓰이게 되었다. Genomics라는 이름의 학술지는 2017년 현재도 발행되고 있다.

유전체학의 발전

유전체학의 발전은 DNA 염기서열 결정 방법의 발전과 함께 하고 있다. 즉 유전체의 염기서열 정보를 갖고 있어야 유전체학 연구를 시작할 수 있기 때문이다.

초기의 DNA 염기서열 결정 방법은 원시적이었기 때문에 한번에 읽을 수 있는 염기 서열의 개수가 매우 제한적이었다. 이런 기술적인 한계로 인해 염기서열이 많이 있는 유전체를 분석하는 것은 불가능했다. 최초로 생명체의 유전체의 염기서열이 알려진 것은 1976년이었다. 벨기에의 겐트 대학교의 M. Ysebaert 교수의 연구팀은 박테리오파지 MS2 RNA의 전체 염기서열을 분석했다 (2). MS2 RNA의 염기 수는 3,569개였으며 그 안에 4개의 유전자를 갖고 있었다.

그 후 염기서열 결정 방법이 개량되면서 한번의 실험으로 읽을 수 있는 염기의 수가 조금씩 늘어나게 되었다. 1977년에는 박테리오파지 φX174의 전체 염기서열 (5,375개)이 알려지게 되었다 (3).

진핵생명체의 유전체의 전체 염기서열이 최초로 밝혀진 것은 1996년이다. 여러 나라의 연구진들이 모여서 컨소시엄을 구성하고 염기서열 분석을 공동으로 시도한 결과 1996년에 효모 유전체의 전체 염기서열이 밝혀졌다. 효모 유전체는 약 12.1Mb의 염기 쌍을 갖고 있었다 (4). 사람 유전체에 들어있는 염기서열 초안은 다국적 Human Genome Project에 의해 2001년에 발표되었다 (5). 2001년에 만들어진 초안은 여러 사람의 염색체 (chromosome)의 염기서열을 합친 것이었다. 한 사람의 유전체 전체 염기서열은 2003년에 밝혀졌으나 여러 보완작업을 통해서 2007년에 이르러서야 완벽한 형태의 한 사람의 유전체 염기 서열이 밝혀지게 되었다. 

유전체학의 분야

기능 유전체학 (functional genomics)

유전체에 담겨 있는 정보를 이용해서 유전자 혹은 단백질의 기능을 연구하는 학문이다. 특히 유전자를 암호화하고 있는 염기서열로부터mRNA가 만들어지는 과정인 전사, mRNA로부터 단백질이 만들어지는 과정인 해독 (또는 번역), 유전자의 발현 조절, 단백질과 단백질 사이의 상호작용을 밝히는 연구를 포함한다. 기능 유전체학의 또 다른 목적은 유전체 내에 담겨 있는 정보가 어떻게 표현형으로 이어지는지에 대한 메커니즘을 규명하는 것이다. 즉 유전자나 전사체, 혹은 단백질에 저장되어 있는 정보가 개체의 발생/발달을 어떻게 조절하고 어떤 표현형을 만드는지에 대한 연구이다.

기능 유전체학은 유전자의 기능을 연구함에 있어서 유전자 하나 하나를 연구하는 것이 아니라 전체 유전체 수준에서 분석하는 것이 특징이다. 이런 분석이 가능해진 이유는 고속 대용량 분석이 가능한 실험 방법이 개발되었기 때문이다. 기능 유전체학(functional genomics)에서 사용되는 실험 방법에 대해서는 아래를 참조하길 바란다.  

기능 유전체학에서 사용되는 실험 기법은 실험 대상이 무엇이냐에 따라 구분할 수 있다. 예를 들어 전사체 (transcripts)의 기능을 연구하기 위한 전사체학 (transcriptomics), 단백질체 (proteome)의 기능을 연구하기 위한 단백질체학 (proteomics), 대사체 (metabolome)의 기능을 연구하기 위한 대사체학 (metabolomics)등이 있다. 이들에 대한 구체적인 설명은 해당 문서를 참조하길 바란다.

DNA 수준

특정한 유전자의 구조를 파괴하거나 그 유전자의 발현을 억제한 후 생명체에서 나타나는 현상을 연구한다. 이렇게 하면 유전자의 기능을 알아볼 수 있는 장점이 있다. 이 때 사용하는 방법 중에 대표적인 것은 돌연변이유발 (mutagenesis) 방법이며 그 가운데 기능 손실 돌연변이 제조 방법이 가장 널리 사용된다.

그림 1. 돌연변이에 의해서 눈이 없어진 초파리(왼쪽 사진)와 정상 눈을 가진 초파리 (오른쪽 사진). ()

예를 들어, 어떤 유전자를 망가뜨리거나 그 유전자의 발현을 인위적으로 억제하였더니 초파리에서 눈이 생기지 않았다고 가정해보자 (그림 1). 그 유전자의 기능을 무엇일까? 그 유전자가 정상적으로 기능하는 상황에서 그 유전자는 초파리에서 눈을 만드는데 관여할 것이라고 생각하는 것이 타당할 것이다. 이런 원리를 이용하여 어떤 유전자의 기능을 알아볼 수 있다.

RNA 수준

DNA로부터 전사가 일어나서 mRNA가 만들어지는 것이 일반적인 유전 정보의 흐름이다. 유전체학에서는 mRNA 전체를 연구대상으로 삼기도 한다. 이 때 사용하는 방법중의 하나는 마이크로어레이 (microarray 혹은 유전자미세배열이라고 부르기도한다)이다. 마이크로어레이 (microarray) 방법은 특정한 유전자에서 만들어지는 mRNA의 양이 얼마나 되는지 알아보는데 사용한다.

구체적인 실험 방법은 아래와 같다. 특수한 처리를 한 표면에 탐침으로 사용할 염기서열을 고정시키고 특정 시료에서 추출한 전체 mRNA를 이 표면에 혼성화시킨다. 만약 특정한 유전자에서 전사된 mRNA가 많이 존재하면 혼성화 신호가 강하게 나타날 것이다. 반대로 어떤 유전자에서 전사된 mRNA가 적게 존재하면 혼성화 신호가 약하게 나타날 것이다.

예를 들어 잎에서 추출한 mRNA를 마이크로어레이에 혼성화시키고 (이를 마이크로어레이 A라고 하자), 뿌리에서 추출한 mRNA를 다른 마이크로어레이에 혼성화시킨 후 (이를 마이크로어레이 B라고 하자) 이 두 마이크로어레이간에 나타나는 혼성화 신호의 차이를 분석한다. 어떤 유전자 X가 B보다 A에서 강한 혼성화 신호를 보였다면, 그 유전자 X는 잎에서 주로 발현하는 유전자라고 결론 내릴 수 있다. 만약 어떤 유전자 Y가 A보다 B 에서 강한 혼성화 신호를 보였다면 그 유전자 Y는 뿌리에서 주로 발현하는 유전자라고 결론 내릴 수 있다. 만약 어떤 유전자 Z가 A와 B에서 동일한 혼성화 신호를 보였다면 Z유전자는 잎과 뿌리에서 동일한 양으로 발현하는 유전자라고 결론 내릴 수 있다. 이 원리를 이용하여 조직, 개체, 날짜 등 서로 다른 조건 간에 나타나는 유전자 발현 양의 차이를 조사할 수 있다 (그림 2).

그림 2. 잎과 뿌리에서 분리한 RNA를 사용하여 각 조직에서 주로 발현하는 유전자를 알아보기 위한 마이크로어레이 실험. 만약 어떤 유전자가 뿌리보다 잎에서 강한 발현을 보인다면 그 유전자는 마이크로어레이에서 붉은 색으로 보인다. 어떤 유전자가 잎과 뿌리에서 비슷한 발현 양을 보인다면 그 유전자는 마이크로어레이에서 노란색으로 보인다. 어떤 유전자가 잎보다 뿌리에서 강한 발현을 보인다면 그 유전자는 마이크로어레이에서 녹색으로 보인다. ()

단백질 수준

단백질과 단백질 간의 상호작용을 알아보는데 가장 널리 사용되는 방법은 yeast two-hybrid 방법 (이 방법은 효모단백질잡종법이라고 부르기도 한다)이다. 이 방법은 두 개의 단백질이 서로 결합하는지 여부를 검증하는 목적으로 사용하는 실험이다. 이 방법은 GAL4라고 하는 전사조절인자가 제대로 작동하기 위해서 DNA 결합 부위와 전사 활성화 부위가 모두 존재해야한다는 특성을 이용한다. 즉, A단백질을 GAL4의 DNA 결합 부위와 부착시키고, B 단백질을 GAL4의 전사 활성화 부위에 부착시킨다. 이렇게 ‘A+DNA결합부위’와 ‘B+전사활성화부위’를 만들고 이 둘을 효모에 집어넣는다. 만약 이 A와 B 두 단백질이 효모 안에서 서로 결합을 한다면 이 두 단백질에 결합되어 있는 GAL4의 DNA 결합 부위와 전사 활성화 부위가 서로 가까이 인접하게 된다. 즉 A단백질과 B 단백질이 효모 안에서 서로 결합하면 GAL4가 전사조절인자로서 기능하게 된다. 이런 원리를 이용하여 두 단백질 간의 단백질-단백질 상호작용을 테스트한다.

구조 유전체학 (structural genomics)

구조 유전체학은 한 유전체 안에 들어있는 모든 단백질의 3차원 구조를 규명하는 것을 목표로 한다. 단백질이 기능하기 위해서는 그 단백질의 3차원 구조가 매우 중요하다. 구조 유전체학에서는 실제 실험을 이용하여 단백질의 3차원적 구조를 결정하는 방법과 컴퓨터 프로그램을 이용하여 단백질 구조를 모델링하는 방법을 사용한다. 일단 단백질의 3차원 구조가 규명되면 모델링 방법을 이용하여 이와 비슷한 아미노산 서열을 가진 단백질의 3차원 구조도 예측해볼 수 있다.

이 구조 유전체학을 이용하게 되면 신약 개발도 가능하다. 예를 들어 약으로 작용하는 분자의 3차원 구조를 밝힌 후 이 분자 구조를 어떻게 바꾸면 표적 단백질과 더 잘 결합하게 되는지 연구한다. 이 원리를 이용하여 개발중인 약제의 약효를 더 좋아지게 하는 연구가 가능하다. 

메타유전체학 (metagenomics)

메타유전체학은 특정한 환경에서 직접 채취한 시료를 대상으로 실시하는 유전체학을 말한다. 예를 들자면 인간의 소장에서 채취한 미생물 집단, 폐광에서 흘러나오는 오염수로부터 채취한 미생물 집단, 혹은 특정한 장소의 토양에서 채취한 미생물 집단을 대상으로 하여 유전체학 연구를 실시하는 것을 말한다. 이 메타유전체학이전에 해왔던 유전체학은 특정한 조건에서 배양한 단일 시료를 대상으로 분석했다. 예를 들어 특정한 미생물을 단독 배양하여 그 미생물에 대한 유전체 정보를 분석한 것에 그쳤다. 그러나 메타유전체학 방법을 사용하게 되면 매우 다양한 미생물 군집에 대한 정보를 한번에 얻을 수 있다. 이 메타유전체학이 가능해진데에는 DNA염기서열 결정방법이 고속화되고 염기서열 결정하는데 소요되는 비용이 매우 저렴하게 되었기 때문이다.

후성유전체학 (epigenomics)

후성유전체학은 세포내에 존재하는 유전물질의 후성적 변화 (epigenetic modification) 전체에 대한 연구를 말한다. 후성적 변화란 DNA 염기서열상에는 아무런 변화가 없으나 유전자의 발현에는 영향을 끼치는 변화를 말한다. 이런 대표적인 사례로는 DNA염기상에 일어나는 메틸화, DNA를 감싸고 있는 히스톤 단백질에 일어나는 변화가 있다. 이런 후성적 변화는 DNA 상에 일어나는 돌연변이와 큰 차이가 있다. DNA상에 일어나는 돌연변이는 영구적이기 때문에 일단 일어난 돌연변이는 원래대로 되돌리기가 거의 불가능하지만 후성적 변화는 가역적이다. DNA 상에 일어나는 메틸화는 메틸화의 여부에 따라 유전자의 발현이 억제되기도 했다가 다시 정상으로 돌아오기도 한다. 후성적 변화가 세포의 분화와 발달에 매우 중요한 역할을 한다는 것이 최근 밝혀지고 있기 때문에 후성유전체학은 최근 각광받는 분야로 떠오르고 있다.

참고문헌

1. Yadav SP (December 2007). 'The wholeness in suffix -omics, -omes, and the word om'. Journal of Biomolecular Techniques18 (5): 277.

2. Fiers W, Contreras R, Duerinck F, Haegeman G, Iserentant D, Merregaert J, et al. (April 1976). 'Complete nucleotide sequence of bacteriophage MS2 RNA: primary and secondary structure of the replicase gene'. Nature. 260 (5551): 500–7. 

3. Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, Hutchison CA, Slocombe PM, Smith M (February 1977). 'Nucleotide sequence of bacteriophage phi X174 DNA'. Nature265 (5596): 687–95.

4. Goffeau A, Barrell BG, Bussey H, Davis RW, Dujon B, Feldmann H, Galibert F, Hoheisel JD, Jacq C, Johnston M, Louis EJ, Mewes HW, Murakami Y, Philippsen P, Tettelin H, Oliver SG (October 1996). 'Life with 6000 genes'. Science274 (5287): 546, 563–7.

5. McElheny V (2010). Drawing the map of life : inside the Human Genome Project. New York NY: Basic Books.