유전자

유전자

[ gene ]

유전자는 유전형질의 기능적 단위 모든 생명체가 세포 내에 가지고 있는 유전체 DNA의 특정 부위에 위치하는 정보서열로서 세포를 형성하며 유기적 생명현상을 유지하는 데 필요한 단백질 등을 생산해낼 수 있는 정보를 담고 있으며, 각 개체 고유의 특징을 나타내게 할 뿐만 아니라 복제를 통해 다음 세대의 자손에게 유전된다. 좁은 의미에서 유전자는 DNA 서열 상에서 특정 단백질의 아미노산 사슬을 만드는 정보서열(coding DNA sequence, CDS)이 위치한 부위만을 의미하나, 넓은 의미에서는 단백질을 직접 만들지 않더라도 다양한 기능을 하는 RNA를 만드는 부위와 그 전사과정을 조절하는 부위까지 포함하기도 한다.

출처: GettyImages-1128181273

목차

명칭의 역사

유전형질이 부모에서 자식으로 유전되는 현상은 오래 전부터 잘 알려져 있었고, 유전학의 아버지라 불리는 그레고어 멘델(Gregor Mendel)에 의해 부모로부터 물려받는 유전형질의 발현이 통계적으로 예측될 수 있다는 것이 밝혀졌지만, 실제로 전달되는 유전인자(genetic element)의 정체가 무엇인지는 1950년대까지 알려지지 않았다. 멘델은 완두콩을 이용한 7년 간의 실험을 정리하여 1865년 <식물 잡종에 관한 연구>라는 제목의 논문을 발표하면서 소위 ‘멘델의 유전법칙’을 제시하였으나 이때는 아직 ‘유전자’라는 용어를 사용하지 못했고, 대신 ‘특질(trait)’이라는 용어로 유전형질의 매개체를 묘사하였다. ‘유전자’라는 명칭은 1909년 덴마크의 유전학자 빌헬름 요한센(Wilhelm Johannsen)이 처음 사용하기 시작했다. 요한센은 이전에 존재한 다윈의 ‘제뮬(gemmule)’, 바이스만의 ‘결정자(determinant)’, 휴고 드 브리스(Hugo de Vries)의 ‘판겐(pangen)’ 등 전성설과 관련이 깊은 선배들의 용어에서 벗어나 자신의 용어를 만들고 싶어했고 판겐의 마지막 음절만 남겨 ‘유전자(gene)’라는 용어를 만들었다. 당시 바이스만에 의해 ‘유전현상이 체세포와는 관련이 없고 오직 생식세포에 의해서만 전달된다’는 ‘바이스만 장벽(Weismann barrier)’이라는 개념이 알려지기 시작하던 때라 ‘전체’를 뜻하는 ‘pan’을 생략하고 ‘gene’만 남기게 된 것이다. 처음에는 개념적 유용성 때문에 사용되었지만 차츰 실재하는 물질적 실체로 인정된 것은 더 뒤의 일이다. 처음 유전자라는 말이 사용된 이후 유전학은 지식을 축적하여 발전을 거듭하다 1943년 생물의 형질을 운반하는 물질이 DNA임이 규명되면서 유전자가 DNA의 형태로 존재한다는 것이 밝혀졌다.

구조와 기능

세포 내에서 유전자는 DNA 서열 중 정보를 담고 있는 부분에 해당한다. 사람의 경우 유전자는 전체 유전체 DNA 중 단지 2%뿐이며, 나머지 98%는 비부호화(non-coding) 서열에 해당한다. 유전체의 대부분을 차지하는 비부호화 서열은 염색체의 동원체(centromere)와 말단소체(telomere)를 포함해 수천 수만 개의 반복구조를 가진 위성(satellite) DNA 등의 반복 서열과 무작위 서열로 구성되어 있다. 유전자에 해당하는 부호화 서열 내부에도 모든 DNA 염기서열이 정보를 가지는 것은 아니다. 아미노산 정보를 가지고 있는 부위를 엑손(exon)이라 하고, 정보를 가지지 않는 부위를 인트론(intron)이라 한다. 원핵세포인 미생물의 유전자는 진핵세포와 달리 인트론이 전혀 없고 유전자들이 촘촘히 배열되어 있어 비부호화 서열이 거의 존재하지 않는다. 예를 들어, 대장균의 유전체는 거의 대부분 인트론 없는 부호화 서열인 유전자로 채워져 있으며 비부호화 서열은 전체 유전체의 11% 정도에 불과하다. 이렇게 촘촘한 유전자 배열은 진화 과정에서 복제를 빠르게 할 수 있는 장점으로 작용했을 가능성이 크다.

크기와 수

사람의 경우 유전자의 평균 크기는 10~15 kb이다. 그러나 그 편차가 매우 심해서 가장 작은 것으로는 ~0.2 kb인 타이로신(tyrosine) tRNA 유전자가 있으며, 가장 큰 것으로 알려진 것은 ~2,500 kb 짜리 디스트로핀(dystrophin) 유전자까지 다양한 크기로 존재한다. 물론 이것은 내부의 인트론을 포함한 크기인데, 인트론이 없는 대장균 유전자의 경우 4,600 kb 크기의 유전체 안에 약 4,300개의 유전자가 존재하므로 유전자들이 촘촘히 배열되어 있다고 가정하면 평균 유전자 크기는 ~1 kb 정도라 볼 수 있다. 실제로 원핵생물의 유전자들 간에는 빈 공간이 매우 적으며 이것은 원핵세포에만 특징적으로 존재하는 오페론 구조 때문이기도 하다. 평균적으로 원핵생물의 유전자 크기는 ~0.9 kb이며 진핵생물의 부호화 서열 유전자 크기는 ~1.3 kb 정도로 알려져 있다.

유전자의 수는 생물의 진화단계에 따라 늘어난 것으로 보인다. 즉 현존하는 원핵생물 중 가장 작은 유전체 크기를 보유한 마이코플라즈마(mycoplasma)의 유전체는 470개, 대장균은 4,400개, 고초균의 경우 4,100개의 유전자를 가지고 있는 것으로 밝혀졌다 (표 1). 물론 진핵생물은 더 많은 유전자를 가지고 있다. 효모, 초파리, 선충의 경우 각각 6,200개, 13,600개, 18,400개의 유전자가 확인됐다. 사람의 경우는 2001년 인간 게놈 프로젝트(human genome project)가 끝난 이후 유전자 지도의 초안이 발표되면서 약 25,000개 정도로 예상되었으나, 2013년 공개된 인간 유전체 염기정보에 관한 최신판인 GRCh38에 의하면 사람의 부호화 유전자 수는 최종적으로 19,950개로 발표되었다. 세포 수가 약 1,000개에 불과한 예쁜꼬마선충(Caenorhabditis elegans)이 가지고 있는 유전자 수가 약 2만 개로 알려졌으며, 옥수수(32,000개), 쌀(50,000개), 밀(12만개) 등 대부분의 식물은 사람의 유전자 수보다 훨씬 많은 유전자를 가지고 있는 점을 감안하면 사람의 유전자 수가 예상보다 매우 적은 셈이다. 전체 유전체 중 비부호화 서열이 차지하고 있는 비율은 생물 종마다 매우 다르기 때문에 유전자 수는 유전체의 크기와 관련이 없으며, 생명체가 얼마나 고등한지와도 전혀 관련성이 없다고 여겨진다. 그러나 대체로 복잡한 생명체일수록 유전자 밀도(유전체 크기 당 유전자 수)는 감소하는 경향이 있다. 진핵생물의 유전자 밀도는 원핵생물보다 항상 낮으며, 매우 다양하다.

2016년 크레이그 벤터 연구소(J. Craig Venter Institute)에서 세상에서 가장 작은 게놈을 가진 합성 박테리아(Syn 3.0)를 만들어 내 사이언스(Science) 저널에 발표했다. 이 생명체의 유전자 수는 473개이며, 전체 DNA 길이는 53만 염기 쌍 밖에 안되었다. 즉 이 합성 박테리아의 유전체는 인간보다 약 130배 이상 조밀하게 구성되어 있다. 유전자 473개 가운데 정확한 생물학적 기능이 아직 알려지지 않은 것이 149개로 약 30%나 차지하고 있다. 우리가 아직 생명 현상에 꼭 필수적인 유전자 세트가 어떤 조합인지 아직 알아내지 못했음을 의미한다.

표 1. 미생물 유전체 상의 유전자 수.1)
Species Size of genome (Mb) Approximate number of genes
Bacteria
Mycoplasma genitalium 0.58 500
Streptococcus pneumoniae 2.16 2,300
Vibro cholerae El Tor N16961 4.03 4,000
Mycobacterium tuberculosis H37Rv 4.41 4,000
Escherichia coli K12 4.64 4,400
Yersinia pestis CO92 4.65 4,100
Pseudomonas aeruginosa PAO1 6.26 5,700
Archaea
Methanococcus jannaschii 1.66 1,750
Archaeoglobus fulgidus 2.18 2,500

집필

정우현/덕성여자대학교

감수

김은자/한국미생물학회

참고문헌

1. 한국미생물학회, 미생물학, 2017

동의어

Gene, gene, 유전자