인트론

인트론

[ Intron ]

단백질을 암호화하고 있는 염기서열은 3개의 연속된 뉴클레오티드 코돈(codon)으로 구성되어 있으며 단백질의 아미노산 서열을 결정하게 된다. 따라서 단백질을 암호화하고 있는 염기서열은 연속적으로 이어져있고 하나의 아미노산에 대한 코돈은 다음 아미노산의 코돈과 바로 연결되어 있다고 생각해왔다. 실제로 대부분의 박테리아에서는 위와 같은 형태로 염기서열이 구성되어 있지만 진핵세포의 경우 단백질을 암호화하고 있는 염기서열이 비암호(noncoding sequence)염기서열에 의해 분리되어 있는 것으로 밝혀졌다.

그림 1. 진핵세포의 유전자 구조(출처: 위키피디아, https://commons.wikimedia.org/w/index.php?curid=3355010)

진핵세포의 유전자는 모자이크형태로 단백질을 암호화하는 부분이 비암호 부분에 의해 분리되어 있고 이 중 단백질을 암호화하는 부분을 엑손(exon), 단백질을 만들지 않는 비암호 부분을 인트론(intron)이라 한다 (그림 1). 이러한 인트론은 단백질을 암호화하고 있는 유전자뿐만 아니라, rRNA(Ribosomal RNA), tRNA(transfer RNA)에서도 발견되는 것으로 알려져 있다. 인트론이라는 단어는 월터 길버트(Walter Gilbert)에 의해 처음으로 사용되었으며 Intragenic regions에서 유래되었다. 

목차

인트론의 발견

인트론은 아데노바이러스(Adenovirus)의 유전자 발현 연구를 진행했던 필립 샤프(Phillip Sharp)와 리차드 로버츠(Richard Roberts)교수팀에 의해 1977년에 처음으로 발견되었다. 이들은 아데노바이러스의 특정 전령 RNA와 아데노바이러스 DNA를 서로 결합시켰을 때 하나의 전령 RNA의 특정부분만 DNA와 결합하여 RNA: DNA 형태(R-loop)로 만들어지고 다른 부분이나 끝부분은 결합되지 않은 단일가닥 형태로 존재한다는 것을 확인하였다(그림 2). 또한 이 단일가닥 부위는 아데노바이러스 DNA의 다른 부위와 결합하여 RNA: DNA형태를 이룬다는 것을 알 수 있었다. 따라서 하나의 전령 RNA에 포함된 염기서열은 원래부터 연결된 것이 아니라 전사 이후에 서로 재결합된 것이라 결론을 내리게 되었다. 

그림 2. R-loop의 형성(인트론의 발견)(출처: 위키피디아, https://commons.wikimedia.org/w/index.php?curid=32331555) 

인트론의 개수

인트론의 수는 유전자마다, 그리고 유사한 유전자라고 하더라도 종마다 매우 다양하다. 그리고 복잡한 생명체로 갈수록 인트론의 수가 점차 증가하는 양상을 나타낸다 (그림 3).

1) 효모의 유전자 : 약 200여개의 유전자만 인트론을 포함하며 이 유전자들 대부분이 1개정도의 인트론을 포함

2) 닭의 proα2 유전자 : 약 50개의 인트론을 포함

3) 인간의 Titin 유전자 : 363개의 인트론을 포함

그림 3. 하나의 유전자에 대한 인트론의 개수

인트론의 길이

인트론의 길이도 유전자마다 매우 다양한 것으로 알려져 있고, 심지어 단백질을 암호화하는 엑손보다 그 길이 훨씬 긴 경우도 쉽게 발견된다. 일반적으로 엑손의 길이는 약 150 뉴클레오티드이지만, 인트론의 경우 이보다 짧기도 하지만 약 800,000 뉴클레오티드의 인트론까지 발견되었다.

[예] 포유류의 디히드로폴레이트 환원효소(Dihydrofolate reductase) 유전자: 전체유전자의 길이에서 단백질을 암호화하는 부위는 10% 내외임.

- 전체 유전자의 길이 : 31,000 뉴클레오티드

- 전령 RNA : 2,000 뉴클레오티드 (6개 엑손으로 구성)

- 인트론의 길이 : 29,000 뉴클레오티드

인트론에 의한 유전자 발현 변화

인트론의 수가 많아질수록 해당 유전자의 길이가 길어지게 되는데 이는 유전자 발현에도 직접적으로 영향을 미칠 수 있다. 예를 들면, 인간의 디스트로핀(dystrophin) 유전자의 길이는 약 2,400,000 뉴클레오티드이다. 이 유전자에 대해 하나의 전사체(transcript)를 만들기 위해서는 RNA 중합효소가 약 17시간동안 DNA를 따라 이동하면서 전사신장과정을 거쳐야 한다.

(RNA 중합효소의 RNA 합성속도 : 40 뉴클레오티드/초, 144,000 뉴클레오티드/1시간)

따라서 진핵세포 유전자의 인트론 수 및 인트론의 길이가 각 유전자의 발현정도를 조절하는 하나의 조절 기작이 될 수도 있다.

인트론의 운명

앞서 언급한 바와 같이, 인트론은 유전자에 포함되어 있지만 실제 단백질을 암호화하지 않기 때문에 단백질로 번역되기 전에 RNA 스플라이싱(RNA splicing)과정을 통해 반드시 제거되어야 한다. 진핵세포에서 RNA 중합효소가 전사과정을 거쳐 만들어내는 첫 번째 RNA는 전구체 RNA(precusor RNA)라고 하면 이는 엑손과 인트론을 모두 포함하고 있다. 이 전구체 RNA에서 인트론만을 특이적으로 제거하는 과정을 RNA 스플라이싱이라 하며, 인트론이 제거되고 직접 단백질로 번역될 수 있는 RNA는 성숙된 mRNA(Mature mRNA)라 한다 (그림 4).

그림 4. RNA 스플라이싱을 통한 인트론의 제거 (출처: 한국분자·세포생물학회)

또한 인트론은 스플라이싱에 의해 제거된 후 대부분 올가미(Lariat)를 이루게 되고 이는 세포내에 있는 핵산가수분해효소에 의해 빠르게 분해되는 것으로 알려져 있다. 

인트론의 일반적인 구조

인트론은 스플라이싱 과정에서 제거되어야 하는 염기서열로 각 인트론에는 자신이 제거될 수 있도록 도와주는 특정 염기서열들을 포함하고 있다.

5’ 스플라이스 부위

엑손과 인트론이 맞물려 있는 부위로 인트론의 처음에 있는 "GU" 염기서열이 대부분의 인트론에서 잘 보존되어 있는 것으로 알려져 있다. 5‘ 스플라이스 부위를 다른 말로 donor라 한다 (그림 5).

가지분기점(Branch point)

가지분기점은 주로 엑손의 3‘ 말단 쪽에 위치하며 중간에 있는 "A(아데닌)"이 가지분기점에서 가장 중요한 역할을 한다 (그림 5). 가지분기점에 이어서 폴리피리미딘(polypyrimidine) 부위(Y11)가 일반적으로 나타난다.

3‘ 스플라이스 부위

인트론과 엑손이 맞물려 있는 부위로 인트론의 끝에 있는 "AG" 염기서열이 잘 보존되어 있으며, 다른 말로 acceptor라고도 한다 (그림 5). 

그림 5. 스플라이싱에 관여하는 RNA 염기서열 (출처: 한국분자·세포생물학회)

관련용어

엑손(Exon), RNA 스플라이싱(RNA 스플라이싱), RNA 처리과정(RNA processing), R-loop, I군 인트론(Group I intron), II군 인트론(Group II intron)

참고문헌

Molecular Biology of the Gene (7 판)