개방형 해독틀

개방형 해독틀

[ open reading frame ]

약어 ORF

목차

정의

mRNA로 전사되었을 경우, 단백질 생합성 기구에 의해 단백질로 번역될 수 있는 DNA서열을 의미한다. 어떤 DNA 염기서열이 mRNA로 전사된다고 가정할 때, 개시코돈(Start codon)과 종결코돈(Stop codon)을 가지고, 그들 사이에 아미노산을 암호화하는 코돈의 연속적인 배열을 가질 때, 개방형 해독틀(Open reading frame)이라고 한다. DNA는 구조적으로 이중나선으로 역평행의 두 가닥(Anti-parallel two strands)으로 이루어져 있고, 한 가닥에 3개의 염기로 이루어진 코돈의 해독틀이 3N, 3N+1, 3N+2과 같이 3가지가 가능하므로 DNA단편은 항상 여섯 개의 가능한 해독틀을 갖는다. 이러한 여섯 개의 가능한 해독틀이 모두 단백질로 번역되지는 않는다. 세포 내에서 DNA서열이 단백질로 번역되기 위해서는 DNA서열에 전사에 필수적인 프로모터(Promoter)와 번역에 필수적인 리보솜 결합 부위(Ribosome binding site)를 개시코돈 상위부위에 적절히 갖추어야 하고, 개시코돈과 종결코돈 사이에 3의 배수에 해당하는 염기서열을 가질 경우, 비로소 DNA서열이 단백질로 발현될 수 있게 된다.

여섯 개의 해독틀 DNA 이중 나선은 두 역평행 가닥을 갖고 있으며, 각 서열은 3개의 그룹인 트리플렛 코드로 전사되기 때문에, DNA 가닥은 서로 구분되는 여섯 개의 해독틀을 가질 수 있다. 일반적으로 이 중 하나의 해독틀이 기능적인 단백질을 암호화 하는 서열로 사용된다. 아주 드물지만 개방형해독들이 겹치는 경우도 있다. (출처: 한국미생물학회)

원핵생물에서 단백질로 번역될 수 있는 DNA서열은 mRNA로 전사되었을 경우 개시코돈(대부분 AUG이고, 적은 빈도로 GUG, UUG)부터 종결코돈(UAA, UAG, UGA)의 직전까지 3의 배수로 이루어진 염기서열이 된다.

개방형 해독틀의 예측

개방형 해독틀의 존재가 반드시 그 서열이 전사를 거쳐 번역되는 것을 의미하지는 않는다. 실제로 세포 안에서 어떤 DNA서열이 mRNA로 전사되고 단백질로 번역되는지는 실험적으로 확인해야 한다. 그렇지만 관심있는 모든 DNA단편을 실험을 통해 직접적으로 확인하는 데에는 많은 시간과 비용이 발생하므로, DNA서열상에서 개방형 해독틀을 예측할 수 있는 다양한 프로그램들이 개발되었다. 개방형 해톡틀을 분석함으로써 DNA서열에서 기능적인 RNA나 단백질을 암호화 하는 유전자의 존재와 위치를 예측할 수 있고, 최종 단백질로 번역될 수 있는 추론된 아미노산 서열(Deduced amino acid sequence)도 예측이 가능하다.

ORF finder

NCBI(National Center for Biotechnology Information)에서 제공하는 뉴클레오티드 서열로부터 선택할 수 있는 최소크기의 모든 개방형 해독틀을 예측하고 분석하기 위한 그래픽 분석도구이다. 추론된 아미노산 서열은 다양한 형식으로 저장될 수 있고 BLAST 서버를 사용해 데이터베이스와 비교할 수 있다.

ORF finder 출처:https://www.ncbi.nlm.nih.gov/orffinder/

ORF Investigator

암호화 또는 비암호화 서열에 대한 정보를 주는 것뿐만 아니라 다른 유전자와 DNA 영역 서열간 Pairwise global alignment을 수행할 수 있다. 서열간의 Pairwise global alignment은 단일 염기 다형성(Single nucleotide polymorphism)을 포함하는 돌연변이를 발견하는데 편리하다. 유전자서열에서 개방형 해독틀을 찾는데 효율적이며, 찾아낸 개방형 해독들로부터 단일 문자 아미노산으로 변환된 단백질 서열을 보여준다1).(

GLIMMER

GLIMMER(Gene Locator and Interpolated Markov ModelER)는 원핵생물 DNA에서 긴 개방형 해독틀을 찾는데 사용된다. 이것은 박테리아, 고균바이러스 등에서 유전자를 찾는데 효율적이다2).

개방형 해독틀의 실험적 확인

최근에는 시스템생물학적 접근 방법, 즉 오믹스(Omics)를 이용하여, 세포의 유전체 전체에서 어느 부분이 개방형 해독틀인지를 알아내고 확인할 수 있다. 먼저 단세포 또는 다세포 생명체의 유전체 서열을 차세대염기서열분석(Next generation sequencing, NGS) 방법으로 결정하고, 특정 조건에서 어떤 유전자들이 발현되는 지를 전사체(Transcriptome)분석을 통해 알아낼 수 있다. 전체 RNA를 세포로부터 분리하여 이를 역전사효소를 이용하여 cDNA로 전환시켜 유전체 서열 분석과 같은 NGS방법으로 분석하는데, 이를 RNA-seq이라고도 한다. 이러한 방법을 이용하여 유전체의 어느 부분이 RNA로 전사되는 지를 정확히 분석할 수 있다.

전사된 RNA가 단백질로 번역이 되는 지는 단백체(Proteome)분석을 통해 알아낼 수 있다. 위와 같은 시스템생물학적 방법을 이용하여 특정 실험 조건에서의 개방형 해독틀을 실험적으로 유전체 전체적으로 확인할 수 있다.

해독틀 이동 돌연변이(Frameshift mutation)

해독틀 이동 돌연변이(Frameshift mutation)는 DNA서열에서 하나 또는 3의 배수가 아닌 여러 개의 뉴클레오티드의 삽입 또는 결실에 의해 야기되는 돌연변이이다. 3개의 뉴클레오티드가 하나의 코돈을 지정하여 아미노산으로 번역되기 때문에, 3의 배수가 아닌 개수의 염기의 삽입 또는 결실은 본래의 해독틀을 어긋하게 한다. 그 결과, 삽입 또는 결실부위의 다음부터 전혀 다른 아미노산 서열의 번역을 일으킬 수 있다. 때로는 종결코돈의 위치를 이동시켜 번역되는 폴리펩티드는 비정상적으로 짧아지거나 길게 만들어 질 수 있는데, 종결코돈이 본래의 위치보다 빨리 나타나는 조기종결(Premature termination)로 인하여 세포 내에서 정상적으로 기능하지 못하는 원래길이 보다 짧은 단백질이 만들어지기도 한다.

해돌틀 이동 돌연변이는 무작위로 일어나거나, 외부로부터 돌연변이원(Mutagen)에 의해 야기된다. 해독틀에 3의 배수 만큼의 뉴클레오티드의 삽입 또는 결실은 해독틀 전체에 영향을 주지 않고 아미노산 하나의 삽입 또는 결실을 야기하기 때문에 해독틀이 달라지지 않는 해독틀이 맞는(in-frame) 돌연변이를 야기한다.

집필

이상준/중앙대학교

감수

석영재/서울대학교

참고문헌

1. Dhar, D., Kumar, M.S., 2012. ORF investigator: a new ORF finding tool combining Pairwise Global Gene Alignment. Research Journal of Recent Sciences 1, 32-35.
2. Delcher, A.L., Bratke, K.A., Powers, E.C., Salzberg, S.L., 2007. Identifying bacterial genes and endosymbiont DNA with Glimmer. Bioinformatics 23 (6), 673-679.

동의어

ORF, 개방형 해독틀(Open reading frame, ORF), 개방형 해독틀, open reading frame, 개방형 해독틀(Open reading frame; ORF), Open reading frame