단백질체학

단백질체학

[ Proteomics ]

단백질체학이란 생체내 존재하는 모든 단백질의 존재와 기능을 통합적인 시각에서 분석하여 파악하고자 하는 학문적 시도이다. 주어진 생체, 즉, 세포 (cell), 조직 (tissue), 기관 (organ), 전체 유기체 (entire organism) 등에 존재하는 모든 단백질의 한 세트인 단백질체 (proteome)와 생체 내 유전 정보와 그 발현 결과물의 한 세트의 기능과 상호 작용을 분석하는 과학과 공학의 한 분야인 오믹스 (omics)를 융합한 용어이다. 1980 년대 널리 연구가 시작된 유전자 세트에 대한 연구인 유전체학 (Genomics) 연구 결과, 유전자의 종류 보다 더 많은 단백질들이 존재하고, 그 단백질 조성은 생체 내외부의 변화에 의하여 크게 다를 수 있다는 사실이 드러나면서 1990년대부터 단백질체학의 중요성이 대두 되기 시작했다. 단백질체학은 개체 내 단백질 조성, 구조, 활성의 전체적 수준을 바라보는 노력이며, 현대 기능유전체학 (Functional genomics)을 가능하게 하는 중요 요소이다.

목차

용어와 역사

1950년대 DNA가 유전정보 물질이라는 사실이 알려지고, 1970년대에는 DNA 염기서열 분석과 분자적클로닝이, 1980 년대 PCR이 차례로 개발 되면서, 여러 유기체의 전체 DNA 염기 서열을 분석 하려는 노력이 널리 퍼지기 시작했다. 1986년 잭슨 연구소 (Jackson Laboratory)의 토마스 로더릭 (Thomas H. Roderick)이 유전체학 (Genomics)이라는 용어를 처음으로 사용했고, 그  이후  유사한 개념을 적용, 전사체학 (Transcriptomics), 대사체학 (Metabolomics) 등 여러가지 오믹스 (omics)들이 시도 되었다. 최초의 단백질체학 연구실을 설립한 마크 윌킨스 (Marc Wilkins)가 1994년 단백질체 (proteome)라는 용어를 사용하고, 1997년에는 단백질체학 (proteomics)이라는 용어가 학문 분야 전체에서 사용되기 시작했다.

학문적 의의와 필요성

유전체학을 통해서 여러 종의 다양한 유전체들이 확보되면서 떠오른 커다란 의문점은 유기체의 복잡성과 유전자의 수가 비례하지 않는다는 것이다. 2001년 사람 DNA염기서열 분석이 완료된 후 추정되던 약 30,000여개의 유전자 수는 1998년 최초의 다세포 생물 (multicellular organism) 유전체로서 분석된 예쁜꼬마선충의 19,000개 유전자와 큰 차이가 나지 않았다. 그 이후 전사체학이 발전하면서 발현되지 않는 유전자인 가유전자 (pseudogene)의 존재로 말미암아 현재 사람의 발현 유전자 수는 겨우 20,000개 정도로 추정되고, 추가적 분석이 진행된 예쁜꼬마선충의 경우에는 오히려 20,000 개 정도로 늘어나게 되어 유전체의 복잡도 (complexity)로 유기체 성질을 설명할 수 없다. 전사체학은 한 유전자로부터 선택적 스플라이싱 (alternative splicing)과 전사 후 변형 (post-transcriptional modification) 등으로 다양한 종류의 전사물 생성이 가능한 것을 보여줌으로써, 전사체는 유전체의 완전한 복제판이 전혀 아니라는 사실이 명확해 졌다. 또한, 전사체내 상당량의 RNA는 단백질로 번역되지 않는 비번역 RNA이고, 번역 가능한 mRNA역시 항상 번역 되는 것이 아니라는 것이 알려지면서, 단백질체에 대한 연구가 필요하게 되었다. 단백질체는 유전체와 전사체 보다 훨씬 더 다양하고 역동적이다. 생체의 종류 (세포, 조직, 기관, 유기체 전체 등)와 주어진 시간 (발생과 발달 과정), 그리고 생리 및 환경적 변화에 따라 매우 다양하게 나타날 수 있다. 또한, 인산화 (phosphorylation), 유비퀴틴화 (ubiquitination), 메틸화 (methylation), 아세틸화 (acetylation), 당화 (glycosylation), 산화 (oxidation), 질산화 (nitrosylation) 등의 번역 후 변형 (post-translational modification) 에 대한 분석도 아울러 필요하다. 따라서, 단백질체학은 실재 단백질의 존재를 확인하고, 그 양을 직접 파악할 수 있는 방법론을 제시한다.

단백질체학의 방법

유전체학의 기본적 방법은 주어진 세포나 조직, 유기체로부터 전체 DNA를 추출한 후, 판독 가능한 길이로 자른 후 염기 서열 분석을 진행하는 것이다. 전사체학은 RNA를 추출하여 역전사 효소로 cDNA를 만든 후 염기 서열을 분석한다. 단백질체학은 보다 복잡한 단계를 거치게 된다. 먼저 전체 단백질을 추출하여 적당히 절단 후 생성되는 펩티드를 고성능액체크로마토그래피 (High speed chromatography)와 같은 크로마토그래피 방법들과 2차 전기영동 (two dimensional electrophoresis)등의 방법으로 분석 가능한 단백질 시료로 분류한다. 이 시료를 질량 분석법 (mass spectrometry)을 이용, 단백질을 조성하고 있는 아미노산을 분석하고 그 순서를 연결 어떤 단백질인지를 알아 낼 수 있다 (그림 1). 이러한 기본적 방법에 항체를 이용하여 특정 단백질 및 그와 결합하는 단백질의 종류 등을 알아 낼 수 있다. 최근에는 수 천 개의 항체를 마이크로 규모로 작은 칩에 부착한 후 사람의 혈액과 같은 시료에 반응 시킨 후 분석하는 단백질 칩 (protein chip)등이 이용되기도 한다. 항체 대신 수 천개의 단백질이 부착된 칩을 이용하면 단백질-DNA, 단백질-RNA, 단백질-단백질 등의 결합 관계를 알아 낼 수 있다.

그림 1. 단백질체학 연구를 위한 과정. 세포와 같은 시료로 부터 단백질을 분리한 후 적당한 크기로 잘라 크로마토그래피로 분리해 낸 후 질량분석을 통하여 정확한 아미노산의 서열을 파악하여 단백질의 종류를 알아 낼 수 있다. (출처: 한국분자·세포생물학회)

관련용어

단백질체 (proteome), 오믹스 (omics), 유전체학 (Genomics), 기능유전체학 (Functional genomics), 유전체학 (Genomics), 전사체학 (transcriptomics), 대사체학 (Metabolomics),  가유전자 (pseudogene), 인산화 (phosphorylation), 유비퀴틴화 (ubiquitination), 메틸화 (methylation), 아세틸화 (acetylation), 당화 (glycosylation), 산화 (oxidation), 질산화 (nitrosylation), 번역 후 변형 (post-translational modification), 2차 전기영동 (two dimensional electrophoresis), 질량 분석법 (mass spectrometry), 단백질 칩 (protein chip)

참고 문헌

Yadav SP (December 2007). The wholeness in suffix -omics, -omes, and the word om. Journal of Biomolecular Techniques. 18 (5): 277.

P. James (1997). 'Protein identification in the post-genome era: the rapid rise of proteomics'. Quarterly Reviews of Biophysics. 30 (4): 279–331.

Paul R. Graves and Timothy A. J. Haystead. Molecular Biologist's Guide to Proteomics. Microbiol Mol Biol Rev. 2002 Mar; 66(1): 39–63.

What is proteomics?