범유전체

범유전체

[ Pangenome ]

범유전체(Pangenome)는 단일 계통학적 분류군에 속한 모든 생물 개체가 보유한 유전자 종류의 총합으로 정의된다. 하지만, 미생물학에서의 범유전체는 주로 종(species) 수준에 한정되어 논의되고 있다.1) 일반적으로 하나의 미생물 종은 서로 다른 여러 균주로 구성되어 있다. 따라서, 범유전체는 종 내 모든 균주에 의해 공유되는 유전자 집합(핵심유전체 또는 core genome)과 일부 균주에서만 특이적으로 나타나는 유전자의 집합(부속유전체 또는 accessory genome)로 구성된다.

핵심유전체을 구성하는 유전자들의 분자기능을 종합하면, 진화•생태•생리적 측면에서 해당 미생물 종의 고유성을 이해할 수 있다. 반면, 부속유전체 분석을 통해 종 내 개별 균주의 특이성을 파악할 수 있다. 2000년 중반 부터 개발되기 시작한 차세대염기서열결정법의 보편화와 생물정보학의 발전으로 인해, 다수의 미생물 종에 대한 범유전체 분석이 진행되고 있다.

목차

용어 및 의미

  • 범유전체(Pangenome): pan-genome 또는 supra-genome으로도 불림. 미생물 종 내 서로 다른 종류의 유전자 집합(그림 1A)
  • 핵심유전체(Core genome): 미생물 종 내 모든 균주가 공유하는 유전자 집합. 주로 housekeeping 유전자와 종의 고유성과 관련된 유전자로 구성됨. 이들 유전자 중 일부는 인접 종과의 분화(speciation) 이전에 수평적유전자이동(horizontal gene transfer 또는 lateral gene transfer)을 통해 획득될 수도 있지만, 종 분화 이후에는 최신공통조상(most recent common ancestor 또는 MRCA)으로 부터 물려받은 수직진화(vertical evolution)의 산물임
  • 확장핵심유전체(Extended core genome): 비교적 최근 등장한 개념으로, 종 내 전체 균주의 99%이상에 의해 공유되는 유전자 집합.2) 미생물 종을 구성하는 다수의 균주 중 매우 일부에서 유실된 유전자(gene loss)를 부속유전체(아래 정의 참고)에 포함시키지 않고 핵심유전체의 지위를 부여
  • 부속유전체(Accessory genome): dispensable genome 또는 variable genome으로도 불림. 과거에는 핵심유전체에 해당하지 않는 모든 범유전체 유전자를 부속유전체에 할당함.3) 하지만, 최근에는 종 내 전체 균주의 5%이하에 의해 공유되는 유전자 집합으로 개념이 축소됨.2) 일반적으로, 단일 균주에만 특이적으로 나타나는 유전자(ORFans)가 부속유전체의 대다수를 점유함. 대부분 수평적 유전자이동의 결과물임
  • 특징유전체(Character genome): 확장핵심유전체와 부속유전체에 속하지 않는 범유전체 유전자 집합.2) 종 내 전체 균주의 5%이상~99%미만에 의해 공유되는 유전자군. 핵심유전체 정보와 더불어 미생물 종의 고유한 특징을 조사하는데 유용함. 다만, 과반수 이하의 균주에 의해 공유되는 유전자의 경우 유전자수평이동에 의해 외부 종으로 부터 유입되었을 가능성이 많음

그림 1. (A) 범유전체 및 관련 유전체 집합의 포함관계. (B) 분석된 유전체 개수 대비 유전자 개수의 관계. 일반적으로, 유전체 개수가 증가할 수록 범유전체, 부속유전체, 특징유전체는 증가 추세를, 확장핵심유전체와 핵심유전체는 감소 추세를 보임. (C) 유전자수평이동 발생 빈도의 차이에 따라, 분석된 유전체수에 대한 유전자 수 증가 속도가 다름. 출처: 김경모/극지연구소

범유전체 분석법

그림 1B의 rarefaction 그래프에서 볼 수 있듯이, 안정적으로 범유전체를 정의하기 위해서는 최대한 많은 수의 균주 유전체 정보를 이용해야 한다. 만약, 등의 공공서열데이터베이스에 분석하고자 하는 미생물 종의 완전한 유전체 개수가 충분하지 않다면, 초벌유전체를 포함시킬 수도 있다. 초벌유전체를 포함할 경우, 조각난 contigs 수에 비례하여 해당 균주가 원래 가지고 있던 유전자 정보가 손실되어 있음을 인지해야 한다.

다음 단계로, 준비된 유전체 간 개별 유전자 서열을 서로 비교하여 공통진화유전자(orthologs)를 찾는다. 이를 위해, 염기서열 상동성에 기초를 둔 reciprocal-BLAST 방법(서로 다른 두 유전체 내, 각각의 유전자가 서로 BLAST top hit를 공유하는 경우)을 이용할 수 있다. 좀 더 정확한 ortholog 결정을 위해 Markov clustering (MCL) 기반의 전문 프로그램(예: 등)을 이용할 수도 있다. 이후, 모든 균주에 의해 공유되거나(핵심유전체의 구성원), 일부 균주에서만 나타나는 유전자(부속 또는 특징유전체)를 합쳐, 특정 미생물 종의 범유전체를 정의할 수 있게 된다.

범유전체의 분류

미생물의 범유전체는 분석에 이용되는 균주의 유전체 개수와 유전자 개수의 관계에 따라, 크게 열린 범유전체와 닫힌 범유전체로 구분될 수 있다(그림 1C).

열린 범유전체는 분석에 새로운 균주의 유전체 정보가 추가 될 때 마다, 기존 균주의 유전체에는 존재하지 않는 다수의 신규 유전자가 발견되는 경우이다. 반면, 닫힌 범유전체는 새로운 균주의 유전체를 분석에 추가해도, 신규 유전자가 극소수이거나 발견되지 않는 경우를 의미한다. 충분한 수의 유전체가 분석되었다면, 두 경우 모두 핵심유전체 크기는 거의 변화가 없다(그림 1B).

따라서, '열린'과 '닫힌'의 차이는 부속유전체(일부는 특징유전체)에 속하는 유전자들에 의해 발생된다. 이들 유전자 대부분은 수평적유전자이동(HGT)을 통해 외부 종으로 부터 획득되었을 가능성이 많다. 결국, 수평적 유전자이동을 빈번하게 경험한 미생물 종일 수록 열린 범유전체를 갖을 확률이 높아진다. 물론, 해당 미생물 종의 유효 집단크기(effective population size)가 상대적으로 크면(유전체 수준에서 개별 유전자의 dN/dS의 평균값으로 추정 가능), 유전자 수평이동이 빈번히 일어나도, 실제 해당 미생물 유전체에 수평이동된 유전자가 고정될 확률이 낮아질 수 있는 점을 고려해야 한다(그림 2).

미생물 생태학적 관점에서 보면, 대체로 다양한 생태적 지위(ecological niche)에 적응하며 살아가는 종(예: Escherichia coli)은 여러 종류의 미생물과 교류할 확률이 높고, 이는 수평적 유전자이동을 빈번하게 하여, 열린 범유전체가 될 가능성이 높아진다.4) 반대로, 생태적 지위가 매우 제한적인 경우(예: 폐결핵 원인균인 Mycobacterium tuberculosis), 다른 미생물 종과 만날 확률이 상대적으로 낮고, 유전자 수평이동 빈도도 떨어져, 결국 닫힌 범유전체가 될 가능성이 높아진다.

그림 2. 세대 수(generations)와 획득된 유전자의 집단 내 빈도 간의 관계. 유효집단(effective population size 또는 Ne)이 클수록, 신규 유전자가 집단(population)을 구성하는 모든 개체에 확산되기가 힘듦. 반면, 집단이 작으면, 신규 유전자는 상대적으로 적은 세대 수에도 쉽게 고정(빈도 1)되거나, 집단에서 완전히 유실됨(빈도 0). 출처: 김경모/극지연구소

집필

김경모/극지연구소

감수

김봉수/한림대학교

참고문헌

1. Medini, D., Donati, C., Tettelin, H., Masignani, V., & Rappuoli, R. (2005). The microbial pan-genome. Current opinion in genetics & development15(6), 589-594.
2. Lapierre, P., & Gogarten, J. P. (2009). Estimating the size of the bacterial pan-genome. Trends in genetics25(3), 107-110.
3. Tettelin, H., Masignani, V., Cieslewicz, M. J., Donati, C., Medini, D., Ward, N. L., ... & DeBoy, R. T. (2005). Genome analysis of multiple pathogenic isolates of Streptococcus agalactiae: implications for the microbial "pan-genome". Proceedings of the National Academy of Sciences of the United States of America102(39), 13950-13955.
4. Batut, B., Knibbe, C., Marais, G., & Daubin, V. (2014). Reductive genome evolution at both ends of the bacterial population size spectrum. Nature reviews. Microbiology12(12), 841. doi: 10.1038/nrmicro3331

동의어

범유전체, pangenome, Pangenome