핵심유전체

핵심유전체

[ Core genome ]

핵심유전체(Core genome)는 임의의 한 생물 분류군에 속하는 모든 개체가 공유하는 유전자 종류의 집합을 의미한다. 미생물의 경우, 핵심유전체는 주로 단일 종 내 모든 균주가 공유하는 유전자 집합으로 정의된다. 따라서, 핵심유전체에 속하는 유전자 기능을 종합하면, 해당 미생물 종의 고유한 진화•생태•생리적 특징을 이해할 수 있다. 참고로, 확장핵심유전체 (Extended core genome)는 비교적 최근 등장한 개념으로서, 종 내 전체 균주의 99%이상에 의해 공유되는 유전자 집합을 의미한다1). 핵심유전체 분석 과정에서 불가피하게 초벌유전체(draft genome)의 균주가 포함된 경우, 계산된 핵심유전체가 실제보다 작아질 수 있어, 확장핵심유전체의 개념을 이용할 필요가 있다.

목차

핵심유전체의 구성

미생물 종류와 상관없이, 생존에 반드시 필요한 housekeeping 유전자가 핵심유전체의 기본을 구성한다2). 여기에, 개별 미생물 종의 고유성을 규정할 수 있는 유전자들이 추가된다3). 핵심유전체에 속하는 유전자 중 일부는 인접 종과의 분화 이전에 수평적 유전자이동(horizontal gene transfer 또는 lateral gene transfer)을 통해 획득될 수도 있지만, 종 분화 이후에는 최신공통조상 (most recent common ancestor 또는 MRCA)으로 부터 물려받은 수직진화의 산물이다. 따라서, 핵심유전체는 범유전체(pangenome)나 부속유전체 (dispensable genes)와 달리, 일정 균주 개수 이상의 유전체가 분석되면, 신규 균주의 유전체가 추가되더라도 매우 안정적인 유전자 구성을 유지한다(세부 내용은 범유전체 참고).

핵심유전체 개념의 한계

핵심유전체가 종 내 개별 균주의 특징을 설명하는 부속유전체와 차별화되기 위해서는, 해당 미생물 종의 고유성을 대표해야 한다. 하지만, 모든 균주에 존재하는 유전자의 경우에도, MRCA로 부터 미생물 종이 분화한 이후 수평적 유전자이동 (HGT)을 경험할 수 있다 (그림 1C). 만약, HGT가 종 내 균주 간 발생했다면, 해당 유전자의 계통수가 계통유전체수로부터 얻은 종 내 균주들의 분지패턴 (그림 1A)과 다르더라도 핵심유전체에 포함되게 된다. 하지만, 외부 종 (species)으로부터 획득되었다면, 해당 미생물 종의 고유성을 훼손하기 때문에, 더 이상 핵심유전체에 포함될 수 없다 (그림 1C). 따라서, 핵심유전체가 미생물 종의 고유성을 좀 더 온전히 대변하기 위해서는, 유전자 계통수의 균주분지패턴 (그림 1B)과 계통유전체수의 균주 분지패턴 (그림 1A)이 서로 동일한지 평가해야 한다. 또 다른 문제는 핵심유전체의 유전자가 미생물 종 내 일부 균주에서 유실될 경우다 (그림 1D). 예를 들어, 한 미생물 종의 1,000개 균주의 유전체 정보를 이용하여 핵심유전체 분석을 수행하였다고 가정하자. 만약, 특정 유전자가 950개의 균주에서 보존되어 있고, 나머지 50개의 균주에서는 나타나지 않았다면, 이 유전자는 종 내 균주들의 분지 이전에 획득되고 일부 균주에서만 선택적으로 유실되었을 가능성이 높다. 즉, 핵심유전체 (모든 균주에 의해 공유)나 확장핵심유전체 기준 (99%이상의 균주에 의해 공유)에는 못미치지만 (95%), 해당 미생물 종의 고유성을 특징하는데 필요한 유전자인 것이다. 결국, (확장)핵심유전체는 HGT을 경험하지 않고 (그림 1C), 종 내 50%이상의 균주들에 보존된 유전자의 총합으로 재정의될 필요가 있다.

그림 1. (A) 미생물 종 내 균주들의 유전체 정보를 이용하여 추정된 계통수. (B) 핵심유전자의 서열정렬로부터 얻어진 계통수는 (A)와 동일한 균주분지패턴을 보여줄 필요가 있음. (C) 3번 균주의 유전자가 외부 종으로부터 수평이동되어 들어온 경우. (D) 일부 균주에서 유전자 유실이 일어난 경우. 출처: 김경모/극지연구소

핵심유전체와 종의 개념

미생물, 정확히 원핵생물(prokaryotes)에서 종 (species)은 70% DNA-DNA 혼성화 (hybridization)율을 기준으로 구분된다4). 그러나, 생태적 지위 (ecological niche) 다양성 정도의 차이로 의해, 균주 간 유전체 변이 정도가 종에 따라 다르다 (그림 2). 예를 들어, 생태적 지위가 매우 제한적인 결핵균 Mycobacterium tuberculosis의 경우 균주 간 유전체 변이가 매우 작은 반면, 다양한 생태종(ecotypes)을 갖는 Escherichia coli의 유전체 간 변이는 심하게 나타난다. 그래서, 모든 원핵생물 종을 단일 기준의 유전적 유사도 (예: 고정된 DNA 혼성화율)를 이용하여 정의하는 것은 타당하지 않다. 반면, 핵심유전체는 개별 미생물 종의 고유성을 담보하기에, 종 마다 가변적인 유전적 범위 (species border)를 정확히 반영한다고 볼 수 있다5). 이러한 이유로, 최근에 핵심유전체을 기반으로 새로운 원핵생물 종의 개념 (species concept)을 정립하려는 시도가 빈번하다 (core genome hypothesis)6).

그림 2. 미생물 종 (species)의 유전적 다양성, 생태적 지위 (ecological niche), 그리고 recombination 과의 관계. Recombination 빈도 (R)가 떨어지면, 종 내 유전적 다양성을 증가시키거나 (E. coli의 경우), 서로 다른 집단 (populations)간 유전적 격리 및 종 분화 (speciation)가 발생할 수 있음 (종 1과 E. coli). 반면, 생태적 지위의 다양성 (N) 감소는 종 내 유전적 다양성을 감소시킴(예: Mycobacterium tuberculosis). 출처: 김경모/극지연구소

집필

김경모/극지연구소

감수

김봉수/한림대학교

참고문헌

1. Lapierre, P., & Gogarten, J. P. (2009). Estimating the size of the bacterial pan-genome. Trends in genetics25(3), 107-110. 
2. Glass, J. I., Assad-Garcia, N., Alperovich, N., Yooseph, S., Lewis, M. R., Maruf, M., ... & Venter, J. C. (2006). Essential genes of a minimal bacterium. Proceedings of the National Academy of Sciences of the United States of America103(2), 425-430. 
3. Feil, E. J. (2004). Small change: keeping pace with microevolution. Nature reviews. Microbiology2(6), 483. 
4. Stackebrandt, E., Frederiksen, W., Garrity, G. M., Grimont, P. A., Kämpfer, P., Maiden, M. C., ... & Vauterin, L. (2002). Report of the ad hoc committee for the re-evaluation of the species definition in bacteriology. International journal of systematic and evolutionary microbiology52(3), 1043-1047. 
5. Fraser, C., Alm, E. J., Polz, M. F., Spratt, B. G., & Hanage, W. P. (2009). The bacterial species challenge: making sense of genetic and ecological diversity. science323(5915), 741-746. 
6. Wertz, J. E., Goldstone, C., Gordon, D. M., & Riley, M. A. (2003). A molecular phylogeny of enteric bacteria and implications for a bacterial species concept. Journal of evolutionary biology16(6), 1236-1248. 

동의어

핵심유전체, Core genome, core genome