생물정보학

생물정보학

[ bioinformatics ]

응용수학, 정보과학, 통계학, 컴퓨터 과학, 인공지능, 화학, 생화학 등을 이용하여 생물학적인 문제를 다루는 학문이며, 생명과학(BT)과 정보기술(IT)이 융합된 학문 분야이다. 특히 염기서열결정(sequencing) 기술의 발전으로 고속 대용량의 실험 데이터 처리가 요구되면서 발전한 분야로써, 유전체, 단백질체 등의 분석과정에서의 고속 대용량 분석 기기에서 대량으로 생산해 내는 생물학적 데이터의 처리, 수집, 가공, 분석을 위해서 필수적인 분야이다.

생물정보학 관련 분야 (출처: modified based on '2004 정보산업 민간백서 제3부 정보산업 이슈와 전망' )

목차

생물정보학의 목적

큰 안목으로 보면 아래와 같은 연구를 수행한다.

  • 이미 밝혀진 자료를 쓰기 쉽도록 정리하고, 새로 발견되는 자료를 축적

예) GenBank1) -유전자염기서열, Protein Data Bank2) -단백질3차원 구조 예측에 활용된다.

예) FASTA, BLAST, PSI-BLAST 등 - 모르는 단백질서열과 이미 알려진 단백질서열의 유사성을 찾아내는 프로그램으로 유전자, 단백질의 기능 예측에 활용된다.

상동성 염기서열 비교의 예 (출처: )

  • 밝혀진 자료와 개발된 도구를 이용하여 생물학적으로 의미있는 해석

예) 전통적인 생물학은 같은 종이나 매우 유사한 종 간의 비교만 가능했었으나, 생물정보학은 전체 생물체의 공통점이나 특정 생물의 특이점을 찾을 수 있다.

예) 각 유전자의 발현정보나, 발현된 단백질의 구조 및 상호관계 정보의 해석이 가능하다.

  • 전산이론과 생물학적 지식을 바탕으로 다양한 정보 분석을 위한 도구 개발

좀 더 세분하면 아래와 같은 연구 내용을 들 수 있다.

1. 염기서열 분석(Sequence analysis)

2. 유전자와 단백질 발현 분석(Gene and protein expression)

3. 세포 조직 분석(Analysis of cellular organization)

4. 구조 분석(Structural bioinformatics)

5. 상호작용과 시스템 분석(Network and systems biology)

6. 기타: 

  • 문헌 분석(Literature analysis)
  • 대용량 화상자료 분석(High-throughput image analysis)
  • 대용량 세포 단위 자료 분석(High-throughput single cell data analysis)
  • 생물 다양성 정보파악(Biodiversity informatics)
  • 유전자 존재 정보 및 자료 통합(Ontologies and data integration)

7. 데이타 베이스(Databases) 구축

8. 전산프로그램 및 도구 개발(Software and tools)

관련 분야

생물정보학(혹은 생명정보학: bioinformatics)은 흔히 전산생물학(computational biology)이라는 용어와 같은 뜻으로 쓰이며, 생물학적 문제를 좀 더 잘 이해하기 위해 전산학을 이용하는 것을 의미한다. 반면에 생물전산학(biological computation)은 생물학적 현상, 재료, 기술을 이용하여 컴퓨터를 만들거나 계산을 수행하는 것을 의미한다.

최근 생명현상을 보는 시각이 확대되면서, 기존의 Bio+Logie 의 뜻과 같으나, 단순한 부속의 합이 아니란 취지의, 시스템 전체에 대한 분석 및 수리적 모델링(mathematical modeling)을 강조하는 용어인 시스템 생물학(systems biology)도 생물정보학과 상당 부분 겹치는 용어이다.

2010년을 기점으로 게놈(유전체) 해독기술이 급격하게 발전하면서, 게놈뿐만 아니라, 발현체[전사체, 단백질체, 대사체, 외유전체(epigenomes)]의 해독과 분석이 용이하게 되면서, 이런 체(ome)의 총칭인 오믹스(체학)의 다양성이 늘어났다. 이 다양한 체학의 데이터를 다중오믹스 혹은 다중체정보라고 부른다. 다중오믹스(multiomics)는 현재 생명정보학의 빅데이타의 핵심이다. 특히, 게놈 위주의 유전체학에서, 다중오믹스간의 유기적 관계성을 인공지능(AI)로 해석을 하는 시도들이 늘어나서, 암뿐만 아니라 심장병까지도 다중오믹스적으로 그 원인유전자 분석을 하게 되었다. 심장병은 암과 같이 유전질환으로 인식이 안되는 만성 성인병임에도 불구하고, 다중오믹스의 분석파워의 증가에 따라, 유전자와 발현체 정보의 활용에 힘입어 조기 진단 및 치료에까지 생물정보학의 영역이 확대되고 있고, 이것은 생물정보학과 의료정보학의 중복성을 잘 보여준다.

식물학 분야의 생물정보학

오믹스와 생물정보학은 다양한 식물들의 기능의 근간을 이루는 분자 체계를 이해하는 데 꼭 필요하다. 이러한 목적을 달성하기 위해 식물 연구의 대표적인 모델인 애기장대(Arabidopsis)를 중심으로 한 많은 연구가 되어 있으며, 다양한 web에서 찾아볼 수 있다. Jamil 등의 논문3)을 참고하면 여러 유용한 오믹스 연구와 관련된 주요 web 사이트들을 찾아 볼 수 있다.

참고문헌

1.
2.
3.