생정보학 역사

From Bioinformatics.ws

Jump to: navigation, search

1850년대의 다윈의 진화론과 멘델의 유전법칙의 이론적 기반에서 시작된 연구이며, 생정보학의 실질적 시작점으로 볼 수 있다.

- 박종화 (Jong Bhak)

 

1950년대의 DNA 구조 모델링을 통해, 이중나선구조가 제안되었고, 1960년대의 단백질 구조해석을 위한 많은 수동/자동 전산처리작업과 알고리즘 개발이 실질적인 토대를 나았다. 1970년대 이르러서 영국 케임브리지의 생어(Sanger)박사의 단백질과 DNA 서열해석 기술을 이용하여, 본격적으로 생물서열, 분자구조, 그들 사이의 상동성 검색기술들이 개발되었으며, 1980년대에는 단백질 구조 접힘 문제에 많은 생정보학자들이 기여를 했다. 현재 사용되고 있는 많은 통계학적, 수학적 알고리즘들을 이때에 개발되었다. 1970년에 니들만 원취(Needleman and Wunsch)의 다이내믹프로그래밍을 이용한 전산 서열 정열 알고리즘은 전산적 생정보학의 중요한 계기가 되었다. 그 뒤, 1990년 초의 팀 버너즈리라는 유럽의 CERN 연구소에서 개발된 HTTPD라는 컴퓨터프로그램과 HTML이라는 양식이 보편화 되면서, 많은 생정보학자들이 인터넷을 통해 정보를 유통하고 그에 필요한 기반 기술을 만들어 내면서 생정보학은 인터넷을 타고 전 세계로 번진다. 생정보학자들이 학문계에 있어서는 인터넷의 발전에 가장 많은 기여를 했고, 지금도 인터넷의 중요한 문제들이 생명정보분야에서 도출된 것이 많다.

영국 케임브리지의 생어박사의 바이러스와 미토콘드리아 게놈프로젝트가 90년대 2000년대의 인간 게놈 프로젝트로 결실을 맺고, 그동안 축적된 많은 생정보학적 기술들이 2000년대에 와서 폭발적인 성장을 하게 된다. 생정보학은 대량의 실험 데이터를 DB화하고 이를 이용한 개개의 유전자나 단백질의 기능과 용도 분석 등에 주력하였다. 염기서열결정(sequencing) 등에서 생산되는 유전자 서열정보 등 방대한 양의 새로운 생물학 데이터들을 저장하고 관리하기 위한 생어센터의 ACEDB와 같은 유전체 데이터베이스의 개발이 최초로 이루어졌다. 서열간의 유사성을 분석하기 위한 FASTABLAST 등의 프로그램이 미국의 니들만 분취의 기술에 더하여 알출, 피어슨, 립맨등에 의해 개발되었고, 현재에는 산타크루즈 대학의 데이비드 하우슬러그룹과 케임브리지의 MRC에서 응용된 생정보학용 Hidden Markov Model(HMM) SVM과 같은 고급 통계학적 알고리즘도 사용한다. 1988년 데이비드 립맨을 소장으로한 미국의 NCBI (국가생명공학정보센터)는 다양한 DB 및 알고리듬을 무료로 배포하여, 세계적으로 생정보학이 큰 발전을 하는데 기여하였고, 생정보학 역사상 가장 중요한 사회적 업적을 이루었다. 한국도 국가유전체정보센터와 국가생물자원정보관리센터의 지정으로 한 차원 높은 생정보학 인프라 구축의 계기를 마련하고 최초의 한국인 게놈 분석 (20095Genome Research 발표) 및 범아시아 다형성 프로젝트(PASNP, 200912Science 지 발표)에 정보분석에 결정적 기여를 하게 되었다.

 

 

Personal tools
Google AdSense