首页 百科知识计算机在生物医学中的应用:生物信息学简介

计算机在生物医学中的应用:生物信息学简介

【摘要】:而生物信息学本身已存在30多年,只不过最初常被称为“基因组信息学”。另外,新药研制、生物进化也是生物信息学研究的热点。

5.1 生物信息学概述

生命科学和信息技术在本世纪得到了突飞猛进的发展,极大地推动了基于序列分析的基因组研究。尽管有关基于序列的生物学时代已经到来这一说法仍存在争议,但是如潮水般涌现的序列信息却是无可争辩的事实。1990年,美国启动了人类基因组计划(Human Genome Project,HGP),在它的推动下,人类与模式生物基因组的测序工作发展极为迅速。2006年5月18日,英美科学家宣布完成了人类1号染色体的基因测序图,这表明人类最大和最后一个染色体的测序工作已经完成,历时16年的人类基因组计划终于画上了句号。至此,世界三大公共DNA及RNA序列储存库的基因序列信息已经达到了100×109对碱基。生物学数据的积累并不仅仅表现在DNA序列方面,与其同步的还有蛋白质的一级结构。迄今为止,已有10 000多种蛋白质的空间结构以不同的分辨率被测定。基于cDNA序列测定所建立起来的EST(ExPressed Sequence Tags,指基因表达的短cDNA序列,它们携带着完整基因某些片段的信息)数据库中的记录已达数百万条。

数据并不等于信息和知识,但却是信息和知识的源泉。与正在以指数方式增长的生物学数据相比,人类相关知识的增长十分缓慢。一方面是巨量的数据;另一方面是我们在医学、药物、农业和环保等方面对新知识的渴求。这个矛盾就催生了一门新兴的交叉科学,这就是生物信息学(Bioinformatics)。生物信息学涉及生物学、数学、计算机科学和工程学,也依赖于生物实验和衍生数据的大量储存。生物信息学不只是一门为了建立、更新生物数据库及获取生物数据而联合使用多项计算机科学技术的应用型学科,也不是只限于生物信息学这一概念的理论性学科,它是一门理论概念与实践应用并重的学科。(www.chuimin.cn)

“生物信息学”这一名词由马来西亚裔美籍学者Hwa A.Lim于1991年首先创造使用。而生物信息学本身已存在30多年,只不过最初常被称为“基因组信息学”。基因组信息是生物信息中最基本的表达形式,并且占有极大的比重。但是,生物信息并不仅限于基因组信息,更不等于基因组信息。广义地说,生物信息不仅包括基因组信息,也包括基因产物的结构和功能,以及各物种间的进化关系等其他信息资源。生物信息学既涉及基因组信息的获取、处理、存储、传递、分析和解释,又涉及蛋白质组信息学,如蛋白质的序列、结构、功能及定位分类,蛋白质连锁图、蛋白质数据库的建立,相关分析软件的开发和应用等方面,还涉及基因与蛋白质的关系,如蛋白质编码基因的识别及算法研究、蛋白质结构、功能预测等。另外,新药研制、生物进化也是生物信息学研究的热点。