那么从DNA到蛋白质我们有一个规律,我们把它叫做“分子生物学的中心法则”。也就是说,我们知道DNA的序列之后,它是三个核苷酸是一个密码子,那么这一个密码子是干什么用的?它是对应着蛋白质当中的一个氨基酸。我们二十种氨基酸都有至少一种密码子,在DNA水平上至少一种密码子。那么一个密码子对应一个氨基酸,第二个密码子对应第二个氨基酸,第三个密码子对应第三个氨基酸。这样通过DNA这样的遗传信息,就可以把它转化到,在我们蛋白质上面组成的氨基酸的序列,就可以各有不同,不同的遗传信息就可以代表出不同的蛋白质的分子,不同的基因就可以表述出不同的蛋白,这个基因可能表达出来胰岛素分子,那个基因可能表达出来生长激素蛋白分子,这个基因可能表达出来一个胰蛋白酶分子。是这样的。那么基因跟蛋白是这样的关系。我们知道了基因就可以知道蛋白的序列,那么知道蛋白的序列也就是氨基酸系列,我们也可以反推到DNA上面,它的一些序列就是DNA到蛋白质有这样的关系。
那么我们今天谈“从基因组到蛋白质组”就需要把这种关系很好的了解,联系起来。那么蛋白质组是什么样的一种概念呢?蛋白质组是某一个细胞或者某一个组织当中所有表达出来的蛋白质这样一种概念,所有表达出来的蛋白质这样的一个集合。那么这个蛋白质组因不同的细胞而异,不同的细胞它的蛋白质组是不一样的,但是同一个个体不同的细胞它的基因组是一样的。
那么我们人类现在有30亿个碱基,核苷酸这样序列的基因组。那么按照能够编码出来蛋白质这样的序列,我们现在估计是3万到4万个可以编码出来,也就是说,可以编码出来3万到4万个蛋白质分子。那么这个蛋白质分子3万到4万是不是在每个细胞都存在呢?不是。那么这些蛋白质分子因不同的细胞的需求而表达,在某一个细胞里面这个蛋白或者这一堆蛋白,这一序列的蛋白表达得很高,在另外一个细胞,另外一些基因表达出来的蛋白,这些蛋白表达的很高。那么在一个组织里面,它可以是蛋白质的表达水平可以是不一样的。也许一个组织只表达几千个蛋白质分子,与我们总的3万个蛋白质差的很远的。那么表达这么多就足够这个细胞完成它的功能,那么表达这样,实际上也体现了不同的细胞它的功能,肌肉细胞表达的蛋白质跟你肝细胞,胰腺组织细胞表达的蛋白质会有很大的差别,但是这些组织的基因都是一样的,只不过它表达的时间、方式,或者表达不表达这上面有差异。
那么蛋白质组实际上是要做这些工作,了解这些蛋白的差异,而这些蛋白的差异有什么样的作用呢?我们现在了解的人类基因组计划这些序列,我们知道有3万、4万可能表达出这样的蛋白来,那么这些基因谁是谁,谁能表达出哪个蛋白来,绝大部分我们都不知道,这个不可能从基因的序列上,我们知道它的功能。也就是说基因组的计划我们了解了这些基因的序列,这仅仅是我们人类基因组上,所谓大科学的万里长征的第一小步,实际上后面还有很多很多工作,这个工作实际上很大的工作量是局限在蛋白质组上面。所以说,后面的任务是非常艰巨的。
那么在我们作蛋白质组的过程当中,实际上存在很大的研究价值,这个研究价值是什么呢?比如说,我们一个组织在正常的情况下,它可以表现出来比如说,五千个蛋白点在上面,五千个地图上面有一个标志在上面。那么在非正常的时候,这些蛋白点它可能会有一些变化,比如说我们刚才谈到的某些酶,在代谢过程当中某一个酶,这是蛋白质,如果它的量增加,可能会导致这样的病理状态。那么我们就看这个蛋白质组上面每一个是什么样的变化,如果这个变化很强的这个蛋白点,我们把它拿出来是跟这个疾病非常有关,我们就可以找到它的序列,拿出来研究它的结构,找到它的序列。然后再反到基因组里面去,找到它的基因,那么把它的基因拿出来,我们就可以很好的研究这个基因的表达调控,就是说我们不要它病理状况,我们能不能让它的基因不表达或者少表达,使这个蛋白的量少一点。那么这样就可能产生一些应用价值。
再比如说我们在一个图上,有一个蛋白正常情况下有,病变的时候它没有了,那么这个就很可能就是说,它在这里面起了很关键的作用。那么我们能不能在正常情况下,把这个基因拿出来,通过这个蛋白把基因拿出来,然后我们可以通过现在的生物工程,我们比如说,通过基因工程技术生产这样的蛋白,把这个病人他缺这个蛋白,我们给他注射进去这个蛋白,来治疗他这样的病状。那么这里面就谈到,在蛋白质组里面,实际上是要帮助基因组的解析,每个基因是什么样的功能,最后可以得到什么呢?对很多基因可能有非常大的商业价值。
大家知道现在我们市场上已经有很多的重组蛋白,包括刚才谈到胰岛素,生长激素,GMSF,粒细胞刺激因子这些,白细胞介素,干扰素这些都是属于重组蛋白,它具有一定的生物学功能,是可以对于很多疾病,来进行治疗的。这些都是属于我们基因组计划今后可能带来的一些巨大的经济效益或者社会效益。从研究的方面去考虑,可以使得我们很多的蛋白这样的功能分子的结构有功能研究,加快它们的解析的进程。我觉得从基因组到蛋白质组这是一个过程,我觉得,我们国家反而我觉得在这方面可能大家不一定太熟悉,因为什么呢?我们国家虽然仅仅只有几个局限的实验室在开展这样的工作,我们国家比如说国家的基础重大研究项目也没有蛋白质组,但是基因组是在这里面,但是没有蛋白质组。这一点我个人认为需要领导或者一些专家们更多的思考这个问题,否则今后在我们国家蛋白质组学上面可能会比基因组还要落后。我大概讲这些。
主持人:好,谢谢您。下面咱们看一下来自凤凰网站的网友,对您的提问。第一位网友他名字叫“病入膏肓”。他的问题是:据我理解基因图谱绘制成功,一切疾病秘密便在人类视线前暴露无遗,我们医生可以按图索骥的方式,对因下药。原来是对病下药,他是对基因的因。对因下药,包治百病,这下我就可有救了,我才34岁了,便患了谢顶、头晕,不是阳萎便是早泄等等一系列不治之症,我还可以治理一下我的啤酒肚和我的近视眼。现在又有了蛋白质组的研究,总之我觉得新世纪充满了曙光。
唐建国:我刚才谈到基因组的研究取得现在的成绩,仅仅是万里长征的一小步。所以说我觉得公众们对这个问题要客观一点看,我认为不是说那么乐观,要真的像,要把每一个基因是做什么的,它的功能是什么样解析清楚,那绝对不是一、二十年,我认为不是一、二十年能够拿得下来的。
那么在这个里面,作为这些功能分子蛋白质,实际上也不那么简单,除了我刚才说得好象很复杂的因素之外,实际上这些蛋白质还有一些化学修饰,有的蛋白质合成出来它不是说马上有功能的,它合成出来比如说以前体的方式保存着,当你机体需要的时候,它再激活来使用。那么有的蛋白质它可以受一个磷酸基团,一个无机的磷,这么一个磷酸基团。它如果共价结合到一个蛋白质某一个位点上去,它就改变它的活性,它可以作为开关一样,让这个蛋白有活性,或者说让这个蛋白没有活性,这样就可以改变这个生物体的功能。所以说基因组的解析成功不要给大家这样一种错觉,好象生物学的问题解决了,实际上仅仅是那么一小步。我觉得这样可能比较客观一点。
主持人:那么我怎么告诉他呢?我告诉他唐教授说了,基因组研究完了以后蛋白质组研究,蛋白质组研究完了以后,还要研究到糖,您的谢顶、头晕,和那些男人们不好启齿的病才能得到治疗。
唐建国:因为这个东西,我认为是非常复杂的这样一些问题。有的比如说比较简单的,通过某一个药物就可以解决。像刚才谈到的这么多病状,我想不是一种基因,两种基因的问题,可能是很多基因组合在里面地方。
主持人:那我干脆告诉他没救了。
唐建国:不能这样说呀。我觉得我们人类是在一步一步往前走的,往前发展的。比如说我们现在生活条件,或者说护理这些条件已经有非常大的改进,我们的寿命已经在延长了。我觉得这就是进步,这种进步得益于我们的研究,我们医学、生物学的发展。我们基因组仅仅是在前面打了一个头,那么后面实际上还有很多很多的工作需要开展,需要做,否则的话,也许这些生物学家可能就该失业了。