2015-08-25 11:49:00
当我在博士班面临高能物理理论界正在集体转型为偽科学的困境时,最羡慕的就是住在同一个理工学院宿舍但属于进步很大很快的新科学学科的其他博士生,尤其是研究基因工程的生物系学生。美国联邦政府自1984年开始筹划Human Genome Project(HGP,人类基因组计划),准备以15年时间,投资30亿美元,由20个一流大学分工协力,将占有人类基因90%的Euchromatin(真染色质)完全解码。这个计划在1990年正式启动,哈佛也是参与的重点学校之一,所以就有我在宿舍和餐厅常碰面的研究生也在其中。他们当然是神采飞扬,和我这种误上贼船而自己又心知肚明的倒霉蛋成了鲜明的对比。那时大家都知道将人类基因组完全定位对21世纪的医学进步会有极大的贡献,参与这个庞大的计划自然看来就是职业生涯的极佳起点。
结果人算不如天算,HGP所用的80年代最先进方法到1995年就完全落伍了;有人发明了新的散弹枪测序技术(Shotgun Sequencing)。所谓的散弹枪技术就是把极大的DNA分子复制后随机打成极多很小的碎片,然后用机器来分析这些小碎片,最后才用电脑程式把它们像拼图游戏一样重组起来。这和以往的Primer Walking技术的差别在于不须要小心翼翼地把DNA切成预定长度的小段,所以可以高度自动化,速度提升不只一个数量级。到了1998年,HGP的最大测序机器供应商Perkin-Elmer Biosystems(Perkin-Elmer的总部就在我家隔壁那个镇)做了一个内部评估,发现如果他们自己用散弹枪技术来重做HGP的分析工作,从设计制造新机器到完成整个计划只需要三年,也就是到2001年就可以完全解码人类的真染色质,比HGP要提早四年,而且花费只有2亿美元。这个计划很快就被批准,Perkin-Elmer全力投入,开创了一家子公司,叫做Celera Genomics。
读者或许觉得奇怪,2亿美元虽然比30亿少,但毕竟也是一笔大数目,Perkin-Elmer花这笔钱又不能对人类基因拿下专利,有什么好处呢?一开始Celera只说查询他们的基因资料库是要收费的。这下子主管HGP的大师们群情激愤了:你们没来由地出头和我们竞争,只是对我们个人的羞辱,还算小事一件,现在居然还要把属于全人类的学术成果拿来当极庸俗的赚钱工具,是可忍孰不可忍,所以我们一定也要提前在2001年就把计划完成。而且Perkin-Elmer雇来的Celera总裁叫做Craig Venter,他从1995年起就吵着要改用散弹枪技术,被大师们嗤之以鼻,逐出学术主流,如果大师们被他打败了,面子上实在挂不住。那么唯一的办法就是回头向国会解释Celera和Venter有如何如何的邪恶,无论如何必须赶在他们之前完成基因解码,让无限慈悲和睿智的国会当初批准的HGP能顺利成为原先计划的大突破,为人类的未来提供免费的服务。
我并没有找到他们要到多少钱之类的详细资讯,以下这段分析主要是我自己的猜想,只有环境佐证(Circumstantial Evidences),请大家姑妄听之。HGP临时想要提前进度,只能靠增购机器,一开始他们还不好意思跟着买新的高速机器,所以只好在1998年先买了一批旧型的。Celera买了2亿元的新机器,世界各国的实验室在1998年也买了1亿多美元。到1999年,新机器的性能被证实比广告预期的还要好,HGP忍不住了,才开始大买特买。于是Perkin-Elmer的销售额成指数成长,在1999年和2000年得以连续做企业重组,在股票市场捞了几百亿美元。所以我认为,实际上Perkin-Elmer原本的考虑是在1995-1998年间就希望全球第一大客户HGP能採购新机器,如此一来可以对同样的一个產能需求卖两次,但是主管HGP的老顽固们不愿意(其实避免重复投资,为公家省钱,是有其道理的),于是最后只能用上激将法。刚好遇上互联网泡沫,Perkin-Elmer在股市上一本万利,大获全胜。后来一旦大批订单已经进了Perkin-Elmer,Celera就放弃了对资料收费的计划,结果当然无法收回老本(其实要跟订户收回2亿美元,而HGP的资料却是免费,原本就是痴人说梦),Venter也在2002年初就被解雇(兔死狗烹)。我所看到的报导都说Celera是个彻底失败的事业,我个人则觉得它是当代最成功的商业权谋运作之一。
Perkin-Elmer的新机器成为21世纪基因工程突飞猛进的原动力,我在前文《鸟类的演化》里已经提到了一些它在基础科研上的应用。今年初我和纽约大学基因实验室主任聊天时,问他如果给他一个完全未知的样本,最快要多久可以完成分析其基因组;他说原始数据只要两天。1995年之前,这是要花15年的事,可见基因工程进步的脚步之大,前途不可限量。那么为什么我们还没有真的看到基因工程在医疗上的应用呢?这是因为解码基因组只是前一半的工作,后一半是根据分析的结果来修復基因。这比解码还要困难得多,但是在2012年,终于有了大突破,我在下一篇文章再详细介绍。