在深圳东南部大鹏新区下沙片区禾塘仔地块,有一座像哈尼梯田的建筑,这就是具有战略意义的国家基因库。今日(9月22日),中国首个国家基因库正式开幕。
这是全球继美国国家生物技术信息中心(NCBI)、欧洲生物信息研究所(EBI)、日本DNA数据库(DDBJ)之外的第四大基因库,也是全球最大的综合性基因库。
2011年1月,国家发改委等四部委批复同意深圳市依托华大基因研究院建设深圳国家基因库。五年中,也曾有一些质疑的声音出现,国家基因库能建起来吗?五年后,事实给出了答案。
首期工程华大基因配套3.6亿元
不同于往日的平静,国家基因库开门迎客的当日,来自政界、产业界以及国内外媒体界的人士聚集于此。
国家基因库所在的大鹏新区被深圳市政府规划为“生态岛、生物岛、生命岛”,也被称为深圳最后的“桃花源”。正在规划中的深圳国际生物谷也位于大鹏,未来全球知名的生物产业公司或将落子于此。
国家基因库之所以选择在大鹏半岛,华大基因研究院院长、国家基因库执行主任徐讯对记者说,还有一个考虑,因为山后面是液化天然气(LNG)码头,液化天然气从液态到气态的过程会产生大量的冷能。如果冷能直接释放到海里将导致海洋温度的改变,引起生态系统变化,但是输送到国家基因库用于冷却样本,每年能节约三分之二的电费。
在即将到来的生命时代,国家基因库的重要性不言而喻。国家基因库主任、华大农业集团董事长梅永红在接受第一财经等媒体采访时表示,基因库是真正的国库,比银行的金库还要宝贵。在农业时代,拥有更多的耕地,就意味着拥有了优势;在工业时代,拥有更多的能源,你也具有了相应的优势;在生命时代,拥有更多的基因资源,并对这些资源进行认知和利用,你在这样一个新时代就拥有了自己的优势。
此前,全球有三大基因库,美国、欧洲、日本三大数据库,我国每年产出的大量基因数据都存在国际大三数据库中,在基因数据已成为战略资源的现在,国内不能保存我国独特的基因数据,这本身就是一种风险。
为了存储、管理、利用好我国的遗传资源,也为国内生物技术和生命经济发展提供支撑平台,2011年1月,国家四部委批复同意深圳市依托华大基因研究院建设深圳国家基因库。
建设和经营国家基因库的重任为何会落在华大基因身上?梅永红坦承,他也曾思考过这个问题。
在梅永红看来,有几个原因:第一,华大基因是全球最大的基因研发机构,建国家基因库并不仅仅是收集和保存基因资源,更要得到应用和数字化的过程,华大在解读基因方面是全球领先的。第二,华大基因1999年创立以来,通过参与人类基因组计划到今天,已经成为全球拥有基因数据量最大的机构,产出的人类基因组数据一度占到全球的47%,产量超过70%的全球农业基因组数据。华大所获得的这些数据对国家基因库特别是数据库来说,是非常重要的资源。第三,华大基因作为一个民办官助的新型研究机构,在利用这个资源方面比体制内的机构具有更好的条件。
第一财经记者了解到,国家基因库分两期建设,即将开幕的是一期,工程投资7.8亿元,华大投入了3.6亿元。建筑面积4.75万平方米,目前基因信息数据总量达60PB,生物样本存储能力1000万份。
目前已建成20PB数据的可访问能力,20PB是什么概念,以一步电影约500MB计算,相当于四千万部电影,一个人一天看一部电影,至少需要10万年才能看完。
徐迅介绍,国家基因库一期的目标存储规模是3000万份样本,国家基因库的二期也准备动工,打算在对面山里打一个隧道用于储存样本,把储存能力提高到三亿。前期做了很多调研,认为这种方式最有价值,比如挪威的末日种子库建设在挪威永冻土的山洞里,基本不需要外来的能量就能保持低温0--4摄氏度。
在运行机制上,国家基因库成立了理事会,由国家发改委、财政部、工信部、卫计委四部委牵头,深圳市政府共同参与,理事会将制定平台建设、运营的规则机制。
梅永红表示,目前,国家基因库的属性还没有明确,到底是事业单位还是非盈利机构,但是它所获得的收益一定是支撑国家基因库自身的发展。
基因资源决定未来竞争
国家基因库的主要功能是“三库两平台”,三库由生物信息数据库、生物样本资源库和生物活体库组成,两平台为数字化平台及合成与基因编辑平台。
徐迅表示,与其他三个数据库不同的是,他们只是数据库,没有样品保存功能。相比之下,国家基因库还有样品库和活体库,目前全球没有这么大规模的综合性数据库。
国家基因库的三楼摆放着华大基因自主研发的150台BGI-Seq500基因测序仪,以及一台造价2000万美元的Revolocity超级测序仪,全球共有六台超级测序仪,其中两台在中国。未来,这些测序仪将发挥重要作用将收集的标本变为基因数据。
众所周知,目前,个人基因组的测序成本相比之前已经大幅下降,在1000美元左右,但市场期待能在未来五年内降至1000元人民币。高成本的原因主要在于测序仪和试剂等耗材的上游控制权还掌握在美国大公司如illumina、life等手中,华大基因在2012年收购了美国测序仪公司CG,开始研发具有自主知识产权的测序仪,而国家基因库中的150台华大自主研发的测序仪可以说,代表的是中国在基因产业上游竞争的实力。
筹建国家基因库的五年也是华大基因的飞速发展期。目前,华大基因拥有四个商业版块和一个创投平台:华大农业主攻基因在农业领域的应用;华大智造主要从事体外诊断试剂、测序仪等设备研发生产和销售;华大股份负责科技服务和医学检测;新成立的华大司法提供司法鉴定等服务;蓝色彩虹则负责基因领域的创投孵化。华大股份由华大医学和华大科技合并成立,去年年底,已经IPO冲刺创业板。另外还有四个非营利机构:华大基因研究院、华大学院、GigaScience杂志以及国家基因库。
穿过四楼的数据中心以及基因库合作的云平台,就到了五楼的样本库。
目前,这里保存的更多是组织、血液、尿液等样本。据徐迅介绍,国家基因库有四种保存温度,动植物标本、石蜡切片等在常温下保存;唾液、脱落细胞需要保存在4摄氏度环境中;干血片、种子、DNA需在零下20摄氏度的环境中保存;微生物、血浆/清、蛋白、DNA、RNA等保存温度要达到零下80摄氏度。而细胞和组织,需要在零下200摄氏度的液氮或气相液氮环境中保存。
第一批入库的样本以疾病和物种多样性为主。徐迅介绍了三个和疾病相关数据库。第一个是罕见病数据库,华大基因检测的将近3000个罕见病家庭,新发现了400中罕见病基因。他表示,基因库的数据公开之后,访问最多的将是药物和疾病的研究机构。
第二个是癌症数据库。目前国际癌症组织所有的数据信息也存于国家基因库,开业之后这里将提供全球的癌症数据,这对于未来癌症的诊断和治疗有重大意义,这也将是未来访问最频繁的一个数据库。
第三是大规模人群队列的数据库。徐迅表示,因为不同民族、不同区域的人群基因北京不同,这意味着疾病发病情况也不同,用药情况会有差别,所以这种区域性的队列数据不管是对技术科研还是应用来讲,都有很大意义。
梅永红表示,未来精准医学的发展和竞争在某种程度上取决于我们具有的基因资源,以及认知基因资源的能力。
从生物多样性的角度,国家基因库副主任、华大基因研究院的副院长张国捷阐释了国家基因库更“迷人”的意义。
张国捷表示,地球面临可以称之为第六次生物大灭绝,过去有五次生物大灭绝是由天灾引起的,但这次主要由人类大规模的屠杀和随便的携带引起的。
张国捷说,华大拥有的高通量测序技术可以将全世界的自然历史博物馆、动物园、植物园、动物保护区或者海洋研究基地基因资源完全收集起来,同时在基础研究上取得重要突破,全世界各个领域的科学家,做系统科学、病毒生物学等都可以利用这个平台产生各种各样的数据,形成各种规律,为我国或国际上制定政策提供指导意义。
未来,可能在国家基因库里有可能看到不仅仅是物种的标本,而是它的基因遗传信息,以数据的方式保存在云端,产生更大的价值。