云服务使低价基因组数据存储成为现实 云和虚拟化
在医学及生物学领域里,只要涉及到基因组的研究项目,往往至关重要却又花销不菲,上个世纪提出的人类基因组计划还没有完成,预算却已达30亿美元。由于技术的发展,基因组测序及DNA解码的速度越来越快,所获得的基因组数据也爆炸性增多,仅仅一个研究所每30分钟就可产生200TB的原始数据,这些数据的存储与处理,又成了一个亟待解决的问题。
云服务使低价基因组数据存储成为现实
就目前的情况来说,解码基因组所获取的原始数据一般是交给大型的商业数据中心来存储,代价十分高昂。去年十月,美国国家癌症研究所宣布耗资1900万美元将2.6PB的癌症基因图谱数据转移到云服务器,就数据量而言,这个价格相比于普通的商业数据中心已经算是十分低廉。可是由于科研经费有限,数据量又十分巨大,对于存储基因组数据,科研机构依旧捉襟见肘。
不久前,谷歌率先提出了一项专门针对基因组存储的云端服务,提供了专门的网络结构和浏览器供研究人员搜索数据。随后,亚马逊、微软与IBM等云服务巨头也紧跟其后,并且与谷歌打起了价格战,谷歌表示,每个基因组每年的存储费用大约为25美元,如果数据经过压缩,费用还可降低至0.25美元一年。
或将促进基因研究大发现
从前,各研究所解码的基因组数据分散在许多不同的商业数据中心里,相对而言比较闭塞,信息流通不畅,给科学研究带来了一定的阻碍。而现在,基因组的云存储模式如果能持续发展下去,不仅会促进生物医学界,还能催生新的商业机会。
事实上,国外已经有许多初创公司被云服务所推动而获得了快速发展,如DNANexus和sevenbridge等,这些公司推出了面向医院和科学家的检索软件,以供他们检索基因数据。同样的,由于检索对比基因组数据变得十分容易,未来的医疗可能会基于某种“全球基因网络”。如果某位患者身患癌症,医生只要对其正常细胞的基因组和其癌细胞的基因组测序,然后与云端服务器中的上亿组数据对比,就有很大概率准确的发现问题所在,并提供可靠的的治疗方案。
通过将基因组数据存储到云端,不仅节省了成本,还使得可以生物学家同时对成百上千万的基因进行研究,这无疑会大大加快基因研究的步伐。