成功案例

一、背景

 

  基因检测是通过血液、其他体液、或细胞对DNA进行检测的技术。基因检测可以诊断疾病,也可以用于疾病风险的预测。疾病诊断是用基因检测技术检测引起遗传性疾病的突变基因。目前应用广泛的基因检测是新生儿遗传性疾病的检测、遗传疾病的诊断和某些常见病的辅助诊断。目前有1000多种遗传性疾病可以通过基因检测技术做出诊断。基因作用的表现离不开内在的和外在的环境的影响。在具有特定基因的一群个体中,表现该基因性状的个体的百分数称为外显率;在具有特定基因而又表现该一性状的个体中,对于该一性状的表现程度称为表现度。外显率和表现度都受内在环境和外在环境的影响。

 

二、传统存储方案

 

 

  传统的SAN、NAS存储特点以及在基因测序应用中的局限:

 

SAN:

 

  SAN提供通过高速光纤通道或者以太网络给应用的是块级访问接口。在应用端看到的是一块硬盘,实际使用时需要进行格式化处理或者另外配置管理软件。SAN具有如下几个特点:

 

1. 不能文件共享

  该方案相比直连盘阵(DAS)更具灵活性和可扩展性,SAN不能支持文件级共享。在具有数据中心的环境中,不能文件共享的SAN会给数据共享和调用、管理维护带来巨大的成本,同时也会影响业务运行的效率。

 

2. 扩容、使用复杂

  SAN使用了大量专用、复杂的硬件,这就需要较高的系统构建成本、运营维护成本,兼容性的问题也会对系统将来的升级带来不便。SAN的扩容过程也需要将业务停止进行迁移,影响业务连续性。

 

NAS:

 

  NAS是一种较为简易的文件共享解决方案。NAS通过NFS/CIFS协议给前端应用提供全局的文件共享,来满足多应用服务器之间的业务协作。在具有大量数据,并且有高并发的环境中存在以下两个问题:

 

1. 性能瓶颈

  NAS以集中式数个NAS机头的方式为应用提供存储服务,其性能受限于该服务器的配置,其总带宽一般不超过200MB/s。在业务访问量较大的情况下,NAS将很快成为业务的性能瓶颈。NAS即便使用多台NAS机头同时提供服务,但是其数量极为有限,导致其性能受限于NAS机头的数量。

 

2. NAS容量和规模限制

  NAS系统存在系统容量(如数百TB)、单卷容量(如数十TB)、文件数量(如数百万)等诸多限制。在数据不断增长的情况下,这些限制将会给数据的统一管理维护带来不少困难。

 

三、龙存集群存储方案

 

  LoongStore是面向海量数据存储和高并发访问的应用而设计的大规模通用集群存储系统,采用通用智能存储节点作为基本的构建单元,为应用提供全局统一的系统映像和完全POSIX兼容的API接口。

 

  LoongStore集群存储系统采用了完全的分布式架构,将存储服务器集群和元数据服务器集群通过高速以太网络构建,两部分集群都具备良好的扩展性和可靠性。利用LoongStore的高可用软件功能消除集群内的设备级单点故障,避免因为故障而导致服务中断或者数据丢失等影响,并且打破传统存储系统容量、文件数量的种种限制。

 

  龙存方案拓扑图:

 

四、目前服务的主要内容

 

  随着人类对基因研究的不断深入,发现许多疾病是由于基因结构与功能发生改变所引起的。科学家将不仅能发现有缺陷的基因,而且还能掌握如何进行对基因诊断、修复、治疗和预防,这是生物技术发展的前沿。大幅度提升基因组和生物信息学新技术、新方法等计算生物学研究的能力,解决生命科学领域的国际前沿问题和国家重大战略需求的科学问题,使用龙存存储系统,可独立支撑各类基因测序任务,平台上运行了基因应用软件,整体性能是传统存储系统的3倍。通过特有的元数据集群技术,可解决小文件检索缓慢问题。且系统适应性强可以兼容多种不同的基因程序同时运行,有效支撑起各种应用程序的访问压力。