2018-09-07 16:01:22
来 源
至顶网
成功案例
联想数据中心业务集团制造行业总监许子牛、诺禾致源副总裁吴俊接受了包括至顶网等多家媒体的采访,分享了基因测序领域对于高性能计算的需求,以及联想高性能计算如何帮助诺禾致源提供强大和智能的算力。

中存储网消息,在今年的世界超算大会(ISC2018)上,联想凭借117套入围的成绩,成为HPC TOP500榜单中全球最大的HPC解决方案供应商。作为首家获此殊荣的中国厂商,联想正在以“科技创新”赋能行业变革,为科研、教育、航天、气象、汽车、石油石化、生命科学等多个领域提供领先成熟的解决方案。8月31日,以“突破算力 决胜未来”为主题的2018联想全球超算峰会在京召开,会上,联想正式发布了自主研发的全新AI产品家族,展示了原创性的技术实力,分享了联想HPC促进国民经济升级,推动众多企业转型的成功实践经验,开启行业智能新时代。

联想HPC为生命科学赋能无穷算力,促进研究生命真谛

联想数据中心业务集团制造行业总监许子牛、诺禾致源副总裁吴俊接受了包括多家媒体的采访,分享了基因测序领域对于高性能计算的需求,以及联想高性能计算如何帮助诺禾致源提供强大和智能的算力。

更快、更强是基因测序领域对于高性能计算的核心需求

大家知道基因测序技术已被列为国家重点发展产业。据研究,每年的基因测序分析增长会在30%以上,数据量也将是越来越多,如何传输、保存和管理海量的基因数据是一个非常棘手的问题。为解决这一现状,HPC正被广泛应用于基因测序行业。在目前国内基因测序领域,诺禾致源是当之无愧的佼佼者,诺禾致源的业务覆盖科技服务、肿瘤基因检测及遗传检测三大领域,为全球研究型大学、科研院所、医院、医药研发企业、农业企业等提供基因测序、质谱分析和生物信息技术支持等服务。其中科研服务的内容是为科研院校、医院、药企提供测序的服务,从测序到后续的数据分析,最后给到客户分析报告,以便客户根据相应的实验设计挖掘出数据具体的生物学意义。

包括基因测序在内的生命科学研究对于高性能计算的需求是刚需。随着基因测序过程数据量的增幅速度加快。一方面需要对测序结果更快的呈现,一方面对于海量数据有极高的存储需求。

诺禾致源高级副总裁吴俊谈到“基因测序环节几年前需要7到8天,平均每天机器采集的数据量是200到300GB,现在测序环节只需要2.5天,但是数据量增减到6TB,这就面临一个问题,测序量又增大,时间减少,如何解决计算的问题。”

因此对于高性能计算的需求是一方面是高性能计算的配置要足够的优化,另外针对数据量比较大,每次数据收回意味着每一次成本都非常高,因此IO的读写速度也要跟得上,包括一些并行化的要求,吴俊谈到。

同时针对计算量和数据量海量的特征以及后续增长速度高的特点,诺禾致源采用了自建数据中心机房来解决成本以及本身业务的特殊性需求。

目前诺禾致源已在全球运行25台NovaSeq、20台PacBio Sequel、30台HiSeq X、11台HiSeq 2000/2500/4000、4台MiSeq、4台NextSeq 500、6台Life Ion Proton(DA8600)、2台S5XL和5套Q Exactive™ HF-X等最先进的基因测序仪,建立了亚洲通量规模最大的基因测序平台,将实现每年280,000人全基因组测序的超高通量。同时,全国首家引入Q Exactive™ HF-X高端质谱平台,打造最先进的生物质谱中心,为客户提供全面、深入的多组学解决方案。

联想HPC优势是能提供一个最完整的技术链

针对生命科学研究领域,联想作为国内HPC的领军者,不仅能为生物科学领域海量数据的研究提供超强计算能力和大容量存储服务等基础服务,最重要的是联想能够为整个产业提供一个完整的技术链。联想数据中心业务集团制造行业总监许子牛向中存储网记者表示针对包括生命科学研究等在内的医疗领域,联想能够提供一个完整的链。“所谓最完整的链指的是技术需求,从研发开始,生物制药需要研发系统、数据存储,包括光谱分析,成分分析、药动力分析,再过渡到生产以及通过各种认证最后到销售等。联想可以整合边缘计算的整体方案,从物联网到前端计算平台设计” 许子牛对记者向中存储网记者表示。

针对诺禾致源的高性能计算需求,联想做了缜密的需求分析。联想认为:生物信息学类计算的核心内容是内存密集型,存储密集型,结合联想多年来的经验,为诺禾致源提供了针对化专业化的解决方案。联想高性能计算主要解决诺禾致源对高性能、内存、存储和稳定性的四大问题。

首先,对于高性能计算而言,一方面是浮点处理性能,另一方面为CPU本身的综合性能,联想结合生物信息学行业的特点,推荐使用Intel处理器,不仅实现了较高的处理性能,并且在能效比,内存支持,以及CPU本身的架构上Intel都有很大的优势。

其次,在生物信息学应用中,先期数据的载入对于内存容量的要求越来越高,联想采用大内存服务器四路或者八路胖节点,可以在单节点中配置最高达2TB内存,充分达到应用的实际需求。

其三,海量存储系统是生物信息学计算的先决条件。联想不仅可以提供了专业级的直连存储,更有通过专有的存储节点构建并行文件系统或者是分布式存储系统,接入以太网,甚至40GB/56GB的Infiniband网络,总体容量可达到PB级,除此之外还考虑到用户的数据安全,数据备份等,从根本上解决了生物信息学的数据存储难题。

最后,一套高稳定性的系统能够使我们的生物信息学应用更加方便快捷,同时也能够高效率的处理数据,保证业务不中断,联想通过统一的集群监控管理,作业调度,结合联想高性能的服务器,从各个方面保证了整套系统的稳定性,大大提高了用户的使用稳定性和减少了故障率,为用户提高生产力提供持续不间断的支持。

据了解,联想提供的刀片式高性能运算系统,提供了将近200万亿次计算能力,配置超过10PB的存储空间,很好的承载了诺禾致源华东地区的业务,有效的改善公司在华东计算资源不够的限制。

如今诺禾致源已经拥有全球领先的高性能计算平台,数据中心运算能力已提升至1727T flops,总内存410TB,总存储60.2PB,有效地支撑着生命科学研究和医疗健康两大领域对大数据分析和存储的需求。

可以看到联想为诺禾致源提供了完整的测序数据分析服务,对数据进行自动解析,重新发现很多有用信息,实现基于预测功能的软件运行速度提升,同时还提升了对CPU的利用率。

声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。