通过与浪潮HPC并行优化团队的合作,中国石油BGP成功完成对具有独立知识产权GeoEast软件中的SOM多属性聚类解释模块的并行算法开发和优化。优化后的SOM算法较原有算法,计算时间缩短6倍,同时也解决了串行版本由于内存空间不足,无法进行大规模数据处理的问题。
近几年,人工智能和GIS技术发展迅速,在石油勘探开发领域中解决了许多实际问题,体现出极大的应用潜力。在众多的人工智能技术中,自组织特征映射神经网络(Self- Organizing Map,简称SOM)是一种非常重要的算法,广泛应用在裂隙性油藏预测、基于最佳测井数据的油藏特征研究等油藏管理环节中。
SOM,石油勘探的“火眼金睛”
SOM是由芬兰赫尔辛基大学神经网络专家Kohonen教授在1981年提出的。这种网络模拟大脑神经系统自组织特征映射的功能,是一种竞争型网络,并在学习中能无导师进行自组织学习,主要用于对输入向量进行区域分类。SOM是多维数据可视化的有力工具,能够揭示隐藏在多维数据中的复杂非线性关系,并将其在低维空间中以简单的几何关系展现出来。
脑神经学研究结果表明,神经元之间的信息交互具有的共同特征是:最临近的两个神经元互相激励,较远的神经元互相抑制,更远的则又具有较弱的激励作用。而SOM正是基于这一原理,根据设定的学习规则,能自动对输入模式进行分类,并通过对输入模式的自组织学习,将分类结果表示出来。
因此,SOM主要功能就是聚类,帮助研究人员从繁琐、耗时且易出错的人工统计工作中脱离出来。与其他聚类方法相比,SOM网络的优点在于:可以实现实时学习,网络具有自稳定性,无须外界给出评价函数,能够识别向量空间中最优意义的特征,抗噪声能力强,一般不依赖于数据分布的形状。
举例来讲,在石油勘探中,研究人员在选定位置放置炸药,爆炸引起的弹性波在岩石中传播时,当遇着岩层的分界面,便产生反射波或折射波,在它返回地面时用高度灵敏的仪器记录下来,根据波的传播路线和时间,确定发生反射波或折射波的岩层界面的埋藏深度和形状,认识地下地质构造,以寻找油气圈闭。SOM可以将收集的地震波数据进行分类,然后根据设置的学习规则,自动寻找有利的油气储存空间。
浪潮,让SOM变成“三头六臂”
随着石油勘探开发程度的加深以及难度的增大,SOM算法的数据量也不断增加,这使得采用单CPU单线程串行计算的SOM软件,在处理数据体时速度变慢、效率很低,难以满足实际生产的需要。更严重的是,当数据超出一定量级时,由于内存容量的限制,串行程序的SOM将无法进行数据处理。
为解决上述困局,浪潮与中国石油BGP合作,联合对GeoEast软件中的SOM多属性聚类算法进行并行优化并取得了较好的效果。
在对原SOM多属性聚类算法及代码分析后,浪潮高性能计算并行团队提出了从硬件(计算节点、网络互联、存储节点)到软件(参数优化、代码优化)的一揽子解决方案,综合利用多核CPU计算设备、内存、磁盘、网络等系统资源,最大化提升软件整体效能。特别在算法方面,浪潮与客户算法专家团队共同成立专门联合攻关项目组,对模块算法进行深度改造,以适应不同内存容量配置的系统平台,实现小内存平台能够处理大规模数据作业,解决了原串行程序无法处理大数据的问题。,
原串行版本程序运行一个作业的时间大约为1247秒,优化后的并行版本程序运行同一作业在开启12个并行线程的条件下,运行时间约为200秒,加速比达到6倍,大幅降低了作业时间。同时,优化后的程序顺利实现了在小内存的硬件环境下,对大规模数据的处理。
某石油研究机构实际数据性能测试结果
经过与浪潮应用开发团队合作,对GeoEast软件中的SOM多属性聚类解释模块进行并行算法的开发和优化后,较原有算法获得比较好的的加速比。在大幅降低计算时间的同时,也解决了原串行程序由于内存空间不足,无法处理大规模数据的问题。
浪潮是国内最早将应用优化视为核心竞争力的HPC整体解决方案供应商,并在异构计算技术兴起后,率先推动GPU和MIC技术走向落地,致力于异构应用发展和人才培养,促进异构技术的产业生态环境建设。
目前,浪潮已经分别与英特尔和英伟达联合成立并行计算实验室,合作开发优化基于MIC和GPU的并行应用,涉及石油天然气、数值气象预报、生命科学、计算流体力学、金融风险分析、电磁仿真、CAE、机器学习等诸多领域。同时,浪潮高性能计算应用软件开发团队是目前同时掌握CPU、GPU、MIC应用技术的国际领先团队,在CPU、GPU、MIC技术方面已取得多项研究成果,并成功在SC和IDF大会上成功展示。
声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。