科研动态

博士生徐灏在《Environmental Modelling & Software》发文

2018-10-09

地球科学系博士生徐伟是第一作者。李莎是第二作者。中国气象局国家气候中心白玉琪副教授,王斌教授和吴同文教授作为该通讯的合着者,在线发表了《Environmental Modelling & Software》。分布式网格化环境数据的协作分析框架。 TR 该研究为分布式存储地球科学数据提供了一种简单有效的协同分析解决方案,并将数据分析工作从客户端传输到服务器,从而大大降低了科学用户对本地存储计算资源的依赖性。研究合作者还包括中国气象局博士生董文浩,黄文宇副教授,徐世明副教授,林艳琪教授,吴芳华,辛小歌,张力,王在志等。 TR 本文以气候模型数据为例,采用CMIP5数据分析作为典型应用场景,完成方法研究。 CMIP5的全球数据约为1.5PB,分布在全球约30个数据中心。 PCMDI提供的模型数据管理和分析方案是:模型数据中心发布数据; ESGF提供了一个中央索引和检索系统;研究用户最终从模式数据中心下载数据并在本地计算环境中执行分析。 TR 当前解决方案的缺点非常明显:模型数据的全局下载过大,重复程度太高,研究人员必须拥有强大的硬件资源。另外,数据分析的常用方法缺乏共享,不同的研究人员经常需要反复编写类似的分析脚本来实现相同的分析功能。为了应对即将到来的CMIP6数据分析工作,以及IPCC第六次评估报告的编写,迫切需要提出一种更有效,灵活和可扩展的模型数据比较分析方法。 TR 本研究分析了现有模型数据处理软件的缺点,设计并实现了环境数据协同分析框架(CAFE)。 CAFE系统在逻辑上由中央服务器,若干工作节点和连接到工作节点的若干Web用户界面组成。 CAFE工作节点部署在各种数据中心中。多个CAFE节点具有协调机制以形成全局统一逻辑视图。用户可以通过任意Web用户界面实现数据检索,数据选择,参数设置和分析任务提交,从而实现分析进度查询和分析结果查看和下载操作。 CAFE的典型技术特征是用户无需下载原始数据即可获得最终分析结果。

图1 CAFE系统的逻辑设计

目前,澳门赌场网址地球科学系,中国气象局,国家无锡超级计算中心,华东师范大学,中国科学院,河海大学等地球系统模型开发单位正在部署和委托CAFE软件原型建立气候模型数据。 。协作分析的实验网络。 TR 在国际上,CAFE软件提出的协作分析方法已经引起了世界气候研究计划(WCRP)耦合仿真工作组(WGCM)国际模型数据基础设施委员会(Infrastructure Panel)的关注。白玉琪副教授应邀介绍了CAFE的协作技术特点,以及他在国际综合地球观测组织(GEO)推动建立国际地球观测数据基础设施(GEOSS)方面的长期经验。正在进行的国际第六耦合模型比较计划(CMIP6)预计将产生20-40PB模型模拟和预测预测。 CAFE有望显着降低未来全球CMIP6数据分析所需的海量数据传输和本地化存储管理分析的需求,并显着提高模型比较计划的科研效率。

《Environmental Modelling & Software》是环境和计算机领域跨学科领域的高级期刊。根据汤森路透2017年文献引文报告,其2017年影响因子为4.177。中国科学院JCR部门是计算机跨学科应用的顶级期刊。

本文的引用和原始链接信息如下:
徐,李,白,董文,黄伟,徐思,林,王蓓,吴福,辛新,张..分布式网格化环境数据协同分析框架。环境建模&软件。: 10.1016/j.envsoft.2018.09.007
原文链接:https://doi.org/10.1016/j.envsoft.2018.09.007