首页> 关注此文用户还关注:

欧美建设发展科学数据中心的经验及对我国的启示

产出机构: 国家科技基础条件平台中心
提交机构: 中国科学技术信息研究所
产出日期: 2022-05-23   
发布日期: 2022-06-16   
作者: 石蕾;高孟绪;徐波;王瑞丹;

 

摘要: 大数据时代对科学数据的建设发展提出了新的挑战,世界各国科学数据中心快速发展,形成了一批具有较 强国际影响力的科学数据中心,并开展数据资源管理与共享服务。在调研欧美等国家具有较强影响力的科学数据中心 建设发展情况的基础上,总结数据中心在数据库建设、数据管理应用服务平台研发、数据全生命周期管理、数据服务 等方面的特点,提出加强我国科学数据中心建设的思考与建议。
关键字: 科学数据;数据管理;数据共享;科学数据中心;国际经验

科学数据是科技创新活动的重要产出,大数据发展把科学研究带入以数据密集型科学研究为特点的“第四范式”,为发挥科学数据集成性优势,世界各国积极推进科学数据中心建设,开展科学数据的汇聚、管理、存储、开放与利用。我国科学数据中心建设起步较晚,虽然近年来在数据中心建设和科学数据共享应用方面取得了积极进步,但相比较欧美等国已建成的具有较强影响力的科学数据中心,仍然存在系统性差距。本文梳理总结发达国家科学数据中心建设发展经验做法,力求为我国国家科学数据中心建设发展提供借鉴。

欧美等发达国家上世纪六七十年代就开始重视对科学数据进行积累与开发应用,依托科研机构或高校陆续建设了若干国家级科学数据中心,对科学创新、教育与国民经济发展起到了重要支撑作用。总结其科学数据中心建设发展经验,主要体现在以下几方面:一是在数据资源建设方面,将建设数据丰富、内容完整、信息准确的科学数据库作为数据中心建设的重中之重,形成数据中心的核心优势。二是在数据资源管理方面,数据中心普遍开展数据的全生命周期管理,有效增强其对科学数据的整合汇聚和服务能力。三是在基础设施建设方面,数据中心持续开展各类系统平台及软件工具的研发与更新,同时注重对硬件平台进行升级与扩展,以满足对大规模、多类型数据的高效管理与应用需求。四是在数据中心人才队伍建设方面,高水平科研人员和专业化数据工作者在数据中心团队中普遍占较大比例。五是在可持续发展方面,数据中心建设发展与学术领域发展结合愈发紧密。

近年来,我国科技创新发展促使源源不断产生海量科学数据,将我国科技创新活动也带入了以数据积累和应用为重要科研方式的新阶段。2018年,国务院办公厅印发《科学数据管理办法》,2019年,科技部、财政部组建首批20个国家科学数据中心,按照学科领域开展数据资源体系建设,持续开展数据资源汇聚,提高对科技创新活动的数据服务能力,面向国家重大发展战略、科技创新热点以及新冠疫情防控等民生发展需求开展数据资源服务,有效推动科学数据开放共享与应用。

借鉴发达国家科学数据中心建设发展的经验做法,建议在以下几方面持续加强我国科学数据中心建设。

一是系统谋划科学数据中心数据资源积累、管理分析平台研发与基础设施建设。在深入分析我国科学数据资源现状和相关学科领域发展趋势的基础上,认真研究并系统规划科学数据中心发展目标和思路,一体化推进科学数据资源汇聚与积累、数据管理与分析应用服务平台建设,以及承载数据存储应用等需求的科研基础设施建设,实现系统性协同发展。

二是开展高质量数据库建设,形成典型优质科学数据产品。加强战略性、基础性科学数据库建设,紧密对接相关领域科研活动实际需求,提升科学数据库质量,建立稳定的科学数据汇聚渠道和高标准的数据质量控制机制,建成一批能够满足科研需求且持续更新的高质量科学数据库。面向流通需求形成科学数据产品,满足科研人员对便捷获取科学数据资源的广泛需求。

三是完善基于全生命周期的科学数据管理机制,增进学术融合。将科学数据管理贯穿科学数据生命周期,加强相关政策制度制定,完善运行管理机制,优化标准体系。以科技计划项目科学数据汇交为切入点,优先加强政府预算资金资助的科技计划项目形成的科学数据的全生命周期管理。积极推动学术论文相关科学数据管理与共享,促进科研论文相关科学数据向数据中心汇交,让科学数据在科研支撑、学术传播和科研诚信体系建设等方面发挥更大作用。

四是打造有效服务科研人员的科学数据管理与应用平台。深刻理解大数据对科学研究思维模式和研究范式带来的影响,以及大数据技术对科学数据管理与分析应用技术革新的影响,开展科学数据整合与分析挖掘软件工具研发,打造科研领域的数据分析应用服务平台。完善系统平台对异构数据的兼容能力和多指标数据的汇聚和识别能力,提升数据平台对大规模、复杂性数据的实时处理和智能发现能力,完善基于多用户的数据应用服务支撑系统。

五是加强国家科学数据中心建设,重视专业化的人才队伍培养。充分发挥国家科学数据数据中心作用,做好相关领域科学数据的汇聚整合、存储管理与开放应用。建立完善科学数据资源标识体系,对汇入国家科学数据中心的科学数据资源进行统一标识,支持科学数据资源定位、访问与确权。探索建立适合国家科学数据中心建设发展的人才培养与晋升机制,培养专业化、复合型的科学数据应用服务人才,优化适合稳定高水平人才的人员晋升发展机制,探索保障科研人员贡献的数据开放共享权益保护新机制。

本文为《中国科技资源导刊》2022年第3期《欧美建设发展科学数据中心的经验及对我国的启示》缩略版,全文见附件。