首页> 关注此文用户还关注:

科学数据服务标准化与规范化研究

产出机构: 中国科学院文献情报中心
提交机构: 中国科学技术信息研究所
产出日期: 2023-05-28   
发布日期: 2023-12-27   
作者: 蒋甜;许哲平;陈学娟;曾燕;

 

摘要: 良好的科学数据服务是科学数据价值实现的桥梁和媒介。科学数据资源多、产生方式多、数据类型复杂,科学数据服务面临诸多挑战。为确保科学数据在全生命周期内的合规使用和有效保护,满足科技创新对科学数据的管理需求,亟需构建完善的标准化体系进行保障。 本文对国际国内科学数据服务相关标准规范进行了广泛调研,发现科学数据服务的标准化程度在不同学科领域、科学数据服务的不同环节存在较大差异,目前尚未形成贯穿科学数据全生命周期的服务标准。作为国际标准化组织, ISO制定的科学数据服务标准呈现三个特点。一是从学科划分来看,主要涉及生命科学与地理信息领域的科学数据及元数据标准。二是从数据生命周期来看,主要涉及数据采集、数据管理、数据保存、数据出版、数据引用、数据及元数据描述等环节的标准,缺乏数据分析、数据处理、数据归档、数据再利用,以及数据管理计划(DMP)的相关标准。三是从元数据相关标准涉及的内容来看,可将其划分为描述型元数据、元数据管理、元数据注册与索引三种主要的元数据相关标准类型。世界数据系统(WDS)、国际数据委员会(CODATA)、国际科学数据联盟(RDA)等在推动国际科学数据服务的标准化和规范化方面发挥了重要作用。WDS致力于促进对数据标准和公约的遵守,并采用数据共享原则推进其目标的实现。针对科学联盟内部和之间的大量数据和信息标准之间存在的重复或不兼容问题,CODATA倡议在科学联盟之间协调数据标准。RDA与欧洲ICT标准化平台等标准制定组织建立了协同机制,为RDA建议成为标准并全面促进采用提供了有效渠道。 综合国家和行业标准可以看出,我国科学数据服务标准呈现出两个主要特点。一是从学科划分来看,涉及生命科学、地理信息、农业、林业、生态、气象、空间科学、海洋、机械等多学科领域。二是从数据生命周期来看,这些标准包括数据汇交、数据管理、数据处理、数据归档、数据出版&共享、数据引用、元数据等环节,对于数据分析和数据管理计划(DMP)相关标准鲜有涉及。目前,我国科学数据服务标准化工作取得了长足进展,但需要清醒认识到的是我国科学数据服务标准建设仍存在诸多问题,包括各学科标准体系建设缺乏顶层指导和统筹协调、标准兼容性差、缺少能够面向全国乃至全球的科学数据服务标准等。针对这些问题,本文提出推进我国科学数据服务标准化进程的思考与建议。 第一,加强顶层设计,兼顾学科领域和数据服务主体的一致性和差异性。  认真贯彻落《科学数据管理办法》的决策部署,注重科学数据服务标准与其他科学数据标准的衔接,加快构建系统、科学、规范的科学数据服务标准体系,充分发挥标准对科学数据使用和共享的指导和规范作用。科学数据所涉及的学科领域多、数据类型复杂,在制定科学数据服务标准时既要有学科普适性的条目,也要设计一些针对特定学科的选择性条目。同时,在标准制定过程中,也要充分考虑不同科学数据服务主体,如科学数据中心、高校图书馆等在科学数据服务内容和方式上的共性和差异。建立既能高度协调统一,制定又能兼顾各专业领域和数据服务主体特点的科学数据服务标准。 第二,多方协同参与研制,团队成员包括多个数据中心和一线管理机构部门。 科学数据服务涉及科学数据中心、高校图书馆、国家科技基础条件平台中心等多个利益相关方,科学数据服务标准的制定也需要多方协同参与。以《科技计划形成的科学数据汇交》系列标准为例,由国家科技基础条件平台中心、中国标准化研究院、中国科学院计算机网络信息中心等24家单位共同起草,覆盖生物、海洋、地理、医学、农业、林业、交通运输、空间科学等各个学科领域。 第三,加强对ISO标准以及国际知名科学数据平台或机构在数据服务标准规范方面的参考。 发达国家较早重视科学数据的积累和重用,在国家科学管理总体框架与行业领域科学数据管理等方面形成布局和多样化的运行机制。ISO标准更多地从技术层面为科学数据服务提供操作标准和技术指导,NCBI、NASA等国际知名科学数据平台或机构对具体学科领域制定了一系列体系化的标准规范。通过借鉴国外相关标准规范和研究成果,梳理其服务规范的结构框架和具体内容,并选择相关科学数据平台进行服务实践,能够为下一阶段进行国家标准或行业标准的研制提供依据和参考。在标准制定过程中,一方面吸纳借鉴ISO标准以及国际知名科学数据平台或机构的科学数据服务标准规范内容,另一方面,注重与国际标准的兼容,推动我国标准的国际化进程。
关键字: 科学数据服务;科学数据标准;标准化;规范化;科学数据管理

本文为《中国科技资源导刊》2023年第3期《科学数据服务标准化与规范化研究》缩略版,全文见附件。