首页> 关注此文用户还关注:

中国分类主题词表SKOS模型转换研究

产出机构: 中国科学技术信息研究所
提交机构: 中国科学技术信息研究所
产出日期: 2021-06-23   
发布日期: 2022-06-17   
作者: 许德山;潘优;兰天;何彦青;吴振峰;徐红姣;

 

摘要: 

《中国分类主题词表》是我国知识组织领域目前规模最大、内容组织最全面和丰富的分类主题一体化词表,该表融合了《中国图书馆分类法》和《汉语主题词表》的优势,可满足用户从领域分类组织和主题聚焦检索的双重需求。传统分类主题词表主要为图书情报人员的信息标引工作而构建的,如何将传统的词表结构转换为人机都可用的知识结构,使其在当前多源、异构、海量环境下发挥作用是图书情报工作新的方向和热点,本研究便是以W3C推荐的简单知识组织标准-SKOS模型为基础,SKOS(Simple Knowledge Organization System)是基于RDF/RDFS的简单知识组织模型,为受控词表、词典、分类表等知识系统的管理提供了可重用、分布式的词汇链接组织方式。通过将最新的《中国分类主题词表》第三版转换为SKOS本体知识网络,并将其发布为服务系统,为大规模的文献分析、实体抽取、机器翻译等上层应用提供知识服务。需要指出的是,由于《中国分类主题词表》内容在组织结构上呈现复杂、多维、交叉、信息量大等特点,通过一次单一的转换难以形成有效的知识体系,需要经过多次的扩充和完善。本次转换方案便只针对分类体系和叙词体系,分类体系和叙词体系对应的附表以及附表与主表的参照关系将在后期完善。

本研究共分为七个章节。第一章,介绍本次《中国分类主题词表》转换研究的总体状况。第二章,介绍《中国分类主题词表》第三版的内容组织形式;第三章,介绍W3C推荐标准SKOS模型的建模词汇和组织结构;第四章,详细介绍分类体系的组织形式、款目结构以及与描述主题词的转换方法,并通过选取代表性的分类款目进行转换分析和示范;第五章,详细介绍叙词体系的组织形式、款目结构以及与对应分类体系的转换方法,并通过典型的主题词款目进行转换分析和示范;第六章,对《中分表》与SKOS模型转换中的复杂形式进行分析和总结,形成转换方案;第七章,对转换结果进行分析,总结转换经验,发现存在的问题,为进一步的扩展和完善提供参考。

关键字: SKOS模型应用;词表形式化;概念知识关联

目  录

1 引言

2 中国分类主题词表 (第三版)的内容组织

2.1《中国图书馆分类法》第5版的组织结构

2.2《汉语主题词表》的内容组织

3 SKOS知识组织系统

3.1 SKOS核心建模元语

3.2 SKOS-XL建模元语

3.3 SKOS模型的语义关系

4 分类号-主题词对应表SKOS模型转换

4.1款目格式

4.2款目符号

4.3转换方法

4.4转换示例

4.5转换模板

5主题词-分类号对应表SKOS转换

5.1款目格式

5.2款目符号

5.3转换方法

5.4转换示例

5.5转换模板

6映射转换的特殊处理

6.1分类号ID

6.2分类主题词与叙词

6.3专用名ID

6.4分类号上下位关系

7转换测试

7.1三元组存储

7.2测试结果统计