首页> 关注此文用户还关注:

面向科技监测的实体识别与关系抽取研究2015年度进展报告

产出机构: 中国科学技术信息研究所
提交机构: 中国科学技术信息研究所
产出日期: 2016-01-05   
发布日期: 2018-08-13   
作者:

 

摘要: 

传统的科研跟踪和监测主要依赖于专家评议和基于论文、专利等文献元数据进行的计量分析,而缺乏对文献内容的微观分析。随着信息技术、大数据分析的深入发展,对文本内容的研究越来越深入,研究者越来越重视从文本内容中发掘的新知识。基于这一现状,本项目基于自然语言处理、数据挖掘和知识工程等技术研究科技实体的识别和实体关系的抽取,实现微观层面的科技监测所需的信息和知识抽取。 本研究自2015年1月开始,到目前为止按照研究进度安排了文献调研、本体库构建工作、科技文献及知识库的资源搜集和建设、科技词汇构词研究等工作。

关键字: 科技监测;关系抽取;科研跟踪;计量分析;构词研究

  目录
  1 研究进展............................................................. 2
  2 科技词汇构词研究..................................................... 3
  2.1 相关研究综述 ....................................................... 3
  2.1.1 研究范畴.......................................................... 3
  2.1.2 自然语言处理构词的相关研究........................... 4
  2.1.2 语言学构词研究.................................................. 5
  2.1.3 术语学构词研究................................................. 8
  2.1.4 小结................................................................. 10
  2.2 科技词汇构词过程 .............................................. 10
  2.2.1 句法-语义过程 ................................................. 11
  2.2.2 认知过程......................................................... 14
  2.2.3 翻译过程.......................................................... 17
  2.2.4 审美过程......................................................... 18
  2.3 科技词汇标注体系 .............................................. 20
  2.3.1 整体设计思路................................................... 20
  2.3.2 标注内容的设定............................................... 20
  2.4 标注体系............................................................ 25
  3 结论..................................................................... 26