首页> 关注此文用户还关注:

面向科技文献的日汉双向实用型机器翻译合作研究

产出机构: 中国科学技术信息研究所
提交机构: 中国科学技术信息研究所
产出日期: 2016-03-31   
发布日期: 2018-04-20   
作者:

 

摘要: 

本项目通过中日共建日汉双语语料,包括日汉双语词典和平行句对语料的构建,提升中日双方在机器翻译方面资源的贡献与共赢。通过双方技术交流与合作,提升中日双方日汉句法分析技术的质量,进而提升日汉双向机器翻译引擎的性能。研制的日汉机器翻译引擎在国家科技图书文献中心在线试用,将提升中方科技人员对于日文文献的跨语言检索和使用。

关键字: 日汉双语语料;机器翻译;句法分析;翻译引擎;科技文献

  目录
  1. 引言 
  2. 日汉双语语料生产 
  2.1 基于枢轴语言的语料构建方法
  2.1.1 日汉平行语料构建方法 
  2.1.2日汉翻译词典构建方法
  2.1.3 自然语言资源加工管理平台 
  2.2. 基于众包的语料构建方法
  2.2.1众包翻译平台设计及实现 
  2.2.2基于众包的双语句对翻译辅助平台设计 
  3 句法分析 
  3.1 句法分析现状 
  3.1.1 基于转移的句法分析技术 
  3.1.2 汉字粒度的中文句法分析
  3.1.3 分词、词性标注、句法分析的统一框架
  3.1.4 领域自适应技术 
  3.2 前期研究基础
  3.2.1 基于图的句法分析技术 
  3.2.2 基于转移的句法分析技术 
  3.2.3 两种方法的关系
  3.2.4 中文句法分析存在的问题 
  3.3 研究目标及研究方案 
  3.3.1 基于转移的句法分析技术 
  3.3.2 汉字粒度的中文句法分析 
  3.3.3 分词、词性标注、句法分析的统一框架
  3.4 句法分析系统构建
  3.4.1 总体框架
  3.4.2 实例:从生语料到汉字粒度句法树 
  3.4.3 有约束的解码对句法分析器精度的影响 
  3.4.4 提升句法分析器性能的策略 
  3.4.5 句法分析器的特征设计与参数优化
  3.4.6 面向科技文献的句法分析
  4 机器翻译 
  4.1. 汉日双向机器翻译系统框架
  4.2翻译模型构建 
  4.2.1词对齐 
  4.2.2短语抽取 
  4.2.3搜索算法 
  4.3. 日汉双向机器翻译优化算法
  4.3.1翻译模型的压缩 
  4.3.2语言模型的压缩
  4.3.3翻译概率优化
  4.3.4语言模型概率优化 
  5. 结论 
  5.1 句法分析 
  5.2 日汉双语语料建设
  5.3 机器翻译 
  参 考 文 献