首页> 关注此文用户还关注:

机器翻译分词研究

产出机构: 中国科学技术信息研究所
提交机构: 中国科学技术信息研究所
产出日期: 2011-06-30   
发布日期: 2012-05-17   
作者:

 

摘要: 

本研究对中文分词研究的历史、现状、难点以及主要切分方法进行了广泛调研,并对机器翻译中使用断字、机械分词和字标注分词等不同分词方法进行了对比实验,通过分析和统计不同切分方法对机器翻译的影响,总结和归纳了包括总分词数、分词词表数和分词错误等影响机器翻译的主要因素,以作为机器翻译中分词优化方向的指导。

目?? 录

一、分词研究现状与不足?1
??? 1.1 分词的影响?1
??? 1.2 中文分词的困难?2

二、主要分词方法?2
??? 2.1 机械分词方法?3
??? 2.2 基于统计和机器学习的方法?3

三、机器翻译中的分词研究现状?3

四、翻译对比实验?4

五、结果分析?6
??? 5.1 总分词数?6
??? 5.2 词表词数?7
??? 5.3 分词错误?7

总结?9

关键字: 机器翻译;分词;研究