机器翻译分词研究
本研究对中文分词研究的历史、现状、难点以及主要切分方法进行了广泛调研,并对机器翻译中使用断字、机械分词和字标注分词等不同分词方法进行了对比实验,通过分析和统计不同切分方法对机器翻译的影响,总结和归纳了包括总分词数、分词词表数和分词错误等影响机器翻译的主要因素,以作为机器翻译中分词优化方向的指导。
目?? 录
一、分词研究现状与不足?1
??? 1.1 分词的影响?1
??? 1.2 中文分词的困难?2
二、主要分词方法?2
??? 2.1 机械分词方法?3
??? 2.2 基于统计和机器学习的方法?3
三、机器翻译中的分词研究现状?3
四、翻译对比实验?4
五、结果分析?6
??? 5.1 总分词数?6
??? 5.2 词表词数?7
??? 5.3 分词错误?7
总结?9