摘 要
随着计算机和信息技术的
快速
发展,统计自然语言处理
相关技术研究取得了极大进展
,
得到了极大成果
。
因为对文本校对技术的需求这项技术得到全面重视
,它
同时
是语言处理领域重要
研究方向
。中文文
本
智能
校对分为
文本
查错和
文本
纠错两个步骤,针对这两方面本文做了以下工作:
(1)
中文同音词的局部校对
:
中文文本错误类型多种多样,在分析每种类型的基础上并且结合实际发现同音词错误
占据
了很大的比例,
对此
首先运用最简单的
n-gra
m
(
二元
)模型
;再
由
二元模型和
前后
文语境
相互补充
;通
过对
实
文本智能校对的实现-12506字.docx