定制化中文拼写检查系统

发布者:柳鑫发布时间:2021-11-04浏览次数:1203

项目简介:

中文拼写检查指将中文文本中由于读音或者字形相似产生的错别字修正过来。当前SOTA的系统完全依赖神经网络模型,灵活性欠缺。比如用户可能发现某类词修改不佳,为了改正此问题模型只能重新训练。本系统将提供用户可定制化功能,即针对特定词表中词,系统进行错误修正和正确词保留。为了实现该目标,我们将设计多种词表相关特征和数据增强方法。曾获2016 MSRA Fellowship