基于语境与文本结构融合的中文拼写纠错方法
刘昌春, 张凯, 包美凯, 刘烨, 刘淇

Research on Chinese spelling correction based on the integration of context and text structure
Changchun Liu, Kai Zhang, Meikai Bao, Ye Liu, Qi Liu
表3 SIGHAN数据集的数据量
Table 3 The amount of data in SIGHAN dataset
SIGHAN句子数量平均长度错字数量
13(训练集)70041.8343
14(训练集)343749.65122
15(训练集)233931.33037
13(测试集)100074.31224
14(测试集)106250.0771
15(测试集)110030.6703