基于改进音形码的中文敏感词检测算法
周昊,沈庆宏
Chinese sensitive words detection algorithm based on improved sound⁃character code
Hao Zhou,Qinghong Shen
表3
汉字结构示例与编码
[
4
]
Table 3
Structure example and coding of Chinese
结构
示例用字
编码
结构
示例用字
编码
独体字
个、大、天
0000
右上包围
旬、武、习
0100
左右结构
好、级、利
0001
上三包围
闩、肉、周
1100
左中右结构
搬、撇、鞭
0011
下三包围
凶、函
1101
上下结构
思、定、替
0010
左三包围
区、叵
1111
上中下结构
衮、亵
0110
全包围
国、回、因
1110
左上包围
厅、库、店
0111
穿插结构
兆、非
1010
左下包围
赵、远、尬
0101
品字结构
磊、焱
1011