Files
sensitive-word/doc/issues/v2-基本敏感词的简化.md
2020-01-08 23:37:12 +08:00

306 B

简化部分信息

纯数字

移除

去重

移除大量重复的信息。

提取出关键的敏感词语即可。

包含 stop-word 的信息

移除 stop-word 之后进行相关的处理。

数字

0123456789

对应的任意写法。

https://github.com/toolgood 思想值得借鉴。