mirror of
https://github.com/houbb/sensitive-word.git
synced 2026-03-22 08:27:36 +08:00
306 B
306 B
简化部分信息
纯数字
移除
去重
移除大量重复的信息。
提取出关键的敏感词语即可。
包含 stop-word 的信息
移除 stop-word 之后进行相关的处理。
数字
0123456789
对应的任意写法。
https://github.com/toolgood 思想值得借鉴。