mirror of
https://github.com/houbb/sensitive-word.git
synced 2026-03-22 08:27:36 +08:00
release branch 0.0.7
This commit is contained in:
@@ -55,4 +55,10 @@
|
||||
| 1 | A | 添加中文繁简体转换支持 | 2020-1-10 09:34:35 | |
|
||||
| 2 | A | 添加英文常见写法转换支持 | 2020-1-10 09:34:35 | |
|
||||
| 3 | A | 新增敏感词 `艹` | 2020-1-10 09:34:35 | |
|
||||
| 4 | D | 移除单个词 `k买仆办功务动区卖台吨天房本歌滚灾独证踢弓` | 2020-1-10 09:34:35 | |
|
||||
| 4 | D | 移除单个词 `k买仆办功务动区卖台吨天房本歌滚灾独证踢弓` | 2020-1-10 09:34:35 | |
|
||||
|
||||
# release_0.0.7
|
||||
|
||||
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|
||||
|:---|:---|:---|:---|:--|
|
||||
| 1 | A | 添加忽略重复词支持 | 2020-1-10 09:34:35 | |
|
||||
@@ -4,4 +4,10 @@ ffffuuuuccckkk
|
||||
|
||||
f xxx
|
||||
|
||||
x 如果和上一个字符一样,则直接忽略。
|
||||
x 如果和上一个字符一样,则直接忽略。
|
||||
|
||||
# 细节
|
||||
|
||||
当开启的时候,如果在敏感词获取的时候,如果下一个字没有找到,则进行去重。
|
||||
|
||||
即如果当前字符和上一个字符完全一样,则直接跳过。(仅仅在没有普匹配的场景下)
|
||||
@@ -1,3 +1,9 @@
|
||||
# 标点符号
|
||||
|
||||
无论中文英文数字,其中特殊符号一定是停顿词。
|
||||
|
||||
可以这么粗俗的认为。
|
||||
|
||||
# 英文
|
||||
|
||||
核心是英文停顿词。
|
||||
|
||||
Reference in New Issue
Block a user