mirror of
https://github.com/houbb/sensitive-word.git
synced 2026-03-22 08:27:36 +08:00
release branch 0.0.6
This commit is contained in:
@@ -46,4 +46,13 @@
|
||||
| 3 | O | 责任链模式优化代码实现 | 2020-1-10 09:34:35 | |
|
||||
| 4 | A | 支持数字格式化转换 | 2020-1-10 09:34:35 | |
|
||||
| 5 | A | 支持数字敏感词验证 | 2020-1-10 09:34:35 | |
|
||||
| 6 | O | 优化所有写法的数字为阿拉伯写法 | 2020-1-10 09:34:35 | |
|
||||
| 6 | O | 优化所有写法的数字为阿拉伯写法 | 2020-1-10 09:34:35 | |
|
||||
|
||||
# release_0.0.6
|
||||
|
||||
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|
||||
|:---|:---|:---|:---|:--|
|
||||
| 1 | A | 添加中文繁简体转换支持 | 2020-1-10 09:34:35 | |
|
||||
| 2 | A | 添加英文常见写法转换支持 | 2020-1-10 09:34:35 | |
|
||||
| 3 | A | 新增敏感词 `艹` | 2020-1-10 09:34:35 | |
|
||||
| 4 | D | 移除单个词 `k买仆办功务动区卖台吨天房本歌滚灾独证踢弓` | 2020-1-10 09:34:35 | |
|
||||
@@ -1,3 +1,6 @@
|
||||
# 在遍历的时候
|
||||
|
||||
如果是中文,则直接进行替换。
|
||||
如果是中文,则直接进行替换。
|
||||
|
||||
# 忽略英文的写法样式
|
||||
|
||||
|
||||
@@ -24,4 +24,10 @@
|
||||
|
||||
现在的转化为数字的,也生成一份拼音。
|
||||
|
||||
然后将二者进行合并。
|
||||
然后将二者进行合并。
|
||||
|
||||
## 拼音的处理
|
||||
|
||||
拼音的处理只是形声字。
|
||||
|
||||
还可以有象形字,所以第一份包含中文写法的字段很重要。
|
||||
13
doc/issues/roadmap/v014-形近字的处理.md
Normal file
13
doc/issues/roadmap/v014-形近字的处理.md
Normal file
@@ -0,0 +1,13 @@
|
||||
# 形近字
|
||||
|
||||
比如:王 玉 这种。
|
||||
|
||||
这种相对而言比较难,需要有一张完整的近似表。
|
||||
|
||||
# 组合字
|
||||
|
||||
甚至包含偏旁部首:
|
||||
|
||||
如 `法`==》【氵去】【水去】等等。
|
||||
|
||||
这种可以通过原来的字直接进行拆分。
|
||||
Reference in New Issue
Block a user