release branch 0.0.6

This commit is contained in:
binbin.hou
2020-01-10 14:21:16 +08:00
parent f0c13a9346
commit 579a98c6a7
18 changed files with 258 additions and 34 deletions

View File

@@ -46,4 +46,13 @@
| 3 | O | 责任链模式优化代码实现 | 2020-1-10 09:34:35 | |
| 4 | A | 支持数字格式化转换 | 2020-1-10 09:34:35 | |
| 5 | A | 支持数字敏感词验证 | 2020-1-10 09:34:35 | |
| 6 | O | 优化所有写法的数字为阿拉伯写法 | 2020-1-10 09:34:35 | |
| 6 | O | 优化所有写法的数字为阿拉伯写法 | 2020-1-10 09:34:35 | |
# release_0.0.6
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | A | 添加中文繁简体转换支持 | 2020-1-10 09:34:35 | |
| 2 | A | 添加英文常见写法转换支持 | 2020-1-10 09:34:35 | |
| 3 | A | 新增敏感词 `艹` | 2020-1-10 09:34:35 | |
| 4 | D | 移除单个词 `k买仆办功务动区卖台吨天房本歌滚灾独证踢弓` | 2020-1-10 09:34:35 | |

View File

@@ -1,3 +1,6 @@
# 在遍历的时候
如果是中文,则直接进行替换。
如果是中文,则直接进行替换。
# 忽略英文的写法样式

View File

@@ -24,4 +24,10 @@
现在的转化为数字的,也生成一份拼音。
然后将二者进行合并。
然后将二者进行合并。
## 拼音的处理
拼音的处理只是形声字。
还可以有象形字,所以第一份包含中文写法的字段很重要。

View File

@@ -0,0 +1,13 @@
# 形近字
比如:王 玉 这种。
这种相对而言比较难,需要有一张完整的近似表。
# 组合字
甚至包含偏旁部首:
`法`==》【氵去】【水去】等等。
这种可以通过原来的字直接进行拆分。