Files
sensitive-word/CHANGE_LOG.md
2024-06-01 15:57:47 +08:00

303 lines
21 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 变更日志
| 类型 | 说明 |
|:----|:----|
| A | 新增 |
| U | 更新 |
| D | 删除 |
| T | 测试 |
| O | 优化 |
| F | 修复BUG |
# release_0.0.1
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | A | 基本功能的实现 | 2020-1-7 21:46:32 | |
# release_0.0.2
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | O | 优化最大长度匹配模式 | 2020-1-8 09:34:35 | |
| 2 | A | 新增替换实现 | 2020-1-8 09:34:35 | 性能优于各种博客的直接正则替换。|
| 3 | O | 优化公共代码到 heaven 项目 | 2020-1-8 09:34:35 | 便于后期统一维护整理。|
| 4 | O | 初步优化 DFA 对应 map 的大小 | 2020-1-8 09:34:35 | |
# release_0.0.3
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | O | 优化敏感词大小 | 2020-1-8 09:34:35 | |
# release_0.0.4
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | A | 支持大小写转换 | 2020-1-9 09:34:35 | |
| 1 | A | 支持半角全角转换 | 2020-1-9 09:34:35 | |
# release_0.0.5
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | D | 移除单个字符 `v` | 2020-1-9 09:34:35 | |
| 2 | D | 移除单个字符 `我` | 2020-1-10 09:34:35 | |
| 3 | O | 责任链模式优化代码实现 | 2020-1-10 09:34:35 | |
| 4 | A | 支持数字格式化转换 | 2020-1-10 09:34:35 | |
| 5 | A | 支持数字敏感词验证 | 2020-1-10 09:34:35 | |
| 6 | O | 优化所有写法的数字为阿拉伯写法 | 2020-1-10 09:34:35 | |
# release_0.0.6
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | A | 添加中文繁简体转换支持 | 2020-1-10 09:34:35 | |
| 2 | A | 添加英文常见写法转换支持 | 2020-1-10 09:34:35 | |
| 3 | A | 新增敏感词 `艹` | 2020-1-10 09:34:35 | |
| 4 | D | 移除单个词 `k买仆办功务动区卖台吨天房本歌滚灾独证踢弓` | 2020-1-10 09:34:35 | |
# release_0.0.7
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | A | 添加忽略重复词支持 | 2020-1-10 09:34:35 | |
# release_0.0.8
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | A | 添加用户自定义敏感词和白名单 | 2020-1-10 09:34:35 | |
# release_0.0.9
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | A | 添加邮箱检测 | 2020-1-11 09:34:35 | |
# release_0.0.10
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | F | 修复依赖包 heaven 版本 | 2020-1-11 09:34:35 | |
# release_0.0.11
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | A | 添加对于数字过滤的可配置型 | 2020-1-14 22:48:12 | |
| 2 | A | 添加部分敏感词 | 2020-1-14 22:48:12 | |
# release_0.0.12
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | A | 添加对于网址的过滤 | 2020-1-16 20:51:58 | |
# release_0.0.13
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | A | 新增 Helper 工具类 | 2021-5-12 20:51:58 | |
| 2 | A | 新增动态词库初始化支持 | 2021-5-12 20:51:58 | |
# release_0.0.14
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | A | 开发样式配置特性 | 2021-5-31 20:51:58 | |
# release_0.0.15
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | A | 优化 init 方式 | 2021-7-16 20:51:58 | |
# release_0.1.0
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | A | 返回敏感词对应的下标范围 | 2021-8-8 20:51:58 | |
| 2 | U | ignoreRepeat 默认为 false | 2021-8-8 20:51:58 | |
| 3 | U | 把测试、系统、买卖、彩票等常用词移出敏感词库 | 2021-8-8 20:51:58 | |
# release_0.1.1
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | F | 自定义敏感词 allow/deny 进行格式化处理 | 2021-12-11 23:51:58 | |
# release_0.2.0
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | A | 允许用户自定义替换策略 | 2022-01-15 23:51:58 | |
| 2 | U | 升级二方数据库依赖 | 2022-01-15 23:51:58 | |
# release_0.2.1
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:---|:---|:---|:--|
| 1 | O | 移除日志初始化的控台日志输出 | 2023-02-17 23:51:58 | |
| 2 | A | 支持数字检验的长度指定 | 2022-01-17 23:51:58 | |
# release_0.3.0
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|:-----------------|:--------------------|:--|
| 1 | O | 移除冗余的耗时统计 | 2023-06-06 23:51:58 | |
| 2 | A | 优化代码实现方式,添加工具类方法 | 2023-06-06 23:51:58 | |
# release_0.3.1
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|:------|:--------------------|:------------------------------------------------|
| 1 | O | 敏感词添加 | 2023-06-06 23:51:58 | 幸运/幸运儿/17年前/1条/1梯两户/1比1/年检/幸存/幸运/幸运儿/恶搞/游戏机/日/草 |
| 2 | A | 敏感词添加 | 2023-06-06 23:51:58 | SB |
# release_0.3.2
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|:--------|:--------------------|:-------|
| 1 | O | 中文繁简体样式 | 2023-06-07 23:51:58 | 调整实现策略 |
| 2 | A | 代码结构优化 | 2023-06-07 23:51:58 | 调整实现策略 |
# release_0.4.0
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|:------------|:--------------------|:-------|
| 1 | O | 优化单词校验逻辑 | 2023-06-08 23:51:58 | |
| 2 | A | 新增是否单词校验的开关 | 2023-06-08 23:51:58 | |
# release_0.5.0
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|-----------------------------|:--------------------|:-------|
| 1 | A | 优化单词结果,减少 String 创建 | 2023-06-08 23:51:58 | |
| 2 | A | 优化 contains 判断,减少 String 创建 | 2023-06-08 23:51:58 | |
# release_0.6.0
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|--------------------------|:--------------------|:-------|
| 1 | O | 性能优化:字符映射统一处理一遍,而不是每次都处理 | 2023-06-09 23:51:58 | |
| 2 | D | 移除废弃的 replaceContext | 2023-06-09 23:51:58 | |
# release_0.7.0
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|---------------------------------------------|:--------------------|:----------------|
| 1 | A | IWordMap 命名调整为 IWordData, 添加 Tree 实现。优化内存占用 | 2023-06-09 23:51:58 | 避免过于限制,放开便于后续拓展 |
# release_0.8.0
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|---------------------------------------------|:--------------------|:----------------|
| 1 | A | 添加 ICharFormatCombine | 2023-06-10 23:51:58 | 允许用户自定义格式化组合策略 |
| 2 | A | 添加 ISensitiveCheckCombine | 2023-06-10 23:51:58 | 允许用户自定义敏感词校验组合策略 |
| 3 | A | 添加 IWordAllowDenyCombine | 2023-06-10 23:51:58 | 允许用户自定义 allow+deny 的组合策略 |
| 4 | A | 添加引导类进阶的配置使用说明 | 2023-06-10 23:51:58 | 放在后续,避免内部接口不够稳定 |
| 5 | U | 内部接口名称统一为 IWordXXX | 2023-06-10 23:51:58 | |
# release_0.9.0
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|-----------------|:--------------------|:------|
| 1 | O | 移除单个汉字+部分常用词的脏词 | 2023-11-17 23:51:58 | 降低误判率 |
# release_0.10.0
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|------------------|:--------------------|:------|
| 1 | A | 添加脏词的标签接口,便于后续拓展 | 2023-12-05 23:51:58 | |
# release_0.11.0
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|----------------------|:--------------------|:------|
| 1 | A | 添加忽略字符接口,便于跳过一些干扰的字符 | 2023-12-08 23:51:58 | |
# release_0.12.0
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|----------------------------------------------|:--------------------|:------|
| 1 | A | 添加 wordTags 标签结果处理类 | 2023-12-18 23:51:58 | |
| 2 | A | 添加 AbstractWordResultHandler 处理类,便于后续拓展和统一管理 | 2023-12-18 23:51:58 | |
# release_0.13.0
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|-----------------------------------|:--------------------|:------|
| 1 | A | 对匹配后的单词,额外可以做一次校验,比如做一次英文全词匹配的验证。 | 2024-02-19 23:51:58 | |
# release_0.13.1
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|------------|:-------------------|:-------------------------------------------------|
| 1 | F | 修正单词匹配 BUG | 2024-2-28 16:16:42 | https://github.com/houbb/sensitive-word/pull/47 |
# release_0.13.2
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|----------------------|:------------------|:-------------------------------------------------|
| 1 | O | 优化部分2长度的英文避免误判 | 2024-4-7 21:04:18 | |
| 2 | O | 升级 heaven 版本到 v0.9.0 | 2024-4-7 21:04:18 | |
# release_0.13.3
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|------------------------------------------------------------------------------------------------------------------------|:------------------|:-------------------------------------------------|
| 1 | O | 移除辉煌、辅导、迅雷、运营、近亲、连接、1期、2o年、2期、3期、46级、4川、4风、4级证、5周年、5月天、610、64、6级证、89、8964、89年、9成、fa票、ftp://、nrqr、o78569 | 2024-4-8 21:04:18 | |
| 2 | O | 移除pqαr、q币、tqrqu、v商、xi藏、xrnvs、xrqu、xrtbrnvs、x藏、you行、αqrqr、αqrqu、αrnvs、αrwqnvs、丁香、万岁、上海交大、上海交警、不良、专6、专8、丑化、东升、中华、中华人民共和国 | 2024-4-8 21:04:18 | |
| 3 | O | 中南海、中国、中考、主义、主权、举行、举办、乌克兰、乌鲁木齐、乡巴佬、买房、争鸣、二战、亚洲、亡国、交警、交通部、亵渎、人渣、人质、人鬼情未了、今有广东 | 2024-4-7 21:04:18 | |
| 4 | O | 仙剑、仙侣奇缘、仙界传、仙笛、代理、价格、仿真、优惠、会员、传单、伤亡、住宅、佛祖、佛教、作秀、佳薇、供应、侦探、侮辱、侵犯、俄国、俄罗斯、保监会、信仰、信号、信息、信用卡、信誉、修炼、 | 2024-4-7 21:04:18 | |
| 5 | O | 倒塌、倒退、倚天、借记卡、值勤、倾城美人、假冒、偷税、储蓄卡、催泪、催眠、傲视、傲神传、僵尸、充值、光线、光明日报、克隆、免费使用、全套、全户型、全职、全集、公务员、公司、公告、公司网址、公安、公安局、公寓、 | 2024-4-7 21:04:18 | |
| 6 | O | 公文、公证、兰博、共产、其它、内幕、冒险岛、凤凰、凶手、出卖、出售、出版社、出货、击毙、刀剑、分析、刑警、列宁、别墅、制作、制服、刷卡、剑侠世界、剧毒、加冰 | 2024-4-7 21:04:18 | |
| 7 | O | 动向、动漫、助理、助听器、劲舞、劳务、北京、北韩、千年、千岛湖、华语、协警、卡通、卧底、卫星电视、卫生部、卫生巾、印章、历史、压制、压迫、原子弹、原点、参拜、 | 2024-4-7 21:04:18 | |
| 8 | O | 反攻、发售、发票、受伤、变天、变态、口腔科、古兰经、古龙、可儿、可塑、台湾、叱咤、号码、司机、同志、名刀、名师、后庭、后庭花、吐血、启蒙派、告示、呻吟、和平、和弦、咨询、哥哥、哥白尼 | 2024-4-7 21:04:18 | |
| 9 | O | 唐僧、商务、商业楼、商圈、商铺、商标、善恶有报、喷剂、回族、回馈、围攻、国务院、国家、国庆、国歌、圆满、圣母、在十月、地址、地产、地球文明 | 2024-4-7 21:04:18 | |
| 10 | O | 地震、均价、坠落、城堡、城管、增值税、复仇、复制、复活、多维、大宝、大师、大话、天猫、天骄、太监、头孢、奥运、奥运会、女人、如影逐形、如来、妈妈、姐夫、姐姐、孤儿 | 2024-4-7 21:04:18 | |
| 11 | O | 学习班、学位证、学历证、学历证书、宇宙真理、安全监管、安全部、安定、安息、完美世界、宗教、官场、官方、定金、定额、宝莲灯、审查、审计、客户、客服、客服人员、密码 | 2024-4-7 21:04:18 | |
| 12 | O | 富婆、富姐、富姐婆、寻仇、导师、导弹、导火索、导航、封神、封锁、小说、小龙女、尖值、屏蔽、岁月无声、崩盘、巡查、工商、工商局、巨商、巴赫、市长、 | 2024-4-7 21:04:18 | |
| 13 | O | 师傅、师父、帐号、帝国主义、常委、幸运儿、广告、广电、广电局、广电总局、庐江、废墟、建筑、开发、开发票、开放、引导、弟子、形式主义、征途、 | 2024-4-7 21:04:18 | |
| 14 | O | 微信、怀旧、性情、性情中人、总局、总理、总裁、恭喜、您被、户口本、户型、房产、房地产、房型、房间、手机、托福、投票、抗战、抗议、报国、报警、拉sa、拉萨、招商、招募、 | 2024-4-7 21:04:18 | |
| 15 | O | 拦截、拿破仑、指导员、挑战、捆绑、探头、接班、摄像、收藏品、改革、政治、救援、教徒、数通、文化部、断电、新浪、新闻出版、无线耳机、无线通话、日本、日本人、旺铺、 | 2024-4-7 21:04:18 | |
| 16 | O | 昏迷、易容、星月、星星月亮、星相、春光、春色、暧昧、月嫂、月卡、月光宝盒、朝鲜、朝鲁、期货、本店、本色、杜鹃、杨j、格斗、梵高、检察、检查、楼盘、欲望、正义、 | 2024-4-7 21:04:18 | |
| 17 | O | 武力、武器、武神、武警、歹徒、死亡、残疾、母亲、毕业、毕业证、毕加索、民族、民国、民政局、民警、汉人、江山、江山如此多娇、江湖、汪洋、沉沦、沁园春、沙僧、 | 2024-4-7 21:04:18 | |
| 18 | O | 洗牙、洞穴、活动、消息、淘宝、混沌、清仓、清真、清纯、渡口、温b、温馨、温馨提示、激情、烟花、烟草、烟草局、然后、燃烧、爆炸、爸爸、爷爷、父亲、爹娘、牙科、牙疼、牙签、牙周炎、 | 2024-4-7 21:04:18 | |
| 19 | O | 牢记、牲口、狙击、独立、猥琐、现代中国、现金、现货、现房、瓦斯、生肖、用户、电信、电影、电影下载、电话、男装、疫苗、病毒、监督、监管、监管局、盗版、盘古、相亲会 | 2024-4-7 21:04:18 | |
| 20 | O | 省长、督察、短信、破坏、硬币、礼品、礼物、社会、社会主义、祖国、祖宗、离婚、秃鹰、种子、租房、租售、移动、移民、税务、穷人、空降、签证、简历、米粒、精装、纪元、经济、经典语录、绝版 | 2024-4-7 21:04:18 | |
| 21 | O | 统治、维护、维权、缅甸、缠上、缺陷、网址、网关、网易、网站、网站建设、网络、网购、罪行、美利坚、美国、美女、群发、老板、老板手机、考号、考研、耳机、 | 2024-4-7 21:04:18 | |
| 22 | O | 耶和华、耶稣、联合国、联合行动、 联系、联通、股票、自fe、自制、自拍、舆论、舒淇、航天、航班、航空、花园、苹果、茅台、茉莉花、药水、莎士比亚、落榜、蒙面、蓝光、虎头、 | 2024-4-7 21:04:18 | |
| 23 | O | 虎牙、虎门、蛤蟆、融资、行驶证、街铺、被迫、西游、西臧、西藏、观世音、解放军、警察、讲法、论文、证书、证件、证券、诛仙、诡异、语句、语音、诱惑、资格、跟踪、路人、躲猫猫、通告 | 2024-4-7 21:04:18 | |
| 24 | O | 通知、通讯录、道教、采花、重生、钓鱼、钢珠、铃声、链接、销售、错别字、锤子、锤锤、面积、预测、领土、领导、风水、风花、首长、鲁迅、鲍鱼、鸡尾酒、麻将、 | 2024-4-7 21:04:18 | |
# release_0.13.4
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|---------------------------------------------------------------------|:------------------|:-------------------------------------------------|
| 1 | O | 移除 一直对、组织、验证码、数据库、服务器、火药、世界都、聚集、国内、制造、解码、万里、视频、中国好声音 | 2024-4-9 21:04:18 | |
| 2 | O | 移除 骑士、移动公司、战役、战场、飞机票、逃逸、自由、杂志、使用人数、域名服务、人民日报、一粒沙、牛顿、三国演义、哥伦布、 | 2024-4-9 21:04:18 | |
| 3 | O | 移除 订票、财政部、搜狐、人员变动、惊天动地、试卷、华莱士、空闲时间、泰晤士报、企业家、气象局、诺贝尔奖、多多益善、论坛、外交部 | 2024-4-9 21:04:18 | |
| 4 | O | 移除 焚烧、雅典娜、真相、真善美、制造、万里、法国、世界都、昨日重现、信息中心、马克思、刘德华、内蒙古、 | 2024-4-9 21:04:18 | |
| 5 | O | 移除 涿州、中国联通、中国网通、李老师、写字楼、人民银行、卡拉、牛魔王、 张杰、哪里找、爱因斯坦、天地之间、不玩了、里根、监听器、监听 | 2024-4-9 21:04:18 | |
| 6 | O | 移除 选举、登陆、中国移动、运营者、客户服务、精益求精、下载速度、好朋友、拦截器、账号、无界、深入浅出、腾讯、解码器、管理员、白皮书 | 2024-4-9 21:04:18 | |
| 7 | O | 移除 监听、运营商、一起玩、转化、超市 | 2024-4-9 21:04:18 | |
# release_0.14.0
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|------------|:-------------------|:-------------------------------------------------|
| 1 | A | 结果添加敏感词的类别 | 2024-4-11 15:02:25 | |
# release_0.14.1
| 序号 | 变更类型 | 说明 | 时间 | 备注 |
|:---|:-----|------------------------------------------------------------------------------------------|:------------------|:------|
| 1 | O | 敏感词优化移除: 译码器/鞋帽/破解/看下/快乐水/冷却/招聘/搬迁/机票/谣言/第4代/赚钱/1989年/贫穷/护士/工作人员/网通/超速/明心/人民/服务管理/刺激/心水/ | 2024-6-01 15:02:25 | |
| 2 | O | 敏感词优化移除: 影院/公关/韦小宝/挣钱/资本主义/人也/战争/水浒/女装/装修/妹妹/他爸爸/他妈妈 | 2024-6-01 15:02:25 | |
| 3 | O | 默认关闭数字+网址+邮箱的校验 | 2024-6-01 15:02:25 | 降低误判率 |