开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 11150|回复: 6
收起左侧

[其它] 正则[\u4e00-\u9fa5]无法匹配到所有中文了,要改下了

[复制链接]
结帖率:91% (30/33)
发表于 2022-3-10 11:39:56 | 显示全部楼层 |阅读模式   河南省商丘市
有时候我们需要在文本中匹配到所有中文,一般都是使用的[\u4e00-\u9fa5]这个代表汉字编码的头和尾部。
比如精易编程助手里面,结尾字符就使用的\u9fa5,其实汉字是有非常多的,经过多个版本后,尾部字符编码已经变成了:\u9fff
所以正确的写法是: [\u4e00-\u9fff]


各版本unicode汉字部分开头和结尾:
6.2-7.0     \u4e00 - \u9fcc
8.0-9.0     \u4e00 - \u9fd5
10.0        \u4e00 - \u9fea
11.0-12.1   \4e00 - \u9fef
13.0        \4e00 - \u9ffc
14.0        \4e00 - \u9fff

unicode-data.rar (200.6 KB, 下载次数: 3)

结帖率:32% (6/19)

签到天数: 1 天

发表于 2024-4-6 10:08:00 | 显示全部楼层   贵州省黔东南苗族侗族自治州
感谢发布优秀作品
回复 支持 反对

使用道具 举报

结帖率:100% (3/3)

签到天数: 13 天

发表于 2022-5-4 21:17:03 | 显示全部楼层   安徽省芜湖市
回复 支持 反对

使用道具 举报

结帖率:0% (0/1)

签到天数: 3 天

发表于 2022-3-21 00:44:32 | 显示全部楼层   浙江省宁波市
感谢老板分析!!!
回复 支持 反对

使用道具 举报

结帖率:100% (9/9)

签到天数: 20 天

发表于 2022-3-10 12:29:03 | 显示全部楼层   辽宁省沈阳市
直接匹配双字节得了.
回复 支持 反对

使用道具 举报

签到天数: 15 天

发表于 2022-3-10 12:01:10 | 显示全部楼层   广东省广州市

编程助手用的是A版的!自然就少很多字符啦~
回复 支持 反对

使用道具 举报

结帖率:100% (5/5)

签到天数: 1 天

发表于 2022-3-10 11:52:56 | 显示全部楼层   广西壮族自治区南宁市
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表