开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 3503|回复: 8
收起左侧

[BUG反馈] 正则.取匹配文本的获取

[复制链接]
发表于 2024-5-18 00:46:11 | 显示全部楼层 |阅读模式   河南省信阳市
模块版本:11.1.5
所用系统:win10
命令名称:[正则表达式类]下[取匹配文本]命令的第二个参数,获取起始位置返回不正确.
BUG描述:[正则表达式类]下[取匹配文本]命令的第二个参数,特定情况下获取起始位置返回不正确<重复>.
我的联系QQ:541178047

@项目部004

详细情况:当要正则的文本是多排,且第二排有多个同样的可匹配文本时,获取的起始位置一直是第一个,有时候也和上一排的字数有关系.

图片示例

图片示例

正则测试.e (1.22 MB, 下载次数: 4)
结帖率:47% (18/38)

签到天数: 1 天

发表于 2024-5-20 15:55:33 | 显示全部楼层   江苏省无锡市
经过详细测试。但凡出现中文。双字节字符时。
正则中的 Match.读数值属性 (“FirstIndex”, ) 获取到的Index会忽略双字节在易语言中的特性。
导致偏移量错误。原始文本中中文越多。匹配位置越后。偏移量差异越大。
回复 支持 反对

使用道具 举报

签到天数: 7 天

 楼主| 发表于 2024-5-19 18:36:35 | 显示全部楼层   河南省信阳市
钥匙key 发表于 2024-5-19 10:10
经过详细测试。但凡出现中文。双字节字符时。
正则中的 Match.读数值属性 (“FirstIndex”, ) 获取到的Inde ...

哈哈哈,大佬辛苦.我发现他这个也不会偏移越来越大.但是重复的同样字符串有时候确实会获得一样的[起始位置],所以我现在换了个策略,在搜索第一遍如果发现已出现过得[起始位置]则不记录这次正则信息和位置,然后将已正则的字符串全部替换成中间过渡字符串后,再次进行正则,直到没有重复的[起始位置]后停止,哈哈,不知道这个正则原理,只能这样,不太聪明勉强能用.剩下的就只能等大佬们更新啦.
回复 支持 反对

使用道具 举报

结帖率:100% (2/2)

签到天数: 21 天

发表于 2024-5-19 10:10:07 | 显示全部楼层   四川省绵阳市
经过详细测试。但凡出现中文。双字节字符时。
正则中的 Match.读数值属性 (“FirstIndex”, ) 获取到的Index会忽略双字节在易语言中的特性。
导致偏移量错误。原始文本中中文越多。匹配位置越后。偏移量差异越大。
回复 支持 反对

使用道具 举报

结帖率:100% (2/2)

签到天数: 21 天

发表于 2024-5-19 09:29:49 | 显示全部楼层   四川省绵阳市
云彩大王 发表于 2024-5-18 22:51
抬杠没啥用,可以试试代码的.我只是把常量的第一排中的"你好"的"好"字删掉,就能正常获取起始位置了.

咦。我昨天测试。修改引号内内容也能获取。就这么特别?我好好测试一下。。。奇怪了。
回复 支持 反对

使用道具 举报

签到天数: 7 天

 楼主| 发表于 2024-5-18 22:51:54 | 显示全部楼层   河南省信阳市
钥匙key 发表于 2024-5-18 19:11
子程序名:取匹配文本
    取出该正则匹配到的文本
    返回值类型:文本型

抬杠没啥用,可以试试代码的.我只是把常量的第一排中的"你好"的"好"字删掉,就能正常获取起始位置了.

1CB9559B-A053-4af9-B39F-AA54EF56D8E6.png


  
子程序名返回值类型公开备 注
__启动窗口_创建完毕  
变量名类 型静态数组备 注
局_正则正则表达式类 
局_计次整数型 
局_起始位置整数型 
调试输出 (“测试常量”, #常量1 )
局_正则.创建 (“#引号.*?#引号”, #常量1, , , , )
计次循环首 (局_正则.取匹配数量 (), 局_计次)
调试输出 (“匹配文本”, 局_正则.取匹配文本 (局_计次, 局_起始位置))
调试输出 (“局_起始位置”, 局_起始位置)
计次循环尾 ()
' 下面是常量:
你好
"1""1"
' 模块是最新版精易模块



i支持库列表   支持库注释   
spec特殊功能支持库

回复 支持 反对

使用道具 举报

结帖率:100% (2/2)

签到天数: 21 天

发表于 2024-5-18 19:11:14 | 显示全部楼层   四川省绵阳市
云彩大王 发表于 2024-5-18 19:01
哈哈,有两个字符"1",他们的起始位置重复了.第一个起始位置是对的,第二个就不是了. ...

子程序名:取匹配文本
    取出该正则匹配到的文本
    返回值类型:文本型
    参数<1>的名称为“匹配索引”,类型为“整数型”。注明:索引值从1开始。
    参数<2>的名称为“起始位置”,类型为“整数型”,接收参数数据时采用参考传递方式,允许接收空参数数据。注明:可以被省略,提供参数数据时只能提供变量。该命令调用成功后,本参数存放取得的子文本在整个被搜索文本中的起始位置。
整个被搜索文本中的起始位置。并没有说。是当前位置。注意看说明。。
回复 支持 反对

使用道具 举报

签到天数: 7 天

 楼主| 发表于 2024-5-18 19:01:33 | 显示全部楼层   河南省信阳市
钥匙key 发表于 2024-5-18 09:35
没有问题呀。是在第6个呀。一个中文占两个。换行符。一个\r+\n又是两个。这就有6个了呀。 ...

哈哈,有两个字符"1",他们的起始位置重复了.第一个起始位置是对的,第二个就不是了.
回复 支持 反对

使用道具 举报

结帖率:100% (2/2)

签到天数: 21 天

发表于 2024-5-18 09:35:33 | 显示全部楼层   四川省绵阳市
没有问题呀。是在第6个呀。一个中文占两个。换行符。一个\r+\n又是两个。这就有6个了呀。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表