开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 335|回复: 6
收起左侧

[Web相关] 正则求助

[复制链接]
结帖率:95% (78/82)
发表于 2024-4-1 05:19:41 | 显示全部楼层 |阅读模式   湖南省常德市
5精币
如题:上100下10测试10,匹配中文和数字,并且也支持上100这样,汉字和数字不是固定的,麻烦大佬指教一下如何写,谢谢!


回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
结帖率:100% (9/9)

签到天数: 14 天

发表于 2024-4-1 06:53:09 | 显示全部楼层   广西壮族自治区百色市
来自智障AI,仅供参考
根据您的问题和需求。针对您的具体情况,一种方法是先尝试匹配较长的模式(例如,中文字符和数字的组合),然后再尝试匹配其中的子模式(单独的数字和单独的中文字符)。然而,一个正则表达式只按照它一次找到的模式进行匹配,不会回溯去提取子匹配。为了实现您想要的结果,您可能需要分别用不同的正则表达式来匹配不同的部分,或者在匹配之后对结果进行额外的处理。
但是,基于您的描述,如果想要通过一个单一的正则表达式同时捕获所有这些情况,确实是一个挑战,因为一旦较长的模式(如:“上100”)被捕获,正则表达式引擎通常不会再去捕获这个较长模式中已经被包含的较短模式(如:“100”)。
这时候,需要通过逻辑上分离这些匹配项来考虑。以下Python示例代码显示了如何分别进行匹配并获取您想要的所有结果:
[Python] 纯文本查看 复制代码
import re

# 待匹配的文本
text = "上100下10测试10"

# 使用正则表达式分别匹配
combined_pattern = r"[\u4e00-\u9fa5]+\d+"  # 中文字符后跟数字的组合
number_pattern = r"\b\d+\b"  # 独立的数字(使用\b来界定边界)
chinese_pattern = r"[\u4e00-\u9fa5]+"  # 独立的中文字符

# 找到所有匹配项
combined_matches = re.findall(combined_pattern, text)
number_matches = re.findall(number_pattern, text)
chinese_matches = re.findall(chinese_pattern, text)

# 由于我们先匹配了组合,可能会产生重复匹配数字或中文字,因此需要进行去重
unique_numbers = [n for n in number_matches if not any(n in c for c in combined_matches)]
unique_chinese = [c for c in chinese_matches if not any(c in comb for comb in combined_matches)]

# 打印所有匹配项
print("组合: ", combined_matches)
print("独立数字: ", unique_numbers)
print("独立中文字符: ", unique_chinese)

# 如果需要一次性获取所有匹配项,可以考虑合并列表(确保按照您的需要排序)
all_matches = combined_matches + unique_numbers + unique_chinese
print("所有匹配项: ", all_matches)


这段代码首先会尝试匹配中文和数字的组合,然后尝试匹配独立的数字以及独立的中文字。通过这种方式,您可以确保捕获到您想要的所有匹配项。在这个过程中,我们避免了重复计数已经在组合中出现的数字和中文字符,从而确保了每个元素只被匹配一次。
请注意,这个实现假设数字或中文字符不会既出现在组合中,又单独出现。如果这个假设不成立,可能需要更复杂的逻辑来确保不遗漏或重复任何匹配项



回复

使用道具 举报

结帖率:76% (53/70)

签到天数: 5 天

发表于 2024-4-1 08:31:45 | 显示全部楼层   辽宁省大连市
(上\d+)(下\d+)(测试\d+)
回复

使用道具 举报

结帖率:100% (1/1)

签到天数: 12 天

发表于 2024-4-1 08:37:46 | 显示全部楼层   河南省郑州市
[\u4e00-\u9fa5]+|\d+

([\u4e00-\u9fa5]+)(\d+)

([\u4e00-\u9fa5]+\d+)
回复

使用道具 举报

签到天数: 7 天

发表于 2024-4-1 13:10:16 | 显示全部楼层   北京市北京市
回复

使用道具 举报

结帖率:66% (19/29)

签到天数: 9 天

发表于 2024-4-1 15:04:16 | 显示全部楼层   广东省梅州市
([\u4e00-\u9fa5]{1,})|([\d]{2,3})

补充内容 (2024-4-1 15:05):
如果数字不要0开头就把\d改成1-90
回复

使用道具 举报

结帖率:0% (0/1)
发表于 2024-4-5 10:41:20 | 显示全部楼层   北京市北京市
想帮你 但是我还没学会
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表