开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 378|回复: 18
收起左侧

[已解决] 正则取数据

 关闭 [复制链接]
结帖率:100% (71/71)
发表于 2024-9-19 17:43:05 | 显示全部楼层 |阅读模式   重庆市重庆市
13精币
有多条网页数据,我要取出红色标注部分数据,目前日期、星期,还有“测试数据”都能采集。主要是每一种格式的最后一条数据不固定(也就是数字123目前采集不到),所以请大佬帮忙写个正则!
格式分别为以下几种:第一种:

<td>2024-08-23</td>
            <td>星期五</td>
            <td class="l-line">测试数据</td>
                        <td >123</td>

第二种:
<td>2024-08-24</td>
            <td>星期六</td>
            <td class="l-line">测试数据</td>
                        <td ><span class="fred">1</span>23</td>

第三种:
<td>2024-08-25</td>
            <td>星期日</td>
            <td class="l-line">测试数据</td>
                        <td >1<span class="fred">2</span>3</td>


第四种:
<td>2024-08-26</td>
            <td>星期一</td>
            <td class="l-line">测试数据</td>
                        <td ><span class="fred">1</span>2<span class="fred">3</span></td>


第六种:
<td>2024-08-27</td>
            <td>星期二</td>
            <td class="l-line">测试数据</td>
                        <td >12<span class="fred">3</span></td>


第七种:
<td>2024-08-28</td>
            <td>星期三</td>
            <td class="l-line">测试数据</td>
                        <td ><span class="fred">1</span><span class="fred">2</span>3</td>








补充内容 (2024-9-19 19:56):
目前主要是123三个数字取不出来,不知道怎么写一个通用的正则。

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳

签到天数: 16 天

发表于 2024-9-19 17:43:06 | 显示全部楼层   广东省东莞市
例子.e (957.63 KB, 下载次数: 10)

点评

非常感谢!一时没想到 网页_取文本_dom ()   重庆市重庆市  发表于 2024-9-21 13:31

评分

参与人数 2好评 +1 精币 +3 荣誉 +1 收起 理由
笨潴 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!
cqcc + 1 + 3 欢迎常来帮助新人,谢谢~

查看全部评分

回复

使用道具 举报

签到天数: 16 天

发表于 2024-9-19 18:38:09 | 显示全部楼层   广东省东莞市
调试输出 (网页_取文本_dom (“<span class=” + #引号 + “fred” + #引号 + “>1</span>23”))

点评

没有通用的?   重庆市重庆市  发表于 2024-9-19 19:37
七种都要取   重庆市重庆市  发表于 2024-9-19 19:37
回复

使用道具 举报

结帖率:93% (224/241)

签到天数: 22 天

发表于 2024-9-19 18:39:27 | 显示全部楼层   上海市上海市
(。*?)

可以吗
        2024-08-23        星期五        测试数据        123       

点评

有七种样式   重庆市重庆市  发表于 2024-9-19 19:36
这个不能全部取出来   重庆市重庆市  发表于 2024-9-19 19:36
回复

使用道具 举报

结帖率:100% (2/2)

签到天数: 26 天

发表于 2024-9-19 21:51:19 | 显示全部楼层   河北省邯郸市
非汉字用这个:>\w.*?<

点评

没有结果呢?   重庆市重庆市  发表于 2024-9-20 12:41
<td>(.*?)</td> <td>(.*?)</td> <td class="l-line">(.*?)</td> <td >\w.*?</td> 我是这样匹配出错了   重庆市重庆市  发表于 2024-9-20 12:41
回复

使用道具 举报

签到天数: 16 天

发表于 2024-9-20 19:24:32 | 显示全部楼层   广东省东莞市
<td>(\d{4}-\d{2}-\d{2})</td>[\S\s]*?<td>(.*?)</td>[\S\s]*?line">(.*?)</td>[\S\s]*?<td\s*>(.*?)</td>

点评

第七种也是取不出来的   重庆市重庆市  发表于 2024-9-20 20:11
非常感谢!但是第二种还是取不出来。   重庆市重庆市  发表于 2024-9-20 20:10
回复

使用道具 举报

签到天数: 16 天

发表于 2024-9-20 20:34:15 | 显示全部楼层   广东省东莞市
你上传个txt上来我试试,不然没法测试,我ctrl+a复制的网页的,测试可以
1.png

点评

子匹配文本4 要全部只显示”123“,而不要那些多余的字符。可能是我没有表达清楚   重庆市重庆市  发表于 2024-9-20 21:01
回复

使用道具 举报

结帖率:100% (71/71)

签到天数: 25 天

 楼主| 发表于 2024-9-20 20:44:05 | 显示全部楼层   重庆市重庆市
企鹅号525150138 发表于 2024-9-20 20:34
你上传个txt上来我试试,不然没法测试,我ctrl+a复制的网页的,测试可以

文本.rar (8.67 KB, 下载次数: 5)
回复

使用道具 举报

签到天数: 16 天

发表于 2024-9-20 22:28:20 | 显示全部楼层   广东省东莞市
例子.e (957.63 KB, 下载次数: 1)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表