开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 1077|回复: 11
收起左侧

[已解决] E2EE 网页内容选择器 网页解析求助 下级选择器

 关闭 [复制链接]
结帖率:97% (98/101)
发表于 2021-11-1 14:38:57 | 显示全部楼层 |阅读模式   重庆市重庆市
100精币
QQ截图20211101143420.jpg
选择器用 tbody > tr  解析出来372条包含正确结果数据,下一步就不会了,
1,需要取372条里面每一条属性里面的  data-cb_code: 后面的代码  
2,下级选择器里面 箭头处内容  “<td class='cb_value_id npv_red' title='采用税前折现率:6.41%'>81.08</td>”    里面的81.08

举这个行的例子就行了  不需要去循环每一个

碰到网页解析 不用正则的情况下 每次弄这个内容解析器都卡住……

看图能解决最好,网页源码附带在附件的压缩包内 txt文本太大无法上传只能压缩

网页源码.rar

125.13 KB, 下载次数: 6

最佳答案

查看完整内容

.版本 2 .支持库 e2ee .支持库 spec .局部变量 解析器, 网页内容解析器 .局部变量 i, 整数型 解析器.解析 (#常量1) .计次循环首 (解析器.选择 (“tbody > tr”), i) 调试输出 (解析器.取下级内部文本 (i, “td”)) 调试输出 (解析器.取下级内部文本 (i, “td:nth-child(3) > a”)) 解析器.返回上级 () .计次循环尾 () 这样就行了,通过改nth-child(3)的数字来选择其他td~ ...

求助知识:请将问题描述清楚,最好把你有问题的源码打包上传上来,这样更方便大家帮助你。
友情提醒:本版被采纳的主题可在 申请荣誉值 帖子申请荣誉值,获得 3点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。

结帖率:78% (7/9)

签到天数: 1 天

发表于 2021-11-1 14:38:58 | 显示全部楼层   广东省东莞市
  
变量名类 型静态数组备 注
解析器网页内容解析器 
i整数型 
解析器.解析 ( #常量1 )
计次循环首 (解析器.选择 (“tbody > tr”), i)
调试输出 (解析器.取下级内部文本 (i, “td”))
调试输出 (解析器.取下级内部文本 (i, “td:nth-child(3) > a”))
解析器.返回上级 ()
计次循环尾 ()


i支持库列表   支持库注释   
e2eeE2EE互联网服务器套件
spec特殊功能支持库


这样就行了,通过改nth-child(3)的数字来选择其他td~

评分

参与人数 1荣誉 +3 收起 理由
笨潴 + 3 热心帮助他人,荣誉+3,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

签到天数: 14 天

发表于 2021-11-1 14:40:23 | 显示全部楼层   河北省石家庄市
用正则多好啊
回复

使用道具 举报

结帖率:97% (98/101)

签到天数: 14 天

 楼主| 发表于 2021-11-1 14:43:10 | 显示全部楼层   重庆市重庆市

总感觉解析器规范点啊,就像json解析  熟练了一下子就出来了   正则的话 有时候数据结构一改变 读出来就会出错
回复

使用道具 举报

签到天数: 14 天

发表于 2021-11-1 14:48:12 | 显示全部楼层   河北省石家庄市
39.png

评分

参与人数 1好评 +1 精币 +4 收起 理由
独倚斜阳 + 1 + 4 感谢分享,很给力!~

查看全部评分

回复

使用道具 举报

签到天数: 14 天

发表于 2021-11-1 14:50:15 | 显示全部楼层   河北省石家庄市
data-cb_code=(.*?)data-[\s\S]*?'cb_value_id npv_red.*?>(.*?)<

一条正则的事,何必弄那么复杂呢~~

评分

参与人数 1好评 +1 精币 +4 收起 理由
独倚斜阳 + 1 + 4 不用正则是因为正则适配不好 而且很慢

查看全部评分

回复

使用道具 举报

结帖率:97% (98/101)

签到天数: 14 天

 楼主| 发表于 2021-11-1 15:18:52 | 显示全部楼层   重庆市重庆市
  
变量名类 型静态数组备 注
解析器网页内容解析器 
i整数型 
解析器.解析 ( #常量1 )
计次循环首 (解析器.选择 (“tbody > tr”), i)
调试输出 (解析器.取属性 (i, “data-cb_code”))
' 调试输出 (解析器.取下级内部文本 (i, “td”))
' 调试输出 (解析器.取下级内部文本 (i, “td:nth-child(3) > a”))
解析器.返回上级 ()
计次循环尾 ()


i支持库列表   支持库注释   
e2eeE2EE互联网服务器套件
spec特殊功能支持库



其中 调试输出 (解析器.取属性 (i, “data-cb_code”))  取到第一个要求的代码了,至于后面的那个class='cb_value_id npv_red' 的还是不会表达式
回复

使用道具 举报

结帖率:97% (98/101)

签到天数: 14 天

 楼主| 发表于 2021-11-1 15:20:05 | 显示全部楼层   重庆市重庆市
初夏喔 发表于 2021-11-1 15:03
[e=0].版本 2
.支持库 e2ee
.支持库 spec

看7楼 第一行代码通过属性取了 但是class='cb_value_id npv_red'  取不了,他这个顺序有时候会变的 而且 这个值不是 <a>   /a>里面的
回复

使用道具 举报

结帖率:78% (7/9)

签到天数: 1 天

发表于 2021-11-1 15:24:24 | 显示全部楼层   广东省东莞市
独倚斜阳 发表于 2021-11-1 15:20
看7楼 第一行代码通过属性取了 但是class='cb_value_id npv_red'  取不了,他这个顺序有时候会变的 而且  ...
  
调试输出 (解析器.取属性 (i, “.cb_value_id.npv_red”))

回复

使用道具 举报

结帖率:97% (98/101)

签到天数: 14 天

 楼主| 发表于 2021-11-1 15:30:36 | 显示全部楼层   重庆市重庆市
初夏喔 发表于 2021-11-1 15:24
调试输出 (解析器.取属性 (i, “.cb_value_id.npv_red”))

这个不行 取出来是空的  他不是属性里面的  用你之前的改一下
调试输出 (解析器.取下级内部文本 (i, “td:nth-child(32)”))

能取出来 td class='cb_value_id npv_red' title='采用税前折现率:6.41%'>81.08</td>  内部文本81.08 但是他网页结构改变的话,数据会错,不知道能不能像属性那样强行对应到 class='cb_value_id npv_red'的数据
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表