开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 590|回复: 1
收起左侧

[已解决] 怎么采集导航wz的数据

 关闭 [复制链接]
结帖率:97% (201/208)
发表于 2020-4-6 15:51:51 | 显示全部楼层 |阅读模式   广东省佛山市
5精币
网址:www.24kdh.com
要采集生活休闲-购物 淘宝网 描述 网址

网页源码里面没有直播 游戏里面的数据,还要鼠标点一下再采集网页源码才能看到

  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
子程序名返回值类型公开备 注
_按钮1_被单击  
变量名类 型静态数组备 注
数据文本型 
数据 = 到文本 (网页_访问 (“https://www.24kdh.com”))
正则_匹配批量 (数据)
子程序名返回值类型公开备 注
正则_匹配批量整数型 本子程序采用【精易编程助手】生成。成功返回匹配的数量,失败返回0。
参数名类 型参考可空数组备 注
源文本文本型欲被匹配的文本
变量名类 型静态数组备 注
局_正则正则表达式类此类为精易模块里面的正则类,精易模块下载地址:http://ec.125.la/
局_匹配数整数型 
局_计次整数型 
如果真 (局_正则.创建 (“data-url=#引号(.*?)#引号[\s|\S]*?(.*?)[\s|\S]*?xs#引号>(.*?)
, 源文本, 假, 假, 真, 真) = 假)
信息框 (“正则创建失败,请检查正则表达式语句是否有误!”, #错误图标, , )
返回 (0)
局_匹配数 = 局_正则.取匹配数量 ()
如果真 (局_匹配数 = 0)
信息框 (“匹配失败,请检检查正则语句是否有误,数量:0”, #错误图标, , )
返回 (0)
计次循环首 (局_匹配数, 局_计次)
输出调试文本 (“匹配文本 ”到文本 (局_计次)“ 中的子匹配文本 1:” + 局_正则.取子匹配文本 (局_计次, 1))
计次循环尾 ()
返回 (局_匹配数)


看了教程,现在采集的只有网址出来了,还有乱码,求大神指点一下

最佳答案

查看完整内容

乱码一般是编码问题 试试 utf8转gb2312 补充内容 (2020-4-6 21:00): xx=编码_UTF8到GB2312(xx)

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
结帖率:100% (5/5)

签到天数: 9 天

发表于 2020-4-6 15:51:52 | 显示全部楼层   浙江省温州市
乱码一般是编码问题  试试 utf8转gb2312

补充内容 (2020-4-6 21:00):
xx=编码_UTF8到GB2312(xx)

评分

参与人数 1荣誉 +1 收起 理由
笨潴 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表