开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 863|回复: 1
收起左侧

[图文资料] 正则表达式提取网页源码

[复制链接]
发表于 2020-12-11 09:28:12 | 显示全部楼层 |阅读模式   河北省石家庄市
1、提取网页源码时一般要先进行去引号、去空格、去除多余重复无用信息等操作,以便得到想要的源码

2、经过上面的操作得到的源码不能去除回车换行符,如果用   <td>.*</td>则不能正确匹配,无法得到想要的代码,此时建议使用<td>([\s\S]*?)</td>
.版本 2
.支持库 RegEx
.支持库 iext

.子程序 _窗口10_创建完毕
.局部变量 源码, 文本型
.局部变量 临时文本, 文本型
.局部变量 正则, 正则表达式
.局部变量 aa, 正则表达式
.局部变量 bb, 搜索结果
.局部变量 结果, 搜索结果, , "0"
.局部变量 i, 整数型
.局部变量 j, 整数型
.局部变量 m, 整数型

源码 = 窗口9.编辑框1.内容
正则.创建 (“<td>([\s\S]*?)</td>”, )
结果 = 正则.搜索全部 (源码)

超级列表框1.全部删除 ()

j = 1
.计次循环首 (取数组成员数 (结果) ÷ 4, )
    超级列表框1.插入表项 (, , , , , )
    i = 0
    .计次循环首 (4, i)
        临时文本 = 结果 [j + i - 1].取匹配文本 (源码, )
        .如果 (i = 4)
            临时文本 = 子文本替换 (临时文本, “<td><atitle=”, , , , 真)
            临时文本 = 子文本替换 (临时文本, “</td>”, , , , 真)
            aa.创建 (“.*>”, )
            bb = aa.搜索 (临时文本, 1, )
            临时文本 = bb.取匹配文本 (临时文本, )
            m = 取文本长度 (临时文本) - 1
            临时文本 = 取文本中间 (临时文本, 1, m)
            超级列表框1.置标题 (超级列表框1.取表项数 () - 1, i - 1, 临时文本)

        .否则

            m = 取文本长度 (临时文本) - 9
            临时文本 = 取文本中间 (临时文本, 5, m)
            超级列表框1.置标题 (超级列表框1.取表项数 () - 1, i - 1, 临时文本)




发表于 2020-12-13 10:14:43 | 显示全部楼层   菲律宾
感谢发布原创作品,精易因你更精彩!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表