|
1、提取网页源码时一般要先进行去引号、去空格、去除多余重复无用信息等操作,以便得到想要的源码
2、经过上面的操作得到的源码不能去除回车换行符,如果用 <td>.*</td>则不能正确匹配,无法得到想要的代码,此时建议使用<td>([\s\S]*?)</td>
.版本 2
.支持库 RegEx
.支持库 iext
.子程序 _窗口10_创建完毕
.局部变量 源码, 文本型
.局部变量 临时文本, 文本型
.局部变量 正则, 正则表达式
.局部变量 aa, 正则表达式
.局部变量 bb, 搜索结果
.局部变量 结果, 搜索结果, , "0"
.局部变量 i, 整数型
.局部变量 j, 整数型
.局部变量 m, 整数型
源码 = 窗口9.编辑框1.内容
正则.创建 (“<td>([\s\S]*?)</td>”, )
结果 = 正则.搜索全部 (源码)
超级列表框1.全部删除 ()
j = 1
.计次循环首 (取数组成员数 (结果) ÷ 4, )
超级列表框1.插入表项 (, , , , , )
i = 0
.计次循环首 (4, i)
临时文本 = 结果 [j + i - 1].取匹配文本 (源码, )
.如果 (i = 4)
临时文本 = 子文本替换 (临时文本, “<td><atitle=”, , , , 真)
临时文本 = 子文本替换 (临时文本, “</td>”, , , , 真)
aa.创建 (“.*>”, )
bb = aa.搜索 (临时文本, 1, )
临时文本 = bb.取匹配文本 (临时文本, )
m = 取文本长度 (临时文本) - 1
临时文本 = 取文本中间 (临时文本, 1, m)
超级列表框1.置标题 (超级列表框1.取表项数 () - 1, i - 1, 临时文本)
.否则
m = 取文本长度 (临时文本) - 9
临时文本 = 取文本中间 (临时文本, 5, m)
超级列表框1.置标题 (超级列表框1.取表项数 () - 1, i - 1, 临时文本)
|
|