开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 2825|回复: 13
收起左侧

[易语言] 正则提取网页超链接的问题

[复制链接]
结帖率:25% (1/4)
发表于 2011-8-21 01:10:51 | 显示全部楼层 |阅读模式   广东省深圳市
10精币
利用正则提取网页源码中的超链接,即是将源码中的所有a标签“<a……>……</a>”部分代码取出。
表达式=<a.*</a>的时候,取出错误,例如网页源码如下:
<a href="../a/1.html">类似结果1</a><a href="../a/2.html">类似结果2</a><a href="../a/3.html">类似结果3</a><a href="../a/4.html">类似结果4</a><a href="../a/5.html">类似结果5</a><a href="../a/6.html">类似结果6</a><a href="../a/7.html">类似结果7</a><a href="../a/8.html">类似结果8</a>

此时使用上述表达式,则匹配结果没有把这些超链接分开。
本人试过用表达式=<a[^<]*<,进行匹配,可以把超链接分开了,但是如果某个超链接的文本中出现“<”的时候就会匹配错误。
比如这样的时候:<a href="../a/8.html">类似<<结果8</a>,就会匹配错误。必须要以</a>作为匹配字符串的结尾。请问匹配表达式应该如何写?谢谢


回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
结帖率:43% (3/7)

签到天数: 9 天

发表于 2011-8-21 01:40:25 | 显示全部楼层   广东省揭阳市
<a.*?>(.*?)</a>
回复

使用道具 举报

结帖率:100% (4/4)

签到天数: 21 天

发表于 2011-8-21 01:51:18 | 显示全部楼层   湖南省益阳市
<a href="(.*?)">(.*?)</a>
回复

使用道具 举报

结帖率:100% (1/1)
发表于 2011-8-21 02:24:21 | 显示全部楼层   湖南省衡阳市
不如提取这样的信息,反正网页链接都是a href=开始的是吧
提取  <a href="*.html">
  这样不快的多? 而且提取出来的都是以HTML结尾的链接!
其他的就不用管了  反正你只是提取链接呗  用正则表达式 我觉得我这个应该是效率最高 速度最快的!
不用提取全部的  就单独提取一条链接!
回复

使用道具 举报

结帖率:64% (7/11)

签到天数: 9 天

发表于 2011-8-21 02:38:20 | 显示全部楼层   江苏省苏州市
href *= *['"]*(\S+)["']

回复

使用道具 举报

发表于 2011-8-21 07:49:34 | 显示全部楼层   山东省青岛市
{:3_227:}不懂
回复

使用道具 举报

结帖率:25% (1/4)
 楼主| 发表于 2011-8-21 14:11:02 | 显示全部楼层   广东省深圳市
我试试…………{:3_232:}
回复

使用道具 举报

结帖率:25% (1/4)
 楼主| 发表于 2011-8-21 14:14:02 | 显示全部楼层   广东省深圳市
果子 发表于 2011-8-21 01:40
(.*?)

果子大哥这个表达式可以了,但是我不明白.*?中的问号“?”有什么作用?为什么我的<a.*</a>这个就不行?谢谢
回复

使用道具 举报

结帖率:25% (1/4)
 楼主| 发表于 2011-8-21 14:21:36 | 显示全部楼层   广东省深圳市
懒惰匹配模式,知道了…………{:3_244:}
回复

使用道具 举报

结帖率:0% (0/3)

签到天数: 4 天

发表于 2012-2-22 12:18:38 | 显示全部楼层   广东省广州市
我也想知道{:3_226:}
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表