开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 3778|回复: 18
收起左侧

[求助] 本人菜鸟一个啊,请大神指教,学习学习取网页文本问题

[复制链接]
结帖率:0% (0/2)
发表于 2014-5-14 21:50:57 | 显示全部楼层 |阅读模式   广东省梅州市
<TD>第十名</TD>
<TD style="TEXT-ALIGN: left; LINE-HEIGHT: 24px; PADDING-LEFT: 10px; WIDTH: 174px; HEIGHT: 29px"><SPAN>小花</SPAN></TD>
<TD style="TEXT-ALIGN: left; LINE-HEIGHT: 24px; PADDING-LEFT: 10px; WIDTH: 174px; HEIGHT: 29px"><SPAN>小明</SPAN></TD>
<TD style="TEXT-ALIGN: left; LINE-HEIGHT: 24px; PADDING-LEFT: 10px; WIDTH: 174px; HEIGHT: 29px"><SPAN>小小</SPAN></TD>

网页源码前后都一样啊,我只想取“小小”那两字怎么取呢?  这三个名字每几分钟都会换的   请大神指教指教啊

结帖率:86% (6/7)
发表于 2014-5-14 21:52:36 | 显示全部楼层   云南省昆明市
如果只是想去第三个。正则取子匹配文本,匹配索引固定为3就好

点评

谢谢,不过还是不行啊,搞得超级列表框显示全部一样了啊   广东省梅州市  详情 回复 发表于 2014-5-14 22:04
回复 支持 反对

使用道具 举报

发表于 2014-5-14 22:00:03 | 显示全部楼层   福建省南平市
案例给楼主写好了。。。模块使用精易模块就可以了。。
正则练习.rar (122.51 KB, 下载次数: 9)
回复 支持 反对

使用道具 举报

结帖率:84% (63/75)

签到天数: 14 天

发表于 2014-5-14 22:04:13 | 显示全部楼层   广东省珠海市
  
子程序名返回值类型公开备 注
获取中间  
变量名类 型静态数组备 注
网页文件字节集 
网页文件2文本型 
网页文件 = HTTP读文件 (“这里是需要获取信息的地址”)
网页文件2 = 编码_UTF8转GBK (网页文件)
下载地址 = 取文本_中间文本 (网页文件2, “”, “”)
更新内容 = 取文本_中间文本 (网页文件2, “[更新内容]”, “[/更新内容]”)
标签1.标题 = 最新版本
子程序名返回值类型公开备 注
取文本_中间文本文本型 
参数名类 型参考可空数组备 注
参_被寻找文本文本型
参_左边文本文本型
参_右边文本文本型
变量名类 型静态数组备 注
起点整数型 
终点整数型 
文本文本型 
起点 = 寻找文本 (参_被寻找文本, 参_左边文本, , )
判断 (起点 = -1)
返回 (“”)
起点 = 起点 + 取文本长度 (参_左边文本)
终点 = 寻找文本 (参_被寻找文本, 参_右边文本, 起点 + 1, )
判断 (终点 = -1)
返回 (“”)
文本 = 取文本中间 (参_被寻找文本, 起点, 终点 - 起点)
返回 (文本)

子程序名返回值类型公开备 注
编码_UTF8转GBK文本型 
参数名类 型参考可空数组备 注
utf8字节集字节集
返回 (编码_Unicode转GBK (编码_UTF8转Unicode (utf8字节集)))
子程序名返回值类型公开备 注
编码_UTF8转Unicode字节集 
参数名类 型参考可空数组备 注
utf8字节集字节集
变量名类 型静态数组备 注
len整数型单位: Word
Unicode字节集字节集 
ll  
ll = 取字节集长度 (utf8字节集)
len = MultiByteToWideChar_utf8 (65001, 0, utf8字节集, ll, { }, 0)
' 936 表示简体中文代码页; -1 表示以"0"作为文本终止符
' 如果要去掉转换后Unicode字节集末尾的{0,0},则Unicode长度再减去1
Unicode字节集 = 取空白字节集 (len × 2)
MultiByteToWideChar_utf8 (65001, 0, utf8字节集, ll, Unicode字节集, len × 2)
返回 (Unicode字节集)
子程序名返回值类型公开备 注
编码_Unicode转GBK文本型 
参数名类 型参考可空数组备 注
Unicode字节集字节集
变量名类 型静态数组备 注
GBK_len整数型单位: Word
unicode_len  
GBK文本型 
unicode_len = 取字节集长度 (Unicode字节集) ÷ 2
GBK_len = WideCharToMultiByte (936, 0, Unicode字节集, unicode_len, GBK, 0, “”, 0)
' 936 表示简体中文代码页; -1 表示以"0"作为文本终止符
' 如果要去掉转换后Unicode字节集末尾的{0,0},则Unicode长度再减去1
GBK = 取空白文本 (GBK_len)
' 输出调试文本 (ansi_len)
WideCharToMultiByte (936, 0, Unicode字节集, unicode_len, GBK, GBK_len, “”, 0)
返回 (GBK)


i支持库列表   支持库注释   
internet互联网支持库




代码已经写好,你把代码复制到一个新的易语言,然后加一个编辑框就OK了

点评

第十名 小花 小明 小小 第十名 小明 小花 小小 第十名 小小 小花 小明 它每次都不一样的哦,网址上会变动的   广东省梅州市  详情 回复 发表于 2014-5-14 22:13
加一个标签才对,不是编辑框,是标签   广东省珠海市  发表于 2014-5-14 22:04
回复 支持 反对

使用道具 举报

结帖率:0% (0/2)
 楼主| 发表于 2014-5-14 22:04:15 | 显示全部楼层   广东省梅州市
残血小羽 发表于 2014-5-14 21:52
如果只是想去第三个。正则取子匹配文本,匹配索引固定为3就好

谢谢,不过还是不行啊,搞得超级列表框显示全部一样了啊
回复 支持 反对

使用道具 举报

结帖率:0% (0/2)
 楼主| 发表于 2014-5-14 22:13:21 | 显示全部楼层   广东省梅州市
じMarcusジ 发表于 2014-5-14 22:04
[e=1].版本 2
.支持库 internet

<TD>第十名</TD>
<TD style="TEXT-ALIGN: left; LINE-HEIGHT: 24px; PADDING-LEFT: 10px; WIDTH: 174px; HEIGHT: 29px"><SPAN>小花</SPAN></TD>
<TD style="TEXT-ALIGN: left; LINE-HEIGHT: 24px; PADDING-LEFT: 10px; WIDTH: 174px; HEIGHT: 29px"><SPAN>小明</SPAN></TD>
<TD style="TEXT-ALIGN: left; LINE-HEIGHT: 24px; PADDING-LEFT: 10px; WIDTH: 174px; HEIGHT: 29px"><SPAN>小小</SPAN></TD>

<TD>第十名</TD>
<TD style="TEXT-ALIGN: left; LINE-HEIGHT: 24px; PADDING-LEFT: 10px; WIDTH: 174px; HEIGHT: 29px"><SPAN>小明</SPAN></TD>
<TD style="TEXT-ALIGN: left; LINE-HEIGHT: 24px; PADDING-LEFT: 10px; WIDTH: 174px; HEIGHT: 29px"><SPAN>小花</SPAN></TD>
<TD style="TEXT-ALIGN: left; LINE-HEIGHT: 24px; PADDING-LEFT: 10px; WIDTH: 174px; HEIGHT: 29px"><SPAN>小小</SPAN></TD>

<TD>第十名</TD>
<TD style="TEXT-ALIGN: left; LINE-HEIGHT: 24px; PADDING-LEFT: 10px; WIDTH: 174px; HEIGHT: 29px"><SPAN>小小</SPAN></TD>
<TD style="TEXT-ALIGN: left; LINE-HEIGHT: 24px; PADDING-LEFT: 10px; WIDTH: 174px; HEIGHT: 29px"><SPAN>小花</SPAN></TD>
<TD style="TEXT-ALIGN: left; LINE-HEIGHT: 24px; PADDING-LEFT: 10px; WIDTH: 174px; HEIGHT: 29px"><SPAN>小明</SPAN></TD>


它每次都不一样的哦,网址上会变动的
回复 支持 反对

使用道具 举报

结帖率:92% (12/13)
发表于 2014-5-14 22:59:28 | 显示全部楼层   湖北省天门市
只要网页格式不变,地址变,还是可以取得到,直接取中间文本
回复 支持 反对

使用道具 举报

结帖率:84% (27/32)
发表于 2014-5-14 23:26:39 | 显示全部楼层   广东省潮州市
把网站贴出来,正则大部分可以搞定的。

点评

网址http://www.1396me.com/pk10/betgame,我只想取到每期的第十名的大小单双的输赢,到超级列表框里,谢谢   广东省梅州市  详情 回复 发表于 2014-5-15 00:14
回复 支持 反对

使用道具 举报

结帖率:0% (0/2)
 楼主| 发表于 2014-5-15 00:14:49 | 显示全部楼层   广东省梅州市
易人一本 发表于 2014-5-14 23:26
把网站贴出来,正则大部分可以搞定的。

网址http://www.1396me.com/pk10/betgame,我只想取到每期的第十名的大小单双的输赢,到超级列表框里,谢谢
回复 支持 反对

使用道具 举报

发表于 2014-5-15 08:09:52 | 显示全部楼层   重庆市重庆市
我也是最菜的鸟
回复 支持 反对

使用道具 举报

  高级模式
B Color Image Link Quote Code Smilies |上传

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表