开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 2467|回复: 3
收起左侧

[完成] 网页采集以及文本处理的简单问题

 关闭 [复制链接]
结帖率:98% (233/238)
发表于 2014-1-22 20:39:39 | 显示全部楼层 |阅读模式   广东省潮州市
30精币
怎么把文本中【:"0","ip":"120.198.*.*"}},{"d":】 所有的IP采集出来,,
采集出来之后再做一下文本处理,显示出:120.198.0.0 120.198.255.255
测试地址:http://comment.news.163.com/cache/newlist/news_shehui_bbs/9J52TFB600011229_2.html
在线等,马上给分

最佳答案

查看完整内容

[e] .版本 2 .支持库 internet .支持库 spec .子程序 __启动窗口_创建完毕 .局部变量 返回文本, 文本型 .局部变量 正则, 正则表达式类 .局部变量 i, 整数型 .局部变量 文本, 文本型 返回文本 = 编码_URL解码 (到文本 (HTTP读文件 (“http://comment.news.163.com/cache/newlist/news_shehui_bbs/9J52TFB600011229_2.html”)), 真) 正则.创建 (“\d+\.\d+\....”, 返回文本, , ) .计次循环首 (正则.取匹配数量 (), i) 文本 ...

结帖率:0% (0/1)
发表于 2014-1-22 20:39:40 | 显示全部楼层   广东省茂名市
[e]
.版本 2
.支持库 internet
.支持库 spec

.子程序 __启动窗口_创建完毕
.局部变量 返回文本, 文本型
.局部变量 正则, 正则表达式类
.局部变量 i, 整数型
.局部变量 文本, 文本型

返回文本 = 编码_URL解码 (到文本 (HTTP读文件 (“http://comment.news.163.com/cache/newlist/news_shehui_bbs/9J52TFB600011229_2.html”)), 真)
正则.创建 (“\d+\.\d+\....”, 返回文本, , )
.计次循环首 (正则.取匹配数量 (), i)
    文本 = 文本 + 正则.取匹配文本 (i, ) + #换行符
.计次循环尾 ()
调试输出 (文本)

[/e]

这样子? 精易模块
回复

使用道具 举报

结帖率:100% (2/2)
发表于 2014-1-22 20:52:50 | 显示全部楼层   湖南省郴州市
IP都是显示的120.198.*.*  采集出来的也是这一样类型的IP,那个是*号是被服务器屏蔽了的IP  
回复

使用道具 举报

结帖率:100% (15/15)

签到天数: 1 天

发表于 2014-1-22 20:53:38 | 显示全部楼层   福建省漳州市
采集好了,你看对不对

正则_采集.rar

1.42 KB, 下载次数: 12, 下载积分: 精币 -1 枚

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表