开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 1768|回复: 11
收起左侧

[已解决] 花/瓣/网、滚动翻页的问题

 关闭 [复制链接]
结帖率:96% (47/49)
发表于 2015-11-19 20:48:16 | 显示全部楼层 |阅读模式   贵州省遵义市
80精币
网站翻页是滚动翻页的,抓包得到的地址分别是:

GET http://huaban.com/?ih68702v&max=529648421&limit=20&wfl=1
GET http://huaban.com/?ih68702w&max=529641211&limit=20&wfl=1
GET http://huaban.com/?ih68702x&since=529651913&limit=100&wfl=1

问题是不知道翻页的代码是由链接上的哪些部分改变的,因为我想采集,但是不知道怎么翻下一个

来个朋友指点下只要能弄出翻下一页就行,采集我自己弄,在这先谢谢了


最佳答案

查看完整内容

通过抓包找到了 http://huaban.com/favorite/design/ 的规律,然后给你写了个例程。只是提取了其中的 pin_id 的信息,其他的user_id,username,board_id,file_id 等相关信息没有做提取处理,你可以自己提取,都在网页访问后获得的网页源码中,此例程只是说明花瓣网的翻页原理。有问题可以给我留言或者此处回复,我会经常在论坛上逛的。望采纳 ...

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳

发表于 2015-11-19 20:48:17 | 显示全部楼层   浙江省杭州市
通过抓包找到了 http://huaban.com/favorite/design/ 的规律,然后给你写了个例程。只是提取了其中的 pin_id 的信息,其他的user_id,username,board_id,file_id
等相关信息没有做提取处理,你可以自己提取,都在网页访问后获得的网页源码中,此例程只是说明花瓣网的翻页原理。有问题可以给我留言或者此处回复,我会经常在论坛上逛的。望采纳


花瓣网翻页取信息例程----2015-11-19.rar (129.36 KB, 下载次数: 13)

评分

参与人数 2好评 +1 精币 +2 荣誉 +1 收起 理由
笨潴 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!
孝天 + 1 + 2 谢谢帮忙

查看全部评分

回复

使用道具 举报

结帖率:0% (0/1)

签到天数: 1 天

发表于 2015-11-19 21:02:42 | 显示全部楼层   重庆市重庆市
怎么需要翻页呢  所有的内容都在源代码里了

评分

参与人数 1精币 +1 收起 理由
孝天 + 1 谢谢帮忙

查看全部评分

回复

使用道具 举报

结帖率:0% (0/1)

签到天数: 1 天

发表于 2015-11-19 21:03:42 | 显示全部楼层   重庆市重庆市
  1. app.page["recommends"] =
复制代码

源代码里有 这个变量  后面的内容就是 JSON数据格式的全部内容。
这个网页其实已经加载了所有内容。只是显示的时候每次只显示几个而已

评分

参与人数 1精币 +1 收起 理由
孝天 + 1 谢谢帮忙

查看全部评分

回复

使用道具 举报

结帖率:96% (47/49)
 楼主| 发表于 2015-11-19 21:18:26 | 显示全部楼层   贵州省遵义市
ma8803 发表于 2015-11-19 21:02
怎么需要翻页呢  所有的内容都在源代码里了

意思是数据一开始就已经加载全部了?比如说我想要通过http://huaban.com/这个页面来取里的用户ID,那一次性就能提取完了不用翻页?
回复

使用道具 举报

结帖率:96% (47/49)
 楼主| 发表于 2015-11-19 21:22:20 | 显示全部楼层   贵州省遵义市
ma8803 发表于 2015-11-19 21:03
源代码里有 这个变量  后面的内容就是 JSON数据格式的全部内容。
这个网页其实已经加载了所有内容。只是 ...

那我想提取完这个页面,然后接着提取下一个页面的时候,下一个的网址是怎么推算出来的?
回复

使用道具 举报

结帖率:100% (2/2)

签到天数: 1 天

发表于 2015-11-19 21:39:34 | 显示全部楼层   湖南省湘潭市
你直接说你要取什么东西吧,80精币也帮你动动手。
回复

使用道具 举报

结帖率:96% (47/49)
 楼主| 发表于 2015-11-19 21:43:56 | 显示全部楼层   贵州省遵义市
新手来学易 发表于 2015-11-19 21:39
你直接说你要取什么东西吧,80精币也帮你动动手。

恩恩好的,打算从这个页面http://huaban.com/favorite/design/提取平面分类作品的作者ID,也就是"user_id":
回复

使用道具 举报

结帖率:96% (47/49)
 楼主| 发表于 2015-11-19 21:48:21 | 显示全部楼层   贵州省遵义市
新手来学易 发表于 2015-11-19 21:39
你直接说你要取什么东西吧,80精币也帮你动动手。

      但是直接访问http://huaban.com/favorite/design/这个地址取到的用户ID比较少,所以也就想到了一般见到的网站提取完一页就翻页提取第二页,只是不知道怎么翻页,如果可以的话就设置提取多少个页面的内容,最后一页页的提取就行了,现在差的是提取完成第一页后怎么取第二页的,不知道怎么推算地址
回复

使用道具 举报

发表于 2015-11-19 22:10:27 | 显示全部楼层   浙江省杭州市
这个网页每次只能显示20个,在你往下滚动页面的时候会向服务器发送请求,在请求20个下来,用的应该是ajax吧。api接口刚才看了能看懂,一会去给你做个例子发你
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表