开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

楼主: 憨憨问号
收起左侧

[已解决] 网站爬取数据问题

 关闭 [复制链接]

发表于 2024-12-13 17:10:06 | 显示全部楼层   湖南省长沙市
憨憨问号 发表于 2024-12-13 17:07
我尝试用精易模块的Gzip解压没有效果,空白

没问题啊,我都解出来了,你是没下载gzip.dll吧。精益的需要这个dll
回复

使用道具 举报

结帖率:82% (75/92)

签到天数: 12 天

发表于 2024-12-13 17:12:06 | 显示全部楼层   贵州省遵义市
抱歉,url解码应该不要把utf8参数填真。这样才能对

调试输出 (编码_URL解码 (编码_Utf8到Ansi (网页_访问_对象 (“https://price.filtereditor.cn/static/js/index-500af0b0.js”)), 假))
回复

使用道具 举报

结帖率:100% (17/17)

签到天数: 11 天

 楼主| 发表于 2024-12-13 17:12:11 | 显示全部楼层   河南省新乡市
emodiyu 发表于 2024-12-13 17:05
URL解码有个UTF8参数,填写 真

这个是原始数据
返回数据.txt (700.55 KB, 下载次数: 0)
回复

使用道具 举报

结帖率:100% (17/17)

签到天数: 11 天

 楼主| 发表于 2024-12-13 17:14:12 | 显示全部楼层   河南省新乡市
black0216 发表于 2024-12-13 17:03
看头部H4sIAAAAAAAAA这样的就是Gzip压缩了

https://api.filtereditor.cn/prod/system/getPriceJson?id=2
返回出来的
我尝试了精易模块的gzip解压,无效
url解码,无效(utf8变量填真填假都无效)
base64解码,无效
大神再看看呢?是不是数据需要替换某些符号才能正常解码?
回复

使用道具 举报

结帖率:100% (17/17)

签到天数: 11 天

 楼主| 发表于 2024-12-13 17:14:42 | 显示全部楼层   河南省新乡市
emodiyu 发表于 2024-12-13 17:12
抱歉,url解码应该不要把utf8参数填真。这样才能对

调试输出 (编码_URL解码 (编码_Utf8到Ansi (网页_访问_ ...

然后还有,这个js里面只有道具名字,没有价格数据吧?
回复

使用道具 举报

结帖率:100% (17/17)

签到天数: 11 天

 楼主| 发表于 2024-12-13 17:15:03 | 显示全部楼层   河南省新乡市
black0216 发表于 2024-12-13 17:13
哪里那么多无效哦,挺大的我给写道文件了

好的大佬我试一下
回复

使用道具 举报

结帖率:82% (75/92)

签到天数: 12 天

发表于 2024-12-13 17:16:40 | 显示全部楼层   贵州省遵义市
憨憨问号 发表于 2024-12-13 17:14
然后还有,这个js里面只有道具名字,没有价格数据吧?

因为有很多个相同的js文件,你需要抓包把它们找出来
回复

使用道具 举报

结帖率:100% (17/17)

签到天数: 11 天

 楼主| 发表于 2024-12-13 17:16:46 | 显示全部楼层   河南省新乡市
black0216 发表于 2024-12-13 17:13
哪里那么多无效哦,挺大的我给写道文件了

大佬,这个常量1里的内容是哪个api返回来的
回复

使用道具 举报

签到天数: 20 天

发表于 2024-12-13 17:18:14 | 显示全部楼层   湖南省长沙市
憨憨问号 发表于 2024-12-13 17:16
大佬,这个常量1里的内容是哪个api返回来的

就你发的那个接口啊,他是个json。你从中取出data的值不就是了,就是H4sIAAAAAAAAA这样开头的就是Gzip压缩的内容
回复

使用道具 举报

结帖率:100% (17/17)

签到天数: 11 天

 楼主| 发表于 2024-12-13 17:19:23 | 显示全部楼层   河南省新乡市
black0216 发表于 2024-12-13 17:18
就你发的那个接口啊,他是个json。你从中取出data的值不就是了,就是H4sIAAAAAAAAA这样开头的就是Gzip压 ...

https://api.filtereditor.cn/prod/system/getPriceJson?id=2
是这个吗?data中的内容
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表