开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 704|回复: 2
收起左侧

[原创软件] 静态单页扒站,顺便请教一下

[复制链接]
结帖率:80% (4/5)
发表于 2024-9-25 17:34:16 | 显示全部楼层 |阅读模式   山西省太原市
软件展示
在线分析报告: https://habo.qq.com/file/showdetail?pk=ADYGY11sB24IPFs6U2oHYQ%3D%3D
本帖最后由 小新wl 于 2024-9-25 17:46 编辑

软件截图

PixPin_2024-09-25_17-44-44.png

功能介绍

目前只能扒静态网页,并自动分类储存静态文件,可以当作一个网页模板扒取程序使用。

只扒取首页

选项介绍

  1. html:扒不了打开,默认扒/下的网页,打开之后扒/index.html
  2. 模拟请求:扒不了打开,带常用请求头
  3. 根目录:静态资源保存在index.html同级目录
  4. 指定目录:静态资源保存在下级目录,填名称(开头不带/)
  5. 网址:http:// 或 https:// 开头,/结束,如果发现静态资源扒不了,去掉/试试

我是菜鸟,限制如下

js,css中的引用文件爬不了,没实现(字体文件一般在css中加载,所以字体文件暂时不行)

js中动态加载的静态文件扒不了

带参数的网址爬不了,

恳请大佬指教一下这些限制如何解决!


单页扒站.zip (444.9 KB, 下载次数: 4)

--------------------------优秀帖点我申请--------------------------
违规软件信息请点击帖子右下角举报按钮。
结帖率:89% (16/18)
发表于 2024-9-26 12:56:31 | 显示全部楼层   山东省威海市
  支持了
回复 支持 反对

使用道具 举报

签到天数: 1 天

发表于 2024-9-25 21:09:43 | 显示全部楼层   辽宁省沈阳市
感谢分享
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表