开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 167|回复: 6
收起左侧

[易语言] 易语言爬小说时章节ID无规律变化怎么解决

[复制链接]
结帖率:75% (3/4)
发表于 2025-3-26 01:12:29 | 显示全部楼层 |阅读模式   广东省佛山市
30精币
https://read.zongheng.com/chapter/1336976/78192253.html?https://read.zongheng.com/chapter/1336976/78192240.html?上面两串提交的URL地址中,第一个数字是小说ID所以是不变的,第二个数字是章节ID,但是变化毫无规律,如何知道全部的章节ID用以直接爬取全部信息
用AI给的代码时会提示错误(36): 找不到指定的对象成员命令名称“取文本”,我把这个命令删掉该为直接加文本时会提示错误(10050): “加入成员”库命令的参数“欲加入成员的数组变量”需要直接提供数组变量。
如何解决这个问题?
下面是AI给的代码
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
变量名类 型数组备 注
小说ID文本型  
所有章节文本型0 

子程序名返回值类型公开备 注
__启动窗口_创建完毕  
小说ID = "1336976"  ; 替换为实际小说ID
按钮_开始.标题 = "开始采集"
子程序名返回值类型公开备 注
_按钮_开始_被单击  
获取全部章节ID ()
下载所有章节内容 ()
; 核心子程序:通过API获取章节列表
子程序名返回值类型公开备 注
获取全部章节ID  
变量名类 型静态数组备 注
页数整数型 
API地址文本型 
返回数据文本型 
JSON类_json 
章节数整数型 
计次循环首 (999, 页数)  ; 假设最多999页
API地址 = "https://book.zongheng.com/api/chapter/chapterList"
API地址 = API地址 + "?bookId=" + 小说ID + "&pageNum=" + 到文本 (页数)

返回数据 = 到文本 (网页_访问 (API地址, 0, , , , "User-Agent: Mozilla/5.0", , , , , ))

如果真 (JSON.解析 (返回数据, 真, ))
信息框 ("第" + 到文本 (页数) + "页请求失败", 0, "错误", )
跳出循环 ()

章节数 = JSON.成员数 ("data.chapterList")
如果真 (章节数 = 0)
跳出循环 ()

计次循环首 (章节数, i)
加入成员 (所有章节, JSON.取属性对象 ("data.chapterList[" + 到文本 (i-1) + "]").取文本 ("chapterId"))
计次循环尾 ()

延时 (1000)  ; 防止请求过快
计次循环尾 ()
; 下载所有章节内容
子程序名返回值类型公开备 注
下载所有章节内容  
变量名类 型静态数组备 注
章节ID文本型 
内容文本型 
计次循环首 (取数组成员数 (所有章节), i)
章节ID = 所有章节[i]
内容 = 到文本 (网页_访问 ("https://read.zongheng.com/chapter/" + 小说ID + "/" + 章节ID + ".html"))
保存内容 (章节ID, 内容)
编辑框_进度.加入文本 ("已下载章节:" + 章节ID + #换行符 )
计次循环尾 ()
子程序名返回值类型公开备 注
保存内容  
参数名类 型参考可空数组备 注
章节ID文本型
内容文本型
变量名类 型静态数组备 注
文件名文本型 
文件名 = 取运行目录 () + "\" + 章节ID + ".html"
写到文件 (文件名, 到字节集 (内容))


i支持库列表   支持库注释   
internet互联网支持库
spec特殊功能支持库
jy(未知支持库)




回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳

结帖率:100% (20/20)

签到天数: 19 天

发表于 2025-3-26 09:05:37 | 显示全部楼层   浙江省杭州市
https://www.zongheng.com/detail/1336976?tabsName=catalogue  这里不是有每一章的链接吗
回复

使用道具 举报

结帖率:100% (14/14)

签到天数: 2 天

发表于 2025-3-26 10:14:29 | 显示全部楼层   安徽省安庆市
b0y 发表于 2025-3-26 09:05
https://www.zongheng.com/detail/1336976?tabsName=catalogue  这里不是有每一章的链接吗

就是   目录忽略去选择走弯路  
回复

使用道具 举报

结帖率:96% (43/45)

签到天数: 15 天

发表于 2025-3-26 10:17:42 | 显示全部楼层   福建省厦门市
  
子程序名返回值类型公开备 注
获取所有章节存取列表 
参数名类 型参考可空数组备 注
bookId文本型
变量名类 型静态数组备 注
局_网址文本型 
局_方式整数型 
局_提交数据文本型 
ADD_协议头类_POST数据类 
局_提交协议头文本型 
局_结果字节集 
局_返回文本型 
Json存取键值表 
小说列表存取列表 
局_网址 = https://bookapi.zongheng.com/api/chapter/getChapterList
局_方式 = 1
局_提交数据 = “bookId=” + bookId
ADD_协议头.添加 (“User-Agent”, “Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.87 Safari/537.36”, )
局_提交协议头 = ADD_协议头.获取协议头数据 ()
局_结果 = 网页_访问_对象 (局_网址, 局_方式, 局_提交数据, , , 局_提交协议头, , , , , , , , , , , , , )
局_返回 = 到文本 (编码_编码转换对象 (局_结果, , , ))
Json.从JSON载入 (局_返回, , , )
Json.取列表 (“//result.chapterList[1].chapterViewList”, 小说列表)
返回 (小说列表)


i支持库列表   支持库注释   
e2eeE2EE互联网服务器套件

chapterId就是
回复

使用道具 举报

结帖率:78% (18/23)

签到天数: 2 天

发表于 2025-3-26 13:34:11 | 显示全部楼层   浙江省嘉兴市
每一篇小说的章节的地址是数字的,是逐步递增有规律的。
回复

使用道具 举报

结帖率:75% (3/4)
 楼主| 发表于 2025-3-28 07:23:44 | 显示全部楼层   广东省佛山市
b0y 发表于 2025-3-26 09:05
https://www.zongheng.com/detail/1336976?tabsName=catalogue  这里不是有每一章的链接吗

那只是拿这个小说网站举个例子,如果开发者在链接中置入一个无规律数字呢
回复

使用道具 举报

结帖率:100% (20/20)

签到天数: 19 天

发表于 2025-3-28 09:46:02 | 显示全部楼层   浙江省杭州市
请看我的名 发表于 2025-3-28 07:23
那只是拿这个小说网站举个例子,如果开发者在链接中置入一个无规律数字呢 ...

总有地方让你获取这些链接 没有规律不可能没有地方获取 总有个目录之类的
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表