开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 4105|回复: 14
收起左侧

[易语言纯源码] 第④期十四课小说采集

[复制链接]
发表于 2019-1-26 13:44:02 | 显示全部楼层 |阅读模式   山东省聊城市
分享源码
界面截图:
是否带模块: 纯源码
备注说明: -
本帖最后由 时光海苔 于 2019-1-26 13:45 编辑
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
变量名类 型数组备 注
小说名称文本型  
小说地址文本型  

子程序名返回值类型公开备 注
__启动窗口_创建完毕  
判断 (目录_是否存在 (取运行目录 ()“/小说采集”))
创建目录 (取运行目录 ()“/小说采集”)


获取小说目录 ()
子程序名返回值类型公开备 注
获取小说目录  
变量名类 型静态数组备 注
返回文本文本型 
正则正则表达式类 
n整数型 
临时_表项索引整数型 
返回文本 = 到文本 (网页_GZIP解压 (网页_访问_对象 (“http://www.xbiquge.la/paihangbang/”)))
' 调试输出 (返回文本)
判断 (返回文本 = “”)
返回文本 = 到文本 (网页_访问_对象 (“http://www.xbiquge.la/paihangbang/”))


返回文本 = 编码_utf8到gb2312 (返回文本)
' 调试输出 (返回文本)
正则.创建 ( #小说列表正则, 返回文本, , )
计次循环首 (正则.取匹配数量 (), n)
' 索引2是小说名称 1是目录地址
临时_表项索引 = 超级列表框1.插入表项 (, , , , , )
超级列表框1.置标题 (临时_表项索引, 0, 正则.取子匹配文本 (n, 2))
超级列表框1.置标题 (临时_表项索引, 1, 正则.取子匹配文本 (n, 1))
计次循环尾 ()
子程序名返回值类型公开备 注
_按钮1_被单击  
判断 (超级列表框1.现行选中项 = -1)
信息框 (“你还没有选中小说,无法采集”, 0, , )
返回 ()



小说名称 = 超级列表框1.取标题 (超级列表框1.现行选中项, 0)
小说地址 = 超级列表框1.取标题 (超级列表框1.现行选中项, 1)
' 调试输出 (小说地址)
判断 (目录_是否存在 (取运行目录 ()“/小说采集/” + 小说名称))
创建目录 (取运行目录 ()“/小说采集/” + 小说名称)


获取小说章节 ()
子程序名返回值类型公开备 注
获取小说章节  
变量名类 型静态数组备 注
返回文本文本型 
正则正则表达式类 
n整数型 
章节地址文本型 
章节内容文本型 
返回文本 = 网页_访问S (小说地址)
' 调试输出 (返回文本)
正则.创建 ( #章节列表正则, 返回文本, , )
调试输出 (正则.取匹配数量 ())
时钟1.时钟周期 = 1000
计次循环首 (正则.取匹配数量 (), n)
章节地址 = 正则.取子匹配文本 (n, 1)
章节内容 = 获取章节内容 (章节地址)
标签1.标题 = 正则.取子匹配文本 (n, 2)
' 索引2是小说名称 1是地址
写到文件 (取运行目录 ()“/小说采集/” + 小说名称 + “/” + 正则.取子匹配文本 (n, 2)“.txt”, 到字节集 (章节内容))
' 跳出循环 ()
程序_延时 (1000)
计次循环尾 ()
时钟1.时钟周期 = 0
_启动窗口.标题 = “小说:” + 小说名称 + “,下载已完成”
子程序名返回值类型公开备 注
获取章节内容文本型 
参数名类 型参考可空数组备 注
章节地址文本型
变量名类 型静态数组备 注
返回文本文本型 
返回文本 = 网页_访问S (“http://www.xbiquge.la/” + 章节地址)
返回文本 = 文本_取出中间文本 (返回文本, #前边内容, “”, )
返回文本 = 文本_替换 (返回文本, , , , “ ”, “ ”,
, #换行符,
, #换行符)
' 调试输出 (返回文本)
返回 (返回文本)
子程序名返回值类型公开备 注
_时钟1_周期事件  
_启动窗口.标题 = “小说:” + 小说名称 + “,下载中.”


i支持库列表   支持库注释   
iext扩展界面支持库一
spec特殊功能支持库

每日一贴:小说网站采集
知识点总结:超级列表框,正则,时钟,文件操作,网页访问操作.
疑难问题:哪个大佬给解释下,代码如下
  
返回文本 = 到文本 (网页_GZIP解压 (网页_访问_对象 (“http://www.xbiquge.la/paihangbang/”)))
' 调试输出 (返回文本)
判断 (返回文本 = “”)
返回文本 = 到文本 (网页_访问_对象 (“http://www.xbiquge.la/paihangbang/”))



访问小说列表的时候,为什么有时用解压能拿到数据,有时不需要解压能拿到数据?

新笔趣阁小说爬虫.rar

195.44 KB, 下载次数: 45, 下载积分: 精币 -2 枚


发表于 2019-10-6 14:49:56 | 显示全部楼层   广东省东莞市
感谢楼主分享
回复 支持 反对

使用道具 举报

发表于 2019-3-22 21:38:53 | 显示全部楼层   河北省石家庄市
感谢楼主分享
回复 支持 反对

使用道具 举报

发表于 2019-3-22 21:37:06 | 显示全部楼层   河北省石家庄市
感谢楼主分享
回复 支持 反对

使用道具 举报

结帖率:75% (12/16)
发表于 2019-2-5 16:03:36 | 显示全部楼层   甘肃省张掖市
hangyubin 发表于 2019-1-30 22:18
怎么把章节合并在一起下载!困拢中…………。

写到变量里  哈哈
回复 支持 反对

使用道具 举报

签到天数: 9 天

发表于 2019-2-3 09:29:25 | 显示全部楼层   天津市天津市
感谢楼主分享
回复 支持 反对

使用道具 举报

结帖率:100% (1/1)
发表于 2019-2-2 23:47:21 | 显示全部楼层   广东省揭阳市
66666666666666666666
回复 支持 反对

使用道具 举报

结帖率:50% (1/2)
发表于 2019-1-30 22:18:22 | 显示全部楼层   湖南省衡阳市
怎么把章节合并在一起下载!困拢中…………。
回复 支持 反对

使用道具 举报

结帖率:0% (0/3)
发表于 2019-1-28 10:18:55 | 显示全部楼层   四川省乐山市
学习学习!!!!!!!!
回复 支持 反对

使用道具 举报

结帖率:100% (4/4)
发表于 2019-1-27 12:24:24 | 显示全部楼层   山东省济南市
感谢分享,很给力!~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表