开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 3560|回复: 13
收起左侧

[技术专题] 为什么我读取网站页面的源码读取不成功?有代码和结果

[复制链接]
结帖率:55% (11/20)
发表于 2019-2-14 16:44:06 | 显示全部楼层 |阅读模式   广东省广州市
本帖最后由 new035 于 2019-2-14 16:46 编辑

比如我想读取知乎上面的一个网站:https://www.zhihu.com/question/302378021/answer/557792503
结果是文本上面这样的只有样式,应该怎么读取才行?

1.txt

4.29 KB, 下载次数: 4, 下载积分: 精币 -2 枚

1.png

结帖率:0% (0/1)
发表于 2019-11-11 13:57:39 | 显示全部楼层   福建省福州市
访问方式有post和get,确认下访问方式
回复 支持 反对

使用道具 举报

结帖率:75% (3/4)
发表于 2019-3-3 00:14:50 | 显示全部楼层   山东省枣庄市
可以试试  用  http读文件(“网址”)
回复 支持 反对

使用道具 举报

结帖率:75% (3/4)
发表于 2019-3-3 00:14:04 | 显示全部楼层   山东省枣庄市
不用写到桌面那么麻烦,直接到文本()然后调试输出就可以看了
回复 支持 反对

使用道具 举报

结帖率:75% (3/4)
发表于 2019-3-3 00:13:35 | 显示全部楼层   山东省枣庄市
先把字节集数据到文本然后输出一下看看
回复 支持 反对

使用道具 举报

发表于 2019-2-23 06:53:59 高大上手机用户 | 显示全部楼层   安徽省蚌埠市
Y罢不能 发表于 2019-2-14 17:19
带上协yi头

[e=2].版本 2

学习了,好好学习下
回复 支持 反对

使用道具 举报

结帖率:50% (3/6)
发表于 2019-2-15 19:46:50 | 显示全部楼层   广东省韶关市
你一个问问题的,还把问题给设置成需要精币下载。。。。你的文本里面是什么我不知道 这个是按照你发出来的图片写的
QQ截图20190215194432.png
回复 支持 反对

使用道具 举报

结帖率:100% (5/5)

签到天数: 22 天

发表于 2019-2-14 18:10:30 | 显示全部楼层   江苏省苏州市
000001.e (768.44 KB, 下载次数: 3)

点评

推荐使用精易模块的,开源,安全,功能齐全,更新快, 精易模块官方网站 - 免费开源的易语言模块 http://ec.125.la/   江苏省苏州市  发表于 2019-2-14 18:10
回复 支持 反对

使用道具 举报

结帖率:55% (11/20)
 楼主| 发表于 2019-2-14 18:06:39 | 显示全部楼层   广东省广州市
Y罢不能 发表于 2019-2-14 17:19
带上协yi头

[e=2].版本 2

,我用了你的方法,感觉没什么数据啊,想问一下,那你们爬虫的话是这样爬的吗?还是说协yi头哪里还需要一些更改才行?
回复 支持 反对

使用道具 举报

结帖率:100% (5/5)

签到天数: 22 天

发表于 2019-2-14 17:19:33 | 显示全部楼层   江苏省苏州市
带上协yi头

  
子程序名返回值类型公开备 注
功能_网页访问文本型 本命令由【精易网页调试助手】生成,请配合精易模块使用。
变量名类 型静态数组备 注
局_网址文本型 
局_方式整数型 
ADD_协yi头类_POST数据类 
局_提交协yi头文本型 
局_结果字节集 
局_返回文本型 
局_网址 = "https://www.zhihu.com/question/302378021/answer/557792503"
局_方式 = 0
ADD_协yi头.添加 ("Host"," www.zhihu.com")
ADD_协yi头.添加 ("User-Agent"," Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:65.0) Gecko/20100101 Firefox/65.0")
ADD_协yi头.添加 ("Accept"," text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8")
ADD_协yi头.添加 ("Accept-Language"," zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2")
ADD_协yi头.添加 ("Connection"," keep-alive")
ADD_协yi头.添加 ("Upgrade-Insecure-Requests"," 1")
ADD_协yi头.添加 ("Pragma"," no-cache")
ADD_协yi头.添加 ("Cache-Control"," no-cache")
局_提交协yi头 = ADD_协yi头.获取协yi头数据 ()
局_结果 = 网页_访问_对象 (局_网址, 局_方式, , , , 局_提交协yi头, , , , , , , , , , , )
局_返回 = 到文本 (编码_编码转换对象 (局_结果))
返回 (局_返回)
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表