开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 1204|回复: 3
收起左侧

[已解决] 读取网页源码时有些电脑只读到协yi头的问题

 关闭 [复制链接]
结帖率:94% (17/18)
发表于 2016-12-1 17:10:50 | 显示全部楼层 |阅读模式   浙江省台州市
200精币
读取网页源码使用的是send和recv,使用多年大部分用户都没有任何问题
偶尔会碰到有个用户出现只接收到协yi头却没有网页源码的情况
这是个静态页面reg.htm 用浏览器访问正常 用我的软件访问就只有协yi头
出现这种问题的情况很少 也许100个会碰到1个 求大神们帮帮忙 找出原因
下面贴出send数据 和 2个接收到的数据(直接写出字节集,无文本转换过程)
1.以下是send数据:
GET /reg.htm HTTP/1.1
User-Agent: Mozilla/4.0
Accept: */*
Host: www.xxxxxxxx.com
Cache-Control: no-cache

2.以下是接收不完整的数据:
HTTP/1.1 200 OK
Content-Length: 5191
Content-Type: text/html
Last-Modified: Tue, 29 Nov 2016 13:09:57 GMT
Accept-Ranges: bytes
ETag: "929e1ae2414ad21:1d89"
Server: Microsoft-IIS/6.0
X-Powered-By: ASP.NET
Date: Thu, 01 Dec 2016 07:25:52 GMT

3.以下是接收完整的数据:
HTTP/1.1 200 OK
Content-Length: 5191
Content-Type: text/html
Last-Modified: Tue, 29 Nov 2016 13:09:57 GMT
Accept-Ranges: bytes
ETag: "929e1ae2414ad21:1d89"
Server: Microsoft-IIS/6.0
X-Powered-By: ASP.NET
Date: Thu, 01 Dec 2016 07:33:44 GMT
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>注册页面</title>
<style type="text/css">
<!--
.STYLE1 { FONT-WEIGHT: bold; FONT-SIZE: 12px
}
.STYLE2 { FONT-SIZE: 12px
}
.style3 {color: #009933}
.style9 {color: #FF0000}
-->
</style>
</head>
<body>
<div align="center">
  <TABLE cellSpacing=0 width=514 border=0>
    <TBODY>
<TR>
......此处为最简单的10行表格......省略几百字
      </TR>
    </TBODY>
  </TABLE>
</div>
</body>
</html>

最佳答案

查看完整内容

这个问题.我估计你贴到CSDN也很少有人知道 这个问题很偏僻 比较经典的就是百度的首页 不进行gzip压缩的时候 只返回http头 但是再次接收,就返回了BODY 解决办法也很简单 然后循环recv即可.你之前肯定是只send和recv了一次 如果recv返回0的时候,被阻塞等待时间长.HTTP头加上Connection:close搞定 如果这个办法不行.那么还有另外的办法 不过这个解决办法基本上还是比较通杀的 ...

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
结帖率:100% (1/1)
发表于 2016-12-1 17:10:51 | 显示全部楼层   北京市北京市
这个问题.我估计你贴到CSDN也很少有人知道
这个问题很偏僻
比较经典的就是百度的首页 不进行gzip压缩的时候
只返回http头
但是再次接收,就返回了BODY
解决办法也很简单
然后循环recv即可.你之前肯定是只send和recv了一次
如果recv返回0的时候,被阻塞等待时间长.HTTP头加上Connection:close搞定
如果这个办法不行.那么还有另外的办法
不过这个解决办法基本上还是比较通杀的
回复

使用道具 举报

结帖率:100% (3/3)
发表于 2016-12-1 17:19:28 | 显示全部楼层   广东省深圳市
你可能遇到了302的链接或者服务器带有反爬虫,这个要看具体需求的了。
回复

使用道具 举报

结帖率:94% (17/18)
 楼主| 发表于 2016-12-1 17:44:24 | 显示全部楼层   浙江省台州市
键盘上的魔手 发表于 2016-12-1 17:19
你可能遇到了302的链接或者服务器带有反爬虫,这个要看具体需求的了。

99个用户使用是正常的 就1个用户出现这种情况

补充内容 (2016-12-1 17:51):
而且访问也不频繁  一般只访问一次
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表