开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 368|回复: 11
收起左侧

[已解决] 请大神帮忙获取网页信息

 关闭 [复制链接]
结帖率:100% (1/1)
发表于 2025-2-7 09:24:29 | 显示全部楼层 |阅读模式   河北省石家庄市
50精币
各位大神有没有什么方法可以获取这个网页的信息内容?包括正常备案、暂停工作、终止备案、用人单位、技工院校和下级评价机构信息。
http://pjjg.osta.org.cn/kindindex.html?recordType=5&cityNum=110000

万分感谢!

最佳答案

查看完整内容

用了E2EE和精易模块自己添加吧

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
结帖率:88% (45/51)

签到天数: 17 天

发表于 2025-2-7 09:24:30 | 显示全部楼层   河北省保定市
演示图片.png 获取数据.e (948.65 KB, 下载次数: 2)

评分

参与人数 1荣誉 +1 收起 理由
笨潴 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

结帖率:94% (16/17)

签到天数: 14 天

发表于 2025-2-7 09:41:39 | 显示全部楼层   河南省郑州市
POST地址
http://pjjg.osta.org.cn/prod-api/openapi/organization/province/org
参数1
province 固定 110000
参数2
status 1=正常备案 2=终止备案 3=暂停备案
参数3
queryType 5=用人单位 6=技工院校

补充内容 (2025-2-7 09:42):
不对 参数1是地区编码 110000=北京 120000=天津 以此类推
回复

使用道具 举报

签到天数: 16 天

发表于 2025-2-7 10:00:37 | 显示全部楼层   广东省阳江市
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
子程序名返回值类型公开备 注
_按钮1_被单击  
变量名类 型静态数组备 注
返回文本文本型 
' 以下 网页_访问S () 使用精易模块
' 正常备案 - 用人单位
返回文本 = 网页_访问S (“http://pjjg.osta.org.cn/prod-api/openapi/organization/province/org”, 1, “province=110000&status=1&queryType=5”)
调试输出 (编码_utf8到gb2312 (返回文本))
' 正常备案 - 技工学校
返回文本 = 网页_访问S (“http://pjjg.osta.org.cn/prod-api/openapi/organization/province/org”, 1, “province=110000&status=1&queryType=6”)
调试输出 (编码_utf8到gb2312 (返回文本))
' 暂停工作 - 用人单位
返回文本 = 网页_访问S (“http://pjjg.osta.org.cn/prod-api/openapi/organization/province/org”, 1, “province=110000&status=3&queryType=5”)
调试输出 (编码_utf8到gb2312 (返回文本))
' 暂停工作 - 技工学校
返回文本 = 网页_访问S (“http://pjjg.osta.org.cn/prod-api/openapi/organization/province/org”, 1, “province=110000&status=3&queryType=6”)
调试输出 (编码_utf8到gb2312 (返回文本))
' 终止备案 - 用人单位
返回文本 = 网页_访问S (“http://pjjg.osta.org.cn/prod-api/openapi/organization/province/org”, 1, “province=110000&status=2&queryType=5”)
调试输出 (编码_utf8到gb2312 (返回文本))
' 终止备案 - 技工学校
返回文本 = 网页_访问S (“http://pjjg.osta.org.cn/prod-api/openapi/organization/province/org”, 1, “province=110000&status=2&queryType=6”)
调试输出 (编码_utf8到gb2312 (返回文本))


i支持库列表   支持库注释   
spec特殊功能支持库

回复

使用道具 举报

结帖率:0% (0/1)

签到天数: 10 天

发表于 2025-2-7 10:02:47 | 显示全部楼层   广东省东莞市
搞不定联系
回复

使用道具 举报

结帖率:99% (79/80)
发表于 2025-2-7 10:03:49 | 显示全部楼层   陕西省宝鸡市
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
变量名类 型数组备 注
当前页码整数型  
总页数整数型  
代理池文本型0 

子程序名返回值类型公开备 注
__启动窗口_创建完毕  
加载代理列表 ()  ' 初始化代理IP池
按钮_开始获取.禁止 = 假
子程序名返回值类型公开备 注
_按钮_开始获取_被单击  
启动线程 (&主爬取流程, , )
子程序名返回值类型公开备 注
主爬取流程  
.局部变量 请求头, 文本型
.局部变量 响应文本, 文本型
.局部变量 当前代理, 文本型
当前页码 = 1
总页数 = 0
清空列表框 ()
判断循环首 (当前页码 ≤ 总页数 总页数 = 0)
当前代理 = 获取随机代理 ()
请求头 = 生成请求头 ()

如果真 (访问API接口 (当前页码, 当前代理, 请求头, 响应文本))
处理响应数据 (响应文本)
当前页码 = 当前页码 + 1
程序_延时 (取随机数 (2000, 5000))  ' 随机延时防封

判断循环尾 ()
子程序名返回值类型公开备 注
访问API接口逻辑型 
参数名类 型参考可空数组备 注
页码整数型
代理地址文本型
请求头文本文本型
返回数据文本型
变量名类 型静态数组备 注
http对象 
接口地址文本型 
响应状态整数型 
接口地址 = "http://pjjg.osta.org.cn/api/getOrgList"  ' 实际接口需通过浏览器开发者工具确认
接口地址 = 接口地址 + "?recordType=5&cityNum=110000&pageNum=” + 到文本(页码) + “&pageSize=10"
如果真 (http.创建 (“WinHttp.WinHttpRequest.5.1”))
返回 假

http.方法 (“SetProxy”, 2, 代理地址)  ' 设置代理
http.方法 (“SetRequestHeader”, “User-Agent”, 请求头文本)
http.方法 (“SetRequestHeader”, “Referer”, http://pjjg.osta.org.cn/)
http.方法 (“SetTimeouts”, 60000, 60000, 60000, 60000)  ' 设置超时
.尝试
http.方法 (“Open”, “GET”, 接口地址, )
http.方法 (“Send”)
响应状态 = http.读数值属性 (“Status”)
.异常
返回 假
.尝试结束
如果真 (响应状态 = 200)
返回数据 = http.读文本属性 (“ResponseText”)
返回 真
返回 假

子程序名返回值类型公开备 注
处理响应数据  
参数名类 型参考可空数组备 注
json数据文本型
变量名类 型静态数组备 注
json类_json 
数据数组文本型0
i整数型 
如果真 (json.解析 (json数据))
返回

总页数 = json.取属性数值 (“data.pages”)
json.取属性数组 (“data.list”, 数据数组)
计次循环首 (取数组成员数 (数据数组), i)
json.置属性 (“item”, 数据数组[i])
解析单条数据 (json)
计次循环尾 ()
子程序名返回值类型公开备 注
解析单条数据  
参数名类 型参考可空数组备 注
json类_json
变量名类 型静态数组备 注
机构类型文本型 
机构名称文本型 
状态文本型 
机构类型 = json.取通用属性 (“item.orgType”)
状态 = json.取通用属性 (“item.status”)
判断 (机构类型 = “1”)
添加数据到分类 (“正常备案”, json)
判断 (机构类型 = “2”)
添加数据到分类 (“暂停工作”, json)
判断 (机构类型 = “3”)
添加数据到分类 (“终止备案”, json)
判断 (机构类型 = “4”)
添加数据到分类 (“用人单位”, json)
判断 (机构类型 = “5”)
添加数据到分类 (“技工院校”, json)
判断 (机构类型 = “6”)
添加数据到分类 (“下级评价机构”, json)

子程序名返回值类型公开备 注
添加数据到分类  
参数名类 型参考可空数组备 注
分类名称文本型
json类_json
变量名类 型静态数组备 注
显示文本文本型 
显示文本 = 分类名称 + “ | ” + json.取通用属性 (“item.orgName”)“ | ” + json.取通用属性 (“item.validDate”)
列表框_结果.加入项目 (显示文本, )
子程序名返回值类型公开备 注
生成请求头文本型 
变量名类 型静态数组备 注
ua列表文本型0
随机索引整数型 
ua列表 = {
“Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36”,
“Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36”,
“Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:89.0) Gecko/20100101 Firefox/89.0”
}
随机索引 = 取随机数 (1, 取数组成员数 (ua列表))
返回 ua列表[随机索引]
子程序名返回值类型公开备 注
加载代理列表  
' 此处需要接入代理服务商API或读取本地代理列表
代理池 = { http://123.123.123.123:8080, http://45.67.89.10:8888 }  ' 示例代理
子程序名返回值类型公开备 注
获取随机代理文本型 
变量名类 型静态数组备 注
随机索引整数型 
随机索引 = 取随机数 (1, 取数组成员数 (代理池))
返回 代理池[随机索引]


i支持库列表   支持库注释   
internet互联网支持库
spec特殊功能支持库
EThread多线程支持库


目标接口:/api/getOrgList


必要参数:recordType=5&cityNum=110000&pageNum=1&pageSize=10



[size=14.0018px]


[size=14.0018px]


回复

使用道具 举报

结帖率:100% (5/5)

签到天数: 9 天

发表于 2025-2-7 12:55:23 | 显示全部楼层   北京市北京市
有偿看用户名,包优雅
回复

使用道具 举报

结帖率:100% (5/5)

签到天数: 9 天

发表于 2025-2-7 12:56:10 | 显示全部楼层   北京市北京市
1752328925 发表于 2025-2-7 12:55
有偿看用户名,包优雅


回复

使用道具 举报

结帖率:100% (1/1)

签到天数: 9 天

 楼主| 发表于 2025-2-7 16:06:07 | 显示全部楼层   河北省石家庄市
呓语丶 发表于 2025-2-7 14:29
用了E2EE和精易模块自己添加吧

感谢,cha询出来的都是天津的数据,还有像这样下级机构数据怎么获取?http://pjjg.osta.org.cn/detail.html?id=10099
回复

使用道具 举报

结帖率:88% (45/51)

签到天数: 17 天

发表于 2025-2-7 16:28:27 | 显示全部楼层   河北省保定市
xmtian 发表于 2025-2-7 16:06
感谢,cha询出来的都是天津的数据,还有像这样下级机构数据怎么获取?http://pjjg.osta.org.cn/detail.ht ...

获取数据.e (948.4 KB, 下载次数: 1)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表