开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 1311|回复: 17
收起左侧

[已解决] 网页取源码,编码问题。

 关闭 [复制链接]
结帖率:97% (32/33)
发表于 2022-4-8 23:17:03 | 显示全部楼层 |阅读模式   广西壮族自治区南宁市
5精币
我的代码是    返回内容 = 编码_Utf8到Ansi (网页_访问 (“http://xyq.163.com/2019/xinfu/”, , , , , , , , , , , , , ))   然后,调试输出 (返回内容),置剪辑板文本 (返回内容)
调试输出显示正常的文字,如下图:
01.png

但是,置剪辑板文本 (返回内容)  之后,我打开记事本,粘贴到记事本缺显示乱码,如下图:
02.png

还有,置剪辑板文本 (返回内容)  之后,分别放在精易编程助手里的正则和编码转换界面,显示的也不一样,如下图:
04.png 03.png

请问这个是怎么回事,而且我访问的网址是:http://xyq.163.com/2022/xinfu/  在易语言里用正则可以取出开服名字和时间,但是把年份换成2019的话,即:http://xyq.163.com/2022/xinfu/  这样又取不出,我调试输出看过了,内容差不多和2022的一样,正则也没变化,但是就是取不出,正则取的匹配数量变成了0,不知道怎么回事,请大佬帮帮忙解答这些问题,万分感谢!




补充内容 (2022-4-8 23:19):
写错了,访问的是:http://xyq.163.com/2022/xinfu/  而不是2019,后面访问的2019正则取匹配数量是0,我检查过正则规则没有错误,应该是编码问题

补充内容 (2022-4-8 23:31):
我把调试输出的正常显示的内容 手动复制到记事本,也是乱码

补充内容 (2022-4-8 23:40):
我用 置剪辑板文本 (返回内容) 之后,直接粘贴到记事本是乱码,但是把调试输出的显示正常内容复制到记事本却是正常的

补充内容 (2022-4-8 23:47):
正则表达式如下,网页中2022换成2019匹配数量是0:
<div class="t posr">
                  <h2>(.*)</h2>
                  <p>(.*)</p>
                  <s></s>
                </div>

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳

签到天数: 11 天

发表于 2022-4-8 23:17:04 | 显示全部楼层   广东省广州市
忘情不是洒脱 发表于 2022-4-9 00:03
你的方法是可以,但仅限于记事本,我是想把网页中2022换成2019或其他年份,但只有2022的取正则匹配数量大 ...

[JavaScript] 纯文本查看 复制代码
<div class="t posr">\s+<h2>(.*)</h2>\s+<p>(.*)</p>\s+<s></s>\s+</div>

评分

参与人数 1荣誉 +1 收起 理由
项目部004 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

结帖率:98% (54/55)

签到天数: 12 天

发表于 2022-4-8 23:22:22 | 显示全部楼层   福建省福州市
手动复制黏贴如何呢
回复

使用道具 举报

结帖率:100% (21/21)

签到天数: 11 天

发表于 2022-4-8 23:24:42 高大上手机用户 | 显示全部楼层   江西省赣州市
修改成 返回内容=编码utf8到gb23(到文本(网页_访问_对象(“www.xxxx.com”)))试试
回复

使用道具 举报

结帖率:100% (10/10)
发表于 2022-4-8 23:24:57 | 显示全部楼层   广东省佛山市
bug了吧,我这都可以呀
QQ截图20220408232358.png
回复

使用道具 举报

结帖率:60% (6/10)

签到天数: 3 天

发表于 2022-4-8 23:25:10 | 显示全部楼层   浙江省湖州市
.版本 2

.子程序 功能_网页访问, 文本型, , 本命令由【精易网页调试助手】生成,请配合精易模块使用。
.局部变量  局_网址, 文本型
.局部变量  局_方式, 整数型
.局部变量  ADD_协议头, 类_POST数据类
.局部变量  局_提交协议头, 文本型
.局部变量  局_合并更新cookie, 逻辑型
.局部变量  局_结果, 字节集
.局部变量  局_返回, 文本型
' http://xyq.163.com/2022/xinfu/
局_网址 = "http://xyq.163.com/2022/xinfu/"
局_方式 = 1
ADD_协议头.添加 ("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.87 Safari/537.36")

局_提交协议头 = ADD_协议头.获取协议头数据 ()
局_合并更新cookie = 真

局_结果 = 网页_访问 (局_网址, 局_方式, , , , 局_提交协议头, , , , , 局_合并更新cookie)
局_返回 = 到文本(编码_编码转换对象(局_结果))
返回(局_返回)
回复

使用道具 举报

签到天数: 11 天

发表于 2022-4-8 23:26:44 | 显示全部楼层   广东省广州市

一听我就猜是Win10~
回复

使用道具 举报

结帖率:97% (32/33)
 楼主| 发表于 2022-4-8 23:27:39 | 显示全部楼层   广西壮族自治区南宁市
大司命 发表于 2022-4-8 23:26
一听我就猜是Win10~

我的是WIN10  这个系统还有关系啊?

点评

你系统的文本文件保存的编码默认是utf8吧~   广东省广州市   发表于 2022-4-8 23:29
回复

使用道具 举报

结帖率:97% (32/33)
 楼主| 发表于 2022-4-8 23:29:51 | 显示全部楼层   广西壮族自治区南宁市
迷糊的弟弟 发表于 2022-4-8 23:24
修改成 返回内容=编码utf8到gb23(到文本(网页_访问_对象(“www.xxxx.com”)))试试 ...

还是不行
回复

使用道具 举报

结帖率:97% (32/33)
 楼主| 发表于 2022-4-8 23:31:02 | 显示全部楼层   广西壮族自治区南宁市
nikezhi 发表于 2022-4-8 23:22
手动复制黏贴如何呢

我把调试输出的正常显示的内容手动复制到记事本,也是乱码
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表