开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 2723|回复: 7
收起左侧

[易源码分享] 分享一个 判断网页源码乱码的方法 不是很准确

[复制链接]
结帖率:0% (0/2)
发表于 2019-4-19 13:51:39 | 显示全部楼层 |阅读模式   江西省南昌市
分享源码
界面截图:
是否带模块: 调用了模块
备注说明: -
用了 精艺模块哈 自己加入

今天看到一个问题说有些网站明明写的charset=gbk取出来的还是utf-8

然后想了一个这笨办法 这个测试了一些网站还是可以的 想不到其他方法了  或者大佬有啥方法可以分享出来试试

然后这个是有BUG的,在注释处有说明哈


(出现取源码慢的问题 可以自己改网页访问或者线程啥的方式取源码)




  
子程序名返回值类型公开备 注
判断网页是不是乱码逻辑型 是乱码返回真 非取编码 是比较复杂的一个方法 有小概率判断错误 如网页有?/xxx>的文本 或者取回来是没有什么文本的网页 笑哭表情
参数名类 型参考可空数组备 注
网站文本型网站地址
返回源码文本型如果是乱码 会解码后在 传参返回源码
变量名类 型静态数组备 注
txt文本型 
TXT2文本型 
z正则表达式类 
txt = 网页_取网页源码 (网站)
TXT2 = 网页_取文本_dom (txt)
置剪辑板文本 (TXT2)
z.创建 (“\?\/.*?>”, TXT2, , , , )
如果 (z.取匹配数量 () = 0)
返回源码 = txt
返回 ()


返回源码 = 编码_utf8到gb2312 (txt)
返回 ()


点评

置剪辑版文本就不需要了 忘记去掉了 开始是放着调试   江西省南昌市  发表于 2019-4-20 08:35

结帖率:96% (50/52)

签到天数: 11 天

发表于 2019-5-31 23:30:55 | 显示全部楼层   湖南省长沙市
抢个沙发,楼主来杯茶可好?
回复 支持 反对

使用道具 举报

发表于 2019-4-23 20:01:31 | 显示全部楼层   北京市北京市
ooooooooooooooooooooooooo
回复 支持 反对

使用道具 举报

结帖率:0% (0/1)
发表于 2019-4-20 13:06:59 高大上手机用户 | 显示全部楼层   菲律宾
感谢楼主分享经验
回复 支持 反对

使用道具 举报

结帖率:55% (6/11)
发表于 2019-4-19 18:12:03 | 显示全部楼层   福建省泉州市
支持下哈辛苦了。。。。。
回复 支持 反对

使用道具 举报

结帖率:86% (43/50)
发表于 2019-4-19 17:31:29 | 显示全部楼层   河南省南阳市
感谢分享、、、、、
回复 支持 反对

使用道具 举报

结帖率:97% (151/155)

签到天数: 13 天

发表于 2019-4-19 14:14:05 | 显示全部楼层   湖北省宜昌市
前面有人问了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表