开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 2169|回复: 16
收起左侧

[已解决] 如何自动检测一个文件的编码是utf8还是utf8-无BOM还是ansi?

 关闭 [复制链接]
结帖率:100% (32/32)
发表于 2017-7-22 21:38:53 | 显示全部楼层 |阅读模式   香港特别行政区*
77精币
如何自动检测一个文件的编码是utf8还是utf8-无BOM还是ansi?
只检测这3中编码就行,找不到思路.

最佳答案

查看完整内容

notepad++也是闷的,没头的就看做是ansi

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
结帖率:58% (7/12)
发表于 2017-7-22 21:38:54 | 显示全部楼层   山西省吕梁市
決不放棄 发表于 2017-7-23 17:21
notepad++是怎么判断的?

notepad++也是闷的,没头的就看做是ansi

评分

参与人数 1荣誉 +1 收起 理由
笨潴 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

结帖率:100% (12/12)

签到天数: 3 天

发表于 2017-7-22 21:40:42 | 显示全部楼层   天津市天津市
那就先用这3种解码
然后判断
回复

使用道具 举报

签到天数: 6 天

发表于 2017-7-22 21:44:04 | 显示全部楼层   河南省新乡市
要是网页的话 他会返回协yi头 告诉浏览器是什么编码  浏览器就会自动解码         
回复

使用道具 举报

结帖率:100% (6/6)
发表于 2017-7-22 21:44:49 | 显示全部楼层   安徽省合肥市
先用三种都解码,
数据保存下来,
在,寻找文本在里面多匹配一些
文字或者数字不久可以了吗
解码错误不都是乱码的
就找不出来文字的
e就是不知到这么麻烦  ,会不会占用太多资源
回复

使用道具 举报

头像被屏蔽
结帖率:86% (99/115)
发表于 2017-7-22 21:49:38 | 显示全部楼层   湖南省邵阳市
把数据先到字节集,然后取字节集前面三个,再到文本,有特证码的,比如UTF-8的是\xEF\xBB\xBF
回复

使用道具 举报

结帖率:58% (7/12)
发表于 2017-7-22 22:24:46 | 显示全部楼层   山西省吕梁市
ANSI                {49,50,51,49,50,51,49,50,51,49,50,51,13,10,196,227,186,195,196,227,186,195,196,227,186,195}
UTF-8无bom        {49,50,51,49,50,51,49,50,51,49,50,51,13,10,228,189,160,229,165,189,228,189,160,229,165,189,228,189,160,229,165,189}
UTF-8                {239,187,191,49,50,51,49,50,51,49,50,51,49,50,51,13,10,228,189,160,229,165,189,228,189,160,229,165,189,228,189,160,229,165,189}
原文                123123123你好你好你好

从上面对比得出utf-8 与utf-8的区别只有开头的{239,187,191}.  ANSI与utf-8数字是没有区别的  但中文就不一样了 ansi中{196,227}就代表一个汉字  而utf-8中{228,189,160}代表一个汉字
回复

使用道具 举报

结帖率:100% (32/32)

签到天数: 18 天

 楼主| 发表于 2017-7-22 22:35:25 高大上手机用户 | 显示全部楼层   广东省佛山市
蘇中二少 发表于 2017-7-22 21:40
那就先用这3种解码
然后判断

如何判断?文件内容是完全不确定的
回复

使用道具 举报

结帖率:100% (32/32)

签到天数: 18 天

 楼主| 发表于 2017-7-22 22:36:26 高大上手机用户 | 显示全部楼层   广东省佛山市
小牛大大 发表于 2017-7-22 22:24
ANSI                {49,50,51,49,50,51,49,50,51,49,50,51,13,10,196,227,186,195,196,227,186,195,196,227,186,195}
U ...

那在文件内容完全不确定的情况下,怎么判断是ANSI还是utf8无bom?
回复

使用道具 举报

结帖率:100% (32/32)

签到天数: 18 天

 楼主| 发表于 2017-7-22 22:37:20 高大上手机用户 | 显示全部楼层   广东省佛山市
he953820195 发表于 2017-7-22 21:44
先用三种都解码,
数据保存下来,
在,寻找文本在里面多匹配一些

文件内容是完全不确定的
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表