开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 2411|回复: 8
收起左侧

[易源码分享] 编码_是否UTF8判断功能_请测试哈

[复制链接]
结帖率:100% (11/11)
发表于 2018-9-2 11:19:23 | 显示全部楼层 |阅读模式   陕西省渭南市
分享源码
界面截图: -
是否带模块: 调用了模块
备注说明: -
根据百度众多网友的智慧.写了个判定的代码.看看有没有实用价值.
如果没问题了再修改成最终版本.

目前的速度还行.只是用了快速对象而已.

  
子程序名返回值类型公开备 注
编码_是否UTF8逻辑型 检测文本是否为UTF-8编码
参数名类 型参考可空数组备 注
参_文本文本型
变量名类 型静态数组备 注
局_内容快速字节集对象 
局_数值1字节型 
局_数值2字节型 
局_数值3字节型 
局_数值4字节型 
局_计数器整数型 
局_偏移整数型 
局_内容.置字节集 (参_文本)
局_偏移 = 1
计次循环首 (局_内容.取长度 (), 局_计数器)
如果真 (局_内容.取长度 () < 局_偏移)
返回 ()
如果真 (右移 (局_内容.取字节 (局_偏移), 7) = 0)
局_偏移 = 局_偏移 + 1
到循环尾 ()

如果真 (右移 (局_内容.取字节 (局_偏移), 5) = 6)
如果真 (局_内容.取长度 () < 局_偏移 + 1)
返回 (检测GB2312 (局_内容.取字节集 (, )))
如果真 (右移 (局_内容.取字节 (局_偏移 + 1), 6) ≠ 2)
返回 ()

如果真 (右移 (局_内容.取字节 (局_偏移), 7) = 0)
如果真 (右移 (局_内容.取字节 (局_偏移 + 1), 7) = 0)
返回 ()

局_偏移 = 局_偏移 + 2

如果真 (右移 (局_内容.取字节 (局_偏移), 4) = 14)
如果真 (局_内容.取长度 () < 局_偏移 + 2)
返回 ()
如果真 (右移 (局_内容.取字节 (局_偏移 + 1), 6) ≠ 2)
返回 ()
如果真 (右移 (局_内容.取字节 (局_偏移 + 2), 6) ≠ 2)
返回 ()
返回 ()

如果真 (右移 (局_内容.取字节 (局_偏移), 4) = 14)
如果真 (局_内容.取长度 () < 局_偏移 + 3)
返回 ()
如果真 (右移 (局_内容.取字节 (局_偏移 + 1), 6) ≠ 2)
返回 ()
如果真 (右移 (局_内容.取字节 (局_偏移 + 2), 6) ≠ 2)
返回 ()
如果真 (右移 (局_内容.取字节 (局_偏移 + 3), 6) ≠ 2)
返回 ()
返回 ()

计次循环尾 ()
返回 ()
子程序名返回值类型公开备 注
检测GB2312逻辑型 
参数名类 型参考可空数组备 注
参_文本字节集
变量名类 型静态数组备 注
局_偏移整数型 
局_计数器整数型 
局_内容快速字节集对象 
局_偏移 = 1
局_内容.置字节集 (参_文本)
计次循环首 (局_内容.取长度 (), 局_计数器)
如果真 (局_偏移 + 1 > 局_内容.取长度 ())
返回 ()
如果真 (右移 (局_内容.取字节 (局_偏移), 7) = 0)
局_偏移 = 局_偏移 + 1
到循环尾 ()

如果真 (右移 (局_内容.取字节 (局_偏移 + 1), 7) = 0)
返回 ()
局_偏移 = 局_偏移 + 2
计次循环尾 ()
返回 ()


i支持库列表   支持库注释   
commobj通用对象支持库

点评

完整版在8楼 汇编快速版在此 https://bbs.125.la/forum.php?mod=viewthread&tid=14227507&extra=   陕西省渭南市  发表于 2018-9-4 12:00

结帖率:100% (11/11)

签到天数: 20 天

 楼主| 发表于 2018-9-2 22:59:41 | 显示全部楼层   陕西省渭南市
加入文件头检测.方便批量读入文件时使用.
尽量优化.快速对象一版基本定型.如果有下一版的话.看有没有可能产生个汇编的.
易语言的字节处理好象很难办啊.

  
子程序名返回值类型公开备 注
编码_是否UTF8逻辑型 检测文本是否为UTF-8编码
参数名类 型参考可空数组备 注
参_文本文本型文本参数
参_字节集字节集字节集参数
变量名类 型静态数组备 注
局_内容快速字节集对象 
局_计数器整数型 
局_长度整数型 
局_偏移整数型 
数值1字节型 
数值2字节型 
如果 (是否为空 (参_字节集))
局_内容.置字节集 (参_文本)
局_内容.置字节集 (参_字节集)

如果真 (局_内容.取字节 (1) = 239)
如果真 (局_内容.取字节 (2) = 187)
如果真 (局_内容.取字节 (3) = 191)
返回 ()


局_偏移 = 1
局_长度 = 局_内容.取长度 ()
计次循环首 (局_长度, 局_计数器)
如果真 (局_长度 < 局_偏移 + 1)
返回 ()
数值1 = 局_内容.取字节 (局_偏移)
数值2 = 局_内容.取字节 (局_偏移 + 1)
判断 (数值1 < 128)
' 单字节
局_偏移 = 局_偏移 + 1
判断 (右移 (数值1, 5) = 6)
' 双字节
如果真 (局_长度 < 局_偏移 + 1)
返回 ()
如果真 (右移 (数值2, 6) ≠ 2)
返回 ()
如果真 (右移 (数值2, 7) = 0)
返回 ()
局_偏移 = 局_偏移 + 2
判断 (右移 (数值1, 4) = 14)
' 三字节
如果真 (局_长度 < 局_偏移 + 2)
返回 ()
如果真 (右移 (数值2, 6) ≠ 2)
返回 ()
如果真 (右移 (局_内容.取字节 (局_偏移 + 2), 6) ≠ 2)
返回 ()
返回 ()
判断 (右移 (数值1, 3) = 30)
' 四字节
如果真 (局_长度 < 局_偏移 + 3)
返回 ()
如果真 (右移 (数值2, 6) ≠ 2)
返回 ()
如果真 (右移 (局_内容.取字节 (局_偏移 + 2), 6) ≠ 2)
返回 ()
如果真 (右移 (局_内容.取字节 (局_偏移 + 3), 6) ≠ 2)
返回 ()
返回 ()
返回 ()

计次循环尾 ()
返回 ()


i支持库列表   支持库注释   
commobj通用对象支持库

回复 支持 反对

使用道具 举报

结帖率:96% (24/25)

签到天数: 9 天

发表于 2024-1-2 15:38:43 | 显示全部楼层   广东省广州市
实测不准.
回复 支持 反对

使用道具 举报

结帖率:100% (3/3)
发表于 2018-10-10 11:51:43 | 显示全部楼层   浙江省杭州市
楼主辛苦了,谢谢
回复 支持 反对

使用道具 举报

结帖率:100% (11/11)

签到天数: 20 天

 楼主| 发表于 2018-9-2 18:12:58 | 显示全部楼层   陕西省渭南市
梦汐 发表于 2018-9-2 17:20
精易助手随便打的几个字然后编码的。。。你可以用精易助手编码然后测试

这个转换时有一些字符不能显示已经损失掉了.
可以在程序里用命令转换看看.
回复 支持 反对

使用道具 举报

结帖率:100% (7/7)
发表于 2018-9-2 17:20:15 | 显示全部楼层   广东省佛山市
jr21066 发表于 2018-9-2 15:38
方便上传一下文本吗?

精易助手随便打的几个字然后编码的。。。你可以用精易助手编码然后测试
回复 支持 反对

使用道具 举报

结帖率:100% (11/11)

签到天数: 20 天

 楼主| 发表于 2018-9-2 15:38:34 | 显示全部楼层   陕西省渭南市
梦汐 发表于 2018-9-2 14:37
UF8全部返还假。。。。

方便上传一下文本吗?


回复 支持 反对

使用道具 举报

结帖率:100% (11/11)

签到天数: 20 天

 楼主| 发表于 2018-9-2 15:37:55 | 显示全部楼层   陕西省渭南市
梦汐 发表于 2018-9-2 14:37
UF8全部返还假。。。。

方便上传一下文本吗?

因为只是一个简单的判断.所以文件头都没有判断.
因为有文件头了再来判断感觉是不是很那个啥.

这是我的测试.

  
变量名类 型静态数组备 注
内容文本型 
文本1文本型 
文本2文本型 
置随机数种子 ()
计次循环首 (10000, )
内容 = 文本_取随机字符 (1)文本_取随机汉字 (2, )
文本1 = 内容
文本2 = 编码_gb2312到utf8 (内容)
调试输出 (文本1, 编码_是否UTF8 (文本1), 编码_是否UTF8 (文本2))
处理事件 ()
计次循环尾 ()


i支持库列表   支持库注释   
spec特殊功能支持库

回复 支持 反对

使用道具 举报

结帖率:100% (11/11)

签到天数: 20 天

 楼主| 发表于 2018-9-2 15:37:24 | 显示全部楼层   陕西省渭南市
梦汐 发表于 2018-9-2 14:37
UF8全部返还假。。。。

方便上传一下文本吗?

因为只是一个简单的判断.所以文件头都没有判断.
因为有文件头了再来判断感觉是不是很那个啥.

这是我的测试.

  
变量名类 型静态数组备 注
内容文本型 
文本1文本型 
文本2文本型 
置随机数种子 ()
计次循环首 (10000, )
内容 = 文本_取随机字符 (1)文本_取随机汉字 (2, )
文本1 = 内容
文本2 = 编码_gb2312到utf8 (内容)
调试输出 (文本1, 编码_是否UTF8 (文本1), 编码_是否UTF8 (文本2))
处理事件 ()
计次循环尾 ()


i支持库列表   支持库注释   
spec特殊功能支持库

回复 支持 反对

使用道具 举报

结帖率:100% (7/7)
发表于 2018-9-2 14:37:26 | 显示全部楼层   广东省佛山市
UF8全部返还假。。。。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表