开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 3395|回复: 6
收起左侧

[已回应] 编码_是否UTF8_快速_带详细注释,汇编源格式及编码判定原理,标题要长

[复制链接]
结帖率:100% (11/11)
发表于 2018-9-3 13:30:32 | 显示全部楼层 |阅读模式   陕西省渭南市
本人还是最喜欢快速对象的.速度快.好理解好控制.
而且源码简单.方便网友自行修改.

不过带其它库是不能收录模块的.所以只能在计算机上一遍一遍调试着回忆汇编了.感觉明显年轻了很多.
一楼转换代码.二楼放例子.

  
子程序名返回值类型公开备 注
编码_是否UTF8_快速逻辑型 
参数名类 型参考可空数组备 注
参_内容字节集
变量名类 型静态数组备 注
局_返回值逻辑型 
置入代码 ({ 96, 139, 69, 8, 139, 24, 139, 67, 8, 37, 255, 255, 255, 0, 61, 191, 187, 239, 0, 116, 110, 139, 69, 8, 139, 24, 139, 75, 4, 139, 48, 131, 198, 8, 172, 136, 196, 60, 127, 118, 88, 192, 232, 6, 60, 6, 117, 19, 172, 80, 192, 232, 6, 60, 2, 117, 81, 88, 192, 232, 7, 60, 0, 116, 66, 235, 62, 136, 224, 192, 232, 4, 60, 14, 117, 18, 172, 192, 232, 6, 60, 2, 117, 54, 172, 192, 232, 6, 60, 2, 117, 46, 235, 37, 136, 224, 192, 232, 3, 60, 30, 117, 35, 172, 192, 232, 6, 60, 2, 117, 27, 172, 192, 232, 6, 60, 2, 117, 19, 172, 192, 232, 6, 60, 2, 117, 11, 235, 2, 226, 159, 184, 1, 0, 0, 0, 235, 5, 184, 0, 0, 0, 0, 137, 69, 252, 97 })
返回 (局_返回值)
' 汇编源码,使用AsmToE进行转换
' 参数 arg1    需要检测的内容参数
' 变量 local1  返回检测结果的逻辑值变量
' pushad
' mov eax,arg1
' mov ebx,[eax]
' mov eax,[ebx+8]
' and eax,0ffffffh
' cmp eax ,0efbbbfh  检查BOM,如果是直接读取文件的话,这个可能有用.
' jz addrt
' mov eax,arg1
' mov ebx,[eax]
' mov ecx,[ebx+4]
' mov esi,[eax]
' add esi,8   取参数内容的地址
' addr1:
' lodsb    读取第一个字节
' mov ah,al  临时备份读取到的字节
' cmp al,7fh
' jbe addrloop   如果小于128的字节.UTF-8和ansi编码是相同的.跳过
' addr2:
' shr al,6
' cmp al,6
' jnz addr3    如果不是UTF-8双字节,跳转下一检测
' lodsb
' push eax
' shr al,6
' cmp al,2
' jnz addrf   UTF-8判定失败.为ANSI编码
' pop eax
' shr al,7
' cmp al,0
' jz addrt    在符合UTF-8编码的情况下.ANSI检测失败.判定为UTF-8
' jmp addrloop
' addr3:
' mov al,ah
' shr al,4
' cmp al,14
' jnz addr4    如果不是UTF-8三字节,跳转一下检测
' lodsb
' shr al,6
' cmp al,2
' jnz addrf   检测UTF-8第二字节
' lodsb
' shr al,6
' cmp al,2
' jnz addrf   检测UTF-8第三字节
' jmp addrt   UTF-8三字节成立.判定为UTF-8编码
' addr4:
' mov al,ah
' shr al,3
' cmp al,30
' jnz addrf    UTF-8检测失败,判定为ANSI
' lodsb
' shr al,6
' cmp al,2
' jnz addrf   检测UTF-8第二字节
' lodsb
' shr al,6
' cmp al,2
' jnz addrf  检测UTF-8第三字节
' lodsb
' shr al,6
' cmp al,2
' jnz addrf  检测UTF-8第四字节
' jmp addrt   UTF-8四字节成立,判定UTF-8编码
' addrloop:
' loop addr1   只有在单字节和双字节成立的情况下.才需要继续对后续数据进行判断
' addrt:
' mov eax,1   返回真
' jmp addrend
' addrf:
' mov eax,0   返回假
' addrend:
' mov local1,eax  将逻辑值写到局部变量中带回
' popad
' 附编码说明及判定方法,来源于网络.非自创.
' 如果不符合utf-8的规范,认为是gb18030编码
' 如果有符合utf-8规范中的3字节或4字节编码的,认为是utf-8编码
' 如果有符合utf-8规范中的2字节编码的,但是不符合gb18030编码的,认为是utf-8编码
' 如果全部都是符合2字节的utf-8编码,同时也符合gb18030编码的,认为是gb18030编码
' Unicode符号范围        |   UTF-8编码方式
' (十六进制)                 |   (二进制)
' ------------------------------+--------------------------------------------------------------
' 0000 0000-0000 007F | 0xxxxxxx
' 0000 0080-0000 07FF | 110xxxxx 10xxxxxx
' 0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx
' 0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
' ---------------------------------------------------------------------------------------------


评分

参与人数 1好评 +1 精币 +1 收起 理由
项目部002 + 1 + 1 支持开源~!感谢分享

查看全部评分

签到天数: 3 天

发表于 2024-3-8 02:24:11 | 显示全部楼层   湖南省湘西土家族苗族自治州
感谢分享,好用,不带BOM也能正确判别,点赞
回复 支持 反对

使用道具 举报

结帖率:100% (1/1)
发表于 2024-1-10 00:32:37 | 显示全部楼层   湖南省湘潭市
找了很多例子,只有这一个可以用,非常感谢
回复 支持 反对

使用道具 举报

发表于 2018-11-20 16:28:25 | 显示全部楼层   广东省阳江市
只有一个usb转串口
回复 支持 反对

使用道具 举报

结帖率:100% (11/11)

签到天数: 26 天

 楼主| 发表于 2018-9-3 14:00:29 | 显示全部楼层   陕西省渭南市
没办法.就象Windows和QQ总是在发布后立即发布补丁一样.
又来补丁了.

loop addr1


addrf:
mov eax,0
jmp addrend
addrt:
mov eax,1
addrend:
mov local1,eax

修改了一处逻辑错误

  
置入代码 ({ 96, 139, 69, 8, 139, 24, 139, 67, 8, 37, 255, 255, 255, 0, 61, 191, 187, 239, 0, 116, 117, 139, 69, 8, 139, 24, 139, 75, 4, 139, 48, 131, 198, 8, 172, 136, 196, 60, 127, 118, 88, 192, 232, 6, 60, 6, 117, 19, 172, 80, 192, 232, 6, 60, 2, 117, 74, 88, 192, 232, 7, 60, 0, 116, 73, 235, 62, 136, 224, 192, 232, 4, 60, 14, 117, 18, 172, 192, 232, 6, 60, 2, 117, 47, 172, 192, 232, 6, 60, 2, 117, 39, 235, 44, 136, 224, 192, 232, 3, 60, 30, 117, 28, 172, 192, 232, 6, 60, 2, 117, 20, 172, 192, 232, 6, 60, 2, 117, 12, 172, 192, 232, 6, 60, 2, 117, 4, 235, 9, 226, 159, 184, 0, 0, 0, 0, 235, 5, 184, 1, 0, 0, 0, 137, 69, 252, 97 })

回复 支持 反对

使用道具 举报

结帖率:100% (11/11)

签到天数: 26 天

 楼主| 发表于 2018-9-3 13:31:38 | 显示全部楼层   陕西省渭南市
附个自己的测试例子.

  
变量名类 型静态数组备 注
文本1文本型 
计数器整数型 
置随机数种子 ()
计次循环首 (1000000, 计数器)
文本1 = 文本_取随机汉字 (汇编_取随机数 (1, 20), )
如果 (汇编_取随机数 (1, 2) = 1)
如果真 (编码_是否UTF8_快速 (到字节集 (编码_gb2312到utf8 (文本1))))
调试输出 (“出现错误”)
跳出循环 ()

如果真 (编码_是否UTF8_快速 (到字节集 (文本1)))
调试输出 (“出现错误”)
跳出循环 ()

处理事件 ()
如果真 (计数器 % 1000 = 0)
调试输出 (计数器)

计次循环尾 ()


i支持库列表   支持库注释   
spec特殊功能支持库

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表