开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 1176|回复: 2
收起左侧

[火山PC求助] 怎么判断一个txt是否为UTF8?

[复制链接]
结帖率:65% (13/20)
发表于 2023-10-15 14:39:59 | 显示全部楼层 |阅读模式   湖南省长沙市
5精币
火山PC 怎么判断一个txt是否为UTF8?


[00000000]: 61 31 32 33 E6 88 91 E6 98 AF 55 54 46 2D 38    | a123......UTF-8
a123我是UTF-8


回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 资源分享区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 帖子申请荣誉值,获得 3点 荣誉值,荣誉值可兑换终身vip用户组哦。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
结帖率:88% (7/8)

签到天数: 4 天

发表于 2023-10-15 16:20:37 | 显示全部楼层   广西壮族自治区*
#include <8 编码:

```cpp
#include <iostream>
#include <string>

bool isValidUTFiostream>
#include <vector>

bool isUTF8(const std::vector<unsigned char> &bytes) {
    int numBytes = 0;
    for (unsigned char byte : bytes)8(const std:: {
        if (numBytes == 0)string& text) {
    int i = 0 {
            if ((byte & 0x80;
    while (i <) == 0) {
                continue;  // ASCII character
            } else if ((byte & 0xE0) == 0xC0) {
                numBytes = 1;
            } else if text.size()) {
        if ((text[i] & 0x80) == 0) {
            i++;
((byte & 0       xF0) == 0xE0) {
                numBytes = 2;
            } else if ((byte & 0xF8) == 0xF0) {
                numBytes = 3;
            } else } else if {
                return false;  // Invalid ((text[i] & 0xE0) == 0xC0) {
            if ((i + 1 < text.size()) && ((text[i + 1] & 0xC0) == 0x80)) {
                i += 2;
            } else {
                return false;
            }
        } else if ((text[i] & UTF-8 sequence
            }
        } else {
            if ((byte & 0xC0) != 0 0x80) {
                return false;  // Invalid UTF-8 continuation byte
            }
            numBytes--;
        }
    }
    return numBytes == 0;
}

int main() {
    std::vectorxF0) == 0xE0) {
            if ((i + 2 < text.size()) && ((text[i + 1] &<unsigned char> bytes = {0xE4, 0xBD, A0, 0xE5, 95, 8A};  // UTF-8 encoded "你好"
    if (isUTF8(bytes)) {
        std::cout << "This is a valid UTF-8 sequence." << std::endl;
    } else {
        std::cout << "This is not a valid UTF-8 sequence." << std::endl;
    }
    return 0;
}
回复

使用道具 举报

结帖率:100% (14/14)

签到天数: 4 天

发表于 2023-11-4 17:26:26 | 显示全部楼层   山东省青岛市
取编码类型_文件     这个命令试试
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表