开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 227|回复: 11
打印 上一主题 下一主题
收起左侧

[已解决] 取文本的个数,求算法

 关闭 [复制链接]
结帖率:90% (66/73)
跳转到指定楼层
楼主
发表于 昨天 10:07 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式   山东省青岛市
13精币
751562----【时快乐】工贸公的的的司喹禾灵27652
取出上边一段文本的个数,一个文字算一个,一个数字算一个,一个符号算一个
上方文本个数是30


最佳答案

查看完整内容

.版本 2 .支持库 spec 文本 = “751562----【时快乐】工贸公的的的司喹禾灵27652” 调试输出 (文本_取长度ex (文本))

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
结帖率:88% (7/8)

签到天数: 16 天

沙发
发表于 昨天 10:07 | 只看该作者   浙江省宁波市
.版本 2
.支持库 spec

文本 = “751562----【时快乐】工贸公的的的司喹禾灵27652”
调试输出 (文本_取长度ex (文本))
回复

使用道具 举报

结帖率:100% (18/18)

签到天数: 19 天

板凳
发表于 昨天 10:23 | 只看该作者   广东省深圳市
  
变量名类 型静态数组备 注
源文本文本型 
结果个数整数型 
源文本 = “751562----【时快乐】工贸公的的的司喹禾灵27652”
结果个数 = 取文本长度 (到全角 (源文本)) ÷ 2
调试输出 (结果个数)


i支持库列表   支持库注释   
spec特殊功能支持库

回复

使用道具 举报

结帖率:54% (7/13)

签到天数: 18 天

地板
发表于 昨天 11:35 | 只看该作者   浙江省嘉兴市
  
子程序名返回值类型公开备 注
计算字符数整数型 
参数名类 型参考可空数组备 注
文本内容文本型
变量名类 型静态数组备 注
全角文本文本型 
全角长度整数型 
全角文本 = 到全角 (文本内容)
全角长度 = 取文本长度 (全角文本)
返回 (四舍五入 (全角长度 ÷ 2, 0))

这就是个完整的算法
回复

使用道具 举报

结帖率:100% (24/24)

签到天数: 20 天

地下
发表于 昨天 12:49 | 只看该作者   广东省惠州市
#include <stdio.h>
#include <stddef.h>
//取多字节字符文本长度
size_t count_characters(const char *str) {
        if (str == NULL || *str == '\0') return 0;

        size_t count = 0;

        while (*str) {
                // 检查是否中文字符(ANSI 双字节字符)
                if ((unsigned char)*str >= 0x80) {
                        count++; // 中文字符计为1
                        str += 2; // 跳过两个字节
                } else {
                        count++; // ASCII字符计数
                        str++;
                }
        }

        return count;
}

回复

使用道具 举报

结帖率:100% (24/24)

签到天数: 20 天

6
发表于 昨天 12:53 | 只看该作者   广东省惠州市

回复

使用道具 举报

结帖率:60% (3/5)

签到天数: 20 天

7
发表于 昨天 14:01 | 只看该作者   广西壮族自治区柳州市

回复

使用道具 举报

结帖率:100% (3/3)

签到天数: 17 天

8
发表于 昨天 14:22 | 只看该作者   江苏省苏州市
正则匹配下?
回复

使用道具 举报

结帖率:100% (1/1)
9
发表于 昨天 14:53 | 只看该作者   浙江省温州市
转成UTF32,每个编码都是4字节,除以4就是编码个数,一般也能正确表示“字符”个数:
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
子程序名返回值类型公开备 注
__启动窗口_创建完毕  
变量名类 型静态数组备 注
文本文本型 
结果字节集 
数量整数型 
文本 = “751562----【时快乐】工贸公的的的司喹禾灵27652”
结果 = 编码转换 (到字节集 (文本), #编码_GB18030, #编码_UTF_32LE, )
数量 = 取字节集长度 (结果) ÷ 4
调试输出 (数量)


i支持库列表   支持库注释   
iconv编码转换支持库
spec特殊功能支持库

不选择转成UTF16,因为在UTF16涉及BMP(基本多文种平面),有些编码是2字节而另一些是4字节,处理起来没UTF32简单。

另外,那种广为流传的,要么除以2要么加1的统计方法也是错误的。
它基于这一个猜想,即世界上所有的文字编码总数不会超过6万个(如早期的Unicode),而事实上,现行国家强制性规定的汉字就有8万多个。

总的来说,对比其它方案,转成UTF32除以4,是一种相对合理又简单的统计方式。


回复

使用道具 举报

结帖率:100% (19/19)

签到天数: 3 天

10
发表于 昨天 14:55 | 只看该作者   广东省佛山市
调试输出 (文本_逐字分割 (“751562----【时快乐】工贸公的的的司喹禾灵27652”))
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表