开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 1158|回复: 12
收起左侧

[已解决] 请教:如何过滤清除文本中的多种空格和乱码

 关闭 [复制链接]
结帖率:94% (80/85)
发表于 2021-10-24 13:01:59 | 显示全部楼层 |阅读模式   重庆市重庆市
9精币
文本例子="龀そ锥巍?"

mysql UTF8 报错="\xDF\xA3\xA0\xA3 \xB4\xD3"

空格编码出来如下
URL编码(GBK):"%AA%A5"  "%AA%A4"  “%AA%B2”  “%A3%A0”

遇到这种文本应该如何过滤删除?

最佳答案

查看完整内容

中文的ASCII码值的范围是是0~127.当操作系统采用非ASCII编码时(比如汉字编码),一般用扩展ASCII码来进行,约定用128~255范围的编码连续2~3甚至4个来进行汉字编码,(比如国标用连续两个128~255的编码表示1个汉字,分别是区码和位码的编码;UTF-8可以用3个连续的数来表示一个汉字),具体编码规则要看具体定义,一般不相同的。因此,在处理字符串时,如果是有符号字符串,遇到小于0的字符,会结合后面紧跟的字符来组成一个汉字, ...

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
结帖率:100% (5/5)
发表于 2021-10-24 13:02:00 | 显示全部楼层   湖南省长沙市
中文的ASCII码值的范围是是0~127.当操作系统采用非ASCII编码时(比如汉字编码),一般用扩展ASCII码来进行,约定用128~255范围的编码连续2~3甚至4个来进行汉字编码,(比如国标用连续两个128~255的编码表示1个汉字,分别是区码和位码的编码;UTF-8可以用3个连续的数来表示一个汉字),具体编码规则要看具体定义,一般不相同的。因此,在处理字符串时,如果是有符号字符串,遇到小于0的字符,会结合后面紧跟的字符来组成一个汉字,大于0的为标准西文字符;如果是无符号的,则可以判断是否大于127。

评分

参与人数 1荣誉 +1 收起 理由
笨潴 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

结帖率:100% (5/5)
发表于 2021-10-24 13:07:02 | 显示全部楼层   湖南省长沙市
转一下ansi。然后正则取一下
回复

使用道具 举报

结帖率:94% (80/85)

签到天数: 25 天

 楼主| 发表于 2021-10-24 13:08:14 | 显示全部楼层   重庆市重庆市
zuoshoudidi 发表于 2021-10-24 13:07
转一下ansi。然后正则取一下

求例程,谢谢。
回复

使用道具 举报

结帖率:94% (80/85)

签到天数: 25 天

 楼主| 发表于 2021-10-24 13:19:04 | 显示全部楼层   重庆市重庆市
遥行∑笠祷固峁┝?
回复

使用道具 举报

结帖率:0% (0/1)
发表于 2021-10-24 13:54:14 | 显示全部楼层   河北省邢台市
我记得易模块里面有个文本区分_只取汉字()和文本_取文本中汉字(),你试试~
回复

使用道具 举报

签到天数: 27 天

发表于 2021-10-24 13:57:06 | 显示全部楼层   河北省石家庄市
你这是取错文本了吧,要不然你就知道到底有多少个符号,好拿来替换,你这个不是空格,而是不可见文字
回复

使用道具 举报

结帖率:94% (80/85)

签到天数: 25 天

 楼主| 发表于 2021-10-24 14:45:37 | 显示全部楼层   重庆市重庆市
番茄吧 发表于 2021-10-24 13:57
你这是取错文本了吧,要不然你就知道到底有多少个符号,好拿来替换,你这个不是空格,而是不可见文字 ...

嗯。文本中,有不可见字符串,和乱码。。。
回复

使用道具 举报

签到天数: 27 天

发表于 2021-10-24 16:05:57 | 显示全部楼层   河北省石家庄市
那你就要做总结了,都把这些非法字符抓出来,一个个的给他替换掉,最好在字节集里替换,再或者就用正则吧,取 大小写英文,数字,还有中文就行了
回复

使用道具 举报

结帖率:93% (80/86)

签到天数: 26 天

发表于 2021-10-24 16:09:06 | 显示全部楼层   天津市天津市
源码贴出来
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表