开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 1600|回复: 6
收起左侧

[已解决] 网页中取出并保存Unicode字符 比如 捺笔(㇏)

 关闭 [复制链接]
结帖率:100% (2/2)
发表于 2021-11-29 23:07:33 | 显示全部楼层 |阅读模式   广西壮族自治区柳州市
10精币
我想读取出这些字的笔划,但是取到的总是变?号了,通过什么方式能保存下来?我试过  精易模块中这的  网页_访问、网页_访问S、网页_访问_对象,结果都不能取到其中的捺笔(

链接:https://hanzi.xiao84.com/hz21/63159.html
在网页上直接查看源码,显示正常,但是通过访问方式取到的,都是?号



11.png

12.png


补充内容 (2021-11-29 23:28):
其实,我只是想保存下来,但是网页返回的数据中捺笔(㇏)不正常,显示的问题我也有办法解决,用易语言的标签和编辑框等都完全可以显示unicode字符.

最佳答案

查看完整内容

打脸了不是!!! [e=5].版本 2 .局部变量 szTemp, 字节集 .局部变量 xxx, 字节集 .局部变量 i, 整数型 .局部变量 len, 整数型 .局部变量 aryTemp, 字节集, , "0" szTemp = 网页_访问_对象 (“https:”+“//hanzi.xiao84.com/hz21/63159.html”, , , , , , , , , , , , , , , , , , ) len = 字节集_取中间_ 批 量 (szTemp, 编码_Ansi到Utf8 (“”), 编码_Ansi到Utf8 (“”), aryTemp, , , , , , , ) .计次循环首 (len, i) ...

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳

本帖被以下淘专辑推荐:

签到天数: 1 天

发表于 2021-11-29 23:07:34 | 显示全部楼层   广东省广州市
1638199971046.png

打脸了不是!!!

  
变量名类 型静态数组备 注
szTemp字节集 
xxx字节集 
i整数型 
len整数型 
aryTemp字节集0
szTemp = 网页_访问_对象 (“https:”“//hanzi.xiao84.com/hz21/63159.html”, , , , , , , , , , , , , , , , , , )
len = 字节集_取中间_ 批 量 (szTemp, 编码_Ansi到Utf8 (“<em>”), 编码_Ansi到Utf8 (“</em>”), aryTemp, , , , , , , )
计次循环首 (len, i)
xxx = xxx + aryTemp [ i ]
计次循环尾 ()
写到文件 (取运行目录 ()“\xxx.txt”, xxx)
子程序名返回值类型公开备 注
字节集_取中间_ 批 量 整数型 比如:欲取全文本为<12345>,现在要取出“3”,<3>的前面为“2”,<3>的后面为“4”
参数名类 型参考可空数组备 注
源文本字节集比如:欲取全文本为 12345
前面标识文本字节集3的前面为“2”
后面标识文本字节集3的后面为“4”
存放取出文本的数组字节集存放取出文本的数组
是否不区分大小写逻辑型是否区分大小写
文本长度大于此数的不要整数型文本长度大于此数的不要;如取出的文本大于50的不要;留空为不限制(下面参数中的加入的后缀不算在其中,标志文本为真那么标志算在其中)
为取出的文本加上前缀字节集在取出的文本前面加上一段字符或汉字!可空!
为取出的文本加上后缀字节集在取出的文本后面加上一段字符或汉字!可空!
连前面标识文本一起取出逻辑型是否连<前面标识文本>一起取出? 默认为假,不取出!
连后面标识文本一起取出逻辑型是否连<后面标识文本>一起取出? 默认为假,不取出!
起始位置整数型
变量名类 型静态数组备 注
数组数量整数型 
已经找到的整数型 
StartPos整数型 
EndPos整数型 
Search字节集 
中间长度整数型 
清除数组 (存放取出文本的数组)
StartPos = 起始位置
循环判断首 ()
StartPos = 寻找字节集 (源文本, 前面标识文本, StartPos)
如果 (StartPos ≠ -1)
StartPos = StartPos + 取字节集长度 (前面标识文本)
EndPos = 寻找字节集 (源文本, 后面标识文本, StartPos)
如果 (EndPos ≠ -1)
中间长度 = EndPos - StartPos
Search = 取字节集中间 (源文本, StartPos, 中间长度)
Search = 为取出的文本加上前缀 + Search + 为取出的文本加上后缀
如果真 (连前面标识文本一起取出 = )
Search = 前面标识文本 + Search
如果真 (连后面标识文本一起取出 = )
Search = Search + 后面标识文本
如果 (文本长度大于此数的不要 = 0)
加入成员 (存放取出文本的数组, Search)
如果真 (取字节集长度 (Search) < 文本长度大于此数的不要)
加入成员 (存放取出文本的数组, Search)

处理事件 ()
跳出循环 ()
处理事件 ()
跳出循环 ()
处理事件 ()
循环判断尾 (StartPos ≠ -1)
返回 (取数组成员数 (存放取出文本的数组))


评分

参与人数 1荣誉 +1 收起 理由
笨潴 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

结帖率:98% (58/59)

签到天数: 13 天

发表于 2021-11-29 23:08:30 | 显示全部楼层   福建省福州市
易语言不支持这个。你用网页来显示啊
回复

使用道具 举报

结帖率:91% (21/23)
发表于 2021-11-29 23:10:30 | 显示全部楼层   浙江省温州市
论坛好像有Unicode的支持库 安装支持库应该可以能显示  unicode是网页的默认编码   易语言本身不支持
回复

使用道具 举报

签到天数: 1 天

发表于 2021-11-29 23:13:21 | 显示全部楼层   广东省广州市

你那是转到Ansi编码了!网页返回给你的是utf8,取字节集中间保存为utf8编码的文本文件即可~
回复

使用道具 举报

结帖率:100% (2/2)

签到天数: 3 天

 楼主| 发表于 2021-11-29 23:22:54 | 显示全部楼层   广西壮族自治区柳州市
大司命 发表于 2021-11-29 23:13
你那是转到Ansi编码了!网页返回给你的是utf8,取字节集中间保存为utf8编码的文本文件即可~ ...

试过转码,不管哪种,返回的都是?号其它的Unicode码都可以直接保存到文件中,就这个 捺笔(㇏)不行.

补充一下,我不需要显示,我只要能保存到文件到可以
回复

使用道具 举报

结帖率:100% (2/2)

签到天数: 3 天

 楼主| 发表于 2021-11-30 00:01:00 | 显示全部楼层   广西壮族自治区柳州市
2345截图20211129235700.png

编辑框我有办法能让它显示这种字符,上面这种是我直接复制粘贴进去的,如果从网页直接转码就不是了,可能是我的转码代码有什么问题

算了,采纳楼上的吧.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表