开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 1104|回复: 28
收起左侧

[易源码分享] 记——我是如何把2.2MB的黑白位图压成93KB的?

[复制链接]
结帖率:88% (7/8)
发表于 2024-10-3 19:52:28 | 显示全部楼层 |阅读模式   福建省南平市
分享源码
界面截图: -
是否带模块: -
备注说明: -
前言:(相较于源码分享,本贴更倾向于一个思考过程,代码是次要,想法是主要)
(同时,这篇帖子是面向新手的,本身并没有我写的那么牛B,可以说是文胜质的经典例子,史不史我也不知道

前天,我写了一个手写数字的识别工具
众所周知,这种识别都需要大量的数据来做参照,否则识别正确率低的吓人

但问题来了,仅仅748张的,32*32的bmp图片就达到了足足2.22mb
70cb212f71e4ecc5004c9ac952960a9a.png


而想要达到理想的识别正确率,样本少说需要几万甚至几十万张
毫无疑问,这种存储方法是极为愚笨的,因为我拿能存储RGB颜色的,不限制图片大小bmp图片文件去存储大小固定为32*32的黑白照片因此,我对它做了一个小优化。

可能有人想到,只有黑白两色,那是否可以用二进制文本去储存?
不,效率太低了(而且这会显得你没有计算机理论基础(该不会只有我这样想过吧?)

众所周知,在易语言中,一个整数型(int)占用4bytes空间,即32bits,而bit作为二进制的信息单位
1bit可以对应0,1两种情况
而0,1两种情况恰好可以与黑白相对应

也就是说一张32*32的黑白图片理论上仅需32*4bytes即可储存,也就是128字节
同时,由于图片大小的固定,我不再需要bmp格式繁琐重复且占用空间的头文件信息,只需要一个配置文件记录一下各图片的张数以及它对应的数字是几就行
这才有了748张,总计2MB的图片被压缩成93KB的例子

43bf27c446d4a018685e90df83b2a901.png
  
子程序名返回值类型公开备 注
处理数据  
变量名类 型静态数组备 注
i  
i1  
Length  
Wide  
Bmp_pic字节集 
CountS整数型 
sample文本型0
数据量整数型 
Line  
Output字节集 
数据量 = 0
计次循环首 (10, i)
i1 = 文件_枚举 (取运行目录 ()“\train\”到文本 (i - 1)“\”, “*.bmp”, sample, 真, , )  ' 所有的bmp文件都被存放在这里
如果真 (数据量 < i1)
数据量 = i1  ' 写数据量是防止数组下标超出

计次循环尾 ()
写配置项 (取运行目录 ()“\config.ini”, “train”, “count”, 到文本 (数据量))
计次循环首 (10, i)
CountS = 文件_枚举 (取运行目录 ()“\train\”到文本 (i - 1)“\”, “*.bmp”, sample, 真, , )
写配置项 (取运行目录 ()“\config.ini”, “bmp”, “ncount”到文本 (i - 1), 到文本 (CountS))
计次循环首 (CountS, i1)
Bmp_pic = 读入文件 (sample [i1])
计次循环首 (32, Length)
计次循环首 (32, Wide)
如果 (Bmp_pic [3124 - Length × 96 + Wide × 3] = 0) ' 我猜你看不懂这个
Line = __set_bit_on (Line, Wide - 1)  ' 将整数中的某位修改成1
Line = __set_bit_off (Line, Wide - 1)  ' 将整数中的某位修改成0

计次循环尾 ()
Output = Output + 到字节集 (Line)
Line = 0
计次循环尾 ()
计次循环尾 ()
计次循环尾 ()
写到文件 (取运行目录 ()“\train.dat”, Output)
子程序名返回值类型公开备 注
读取数据  
变量名类 型静态数组备 注
数据量整数型 
数据逻辑型10,1,32,32
Data字节集 
p整数型 
Length整数型 
Wide整数型 
pic_pro字节集 
n整数型 
Line整数型 
Number整数型 
Ncount整数型 
N_pic整数型 
数据量 = 到整数 (读配置项 (取运行目录 ()“\config.ini”, “train”, “count”, ))
重定义数组 (数据, 假, 10, 数据量, 32, 32)
Data = 读入文件 (取运行目录 ()“\train.dat”)
p = 1
Line = 1
计次循环首 (10, Number)
Ncount = 到整数 (读配置项 (取运行目录 ()“\config.ini”, “bmp”, “ncount”到文本 (Number - 1), ))
计次循环首 (Ncount, N_pic)
pic_pro = 取字节集中间 (Data, p, 128)
Line = 1
p = p + 128
计次循环首 (32, Length)
n = 取字节集数据 (pic_pro, #整数型, Line)
计次循环首 (32, Wide)
如果 (__query_bit (n, Wide - 1))  ' 读取整数中的某位
数据 [Number] [N_pic] [Length] [Wide] = 真
数据 [Number] [N_pic] [Length] [Wide] = 假

计次循环尾 ()
计次循环尾 ()
计次循环尾 ()
计次循环尾 ()


446f0bd058ee866531ad3c2f50703f34.png

评分

参与人数 3好评 +2 精币 +5 收起 理由
光影魔术 + 1 + 1 开源精神必须支持~
kyo9766 + 1 感谢分享,很给力!~
maozaiba + 1 + 3 奉上小小红包希望笑纳

查看全部评分


本帖被以下淘专辑推荐:

结帖率:100% (1/1)

签到天数: 12 天

发表于 2024-10-9 14:06:11 | 显示全部楼层   广西壮族自治区柳州市
感谢分享
回复 支持 反对

使用道具 举报

签到天数: 20 天

发表于 2024-10-7 17:48:06 | 显示全部楼层   河北省邯郸市
6666666666666666
回复 支持 反对

使用道具 举报

结帖率:44% (4/9)

签到天数: 8 天

发表于 2024-10-6 17:33:43 | 显示全部楼层   四川省成都市
原理知道了 单通道将每个像素点的颜色由4字节表示转为位  那不是32 * 32 应该是4 * 4 = 16个字节不就好了么~
回复 支持 反对

使用道具 举报

结帖率:100% (18/18)

签到天数: 21 天

发表于 2024-10-6 17:23:48 | 显示全部楼层   广东省惠州市
你是说,没用到压缩数据()和解压数据().硬被你压下来了?
回复 支持 反对

使用道具 举报

结帖率:0% (0/1)

签到天数: 15 天

发表于 2024-10-6 10:20:14 | 显示全部楼层   广东省汕头市
感谢大神分享~!
回复 支持 反对

使用道具 举报

结帖率:25% (1/4)

签到天数: 12 天

发表于 2024-10-6 07:57:20 | 显示全部楼层   四川省泸州市
我是如何把2.2MB的黑白位图压成9
回复 支持 反对

使用道具 举报

结帖率:100% (45/45)

签到天数: 21 天

发表于 2024-10-6 07:39:36 | 显示全部楼层   山东省青岛市
感谢楼主分享!
回复 支持 反对

使用道具 举报

结帖率:97% (102/105)

签到天数: 20 天

发表于 2024-10-6 07:34:55 | 显示全部楼层   山东省青岛市
已经顶贴,感谢您对论坛的支持!
回复 支持 反对

使用道具 举报

结帖率:100% (3/3)

签到天数: 12 天

发表于 2024-10-5 14:20:45 | 显示全部楼层   山东省青岛市
得去学习一下原理,感谢分享
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表