开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 27909|回复: 48
收起左侧

[CC教程] 第三课,训练一个验证码

[复制链接]
发表于 2017-6-28 16:25:55 | 显示全部楼层 |阅读模式   江苏省苏州市


视频下载及ppt下载:https://share.weiyun.com/26f28387d2cea9461d0f5e2fd8ff87ab
大纲总览
深度学习下的验证码识别教程 点我查看

1.实际操作训练验证码

由于这次发布,训练默认使用的网络是LeNet,而LeNet虽然识别时间很短,但是效果有限只能对付简单的验证码。所以建议大家采用NIN来训练,NIN基本可以应付绝大部分验证码,NIN的训练一定要记住,需要用nin的imagenet数据集模型来微调

NIN微调网络下载:http://www,zifuture,com/fs/6,models/nin_imagenet,caffemodel
训练好的网络:http://www,zifuture,com/fs/6,models/lenet_iter_5000,caffemodel
训练中的log日志:http://www,zifuture,com/fs/6,models/train,log log中可以看到网络构建的详细信息
网络可视化工具:http://www,zifuture,com/caffenet/Netscope,html#/editor

超参数的意义
net:"train_val.prototxt"            指定网络文件路径
test_iter:4  指定测试时需要迭代多少次
test_interval:300  指定训练迭代多少次执行一次测试
test_initialization:false  指定初始化完毕后不要测试
display:40  指定每40次迭代输出一次信息
average_loss:40  指定40次loss求平均
base_lr:0.001  指定基础学习率为0.001
lr_policy:"step"  指定学习率策略是step
stepsize:320000  指定学习率的步距是320000
gamma:0.96  指定学习率γ系数0.96
max_iter:10000000  指定最大迭代次数1000万次
momentum:0.9  指定阻力系数0.96
weight_decay:0.0002  指定权重衰减项
snapshot:40000  指定多少次保存一次快照
snapshot_prefix:"models/googlenet"  指定快照保存的路径前缀
solver_mode:GPU  指定训练的方式

batch_size分为train的和val的batch_size,即指train_lmdb数据集上,和val_lmdb数据集上对于迭代次数的设置,记得要让迭代次数跑完全部的训练图片,即至少一个epochs(一个完整的训练图片迭代)。1epochs = 在数据集上迭代完全部样本需要的次数,如果数据集有100个图,batch_size是5,则1epochs = 100 / 5 = 20,意味着1个epochs是20次迭代。

所以:
max_iter:一般设置为30个epochs(指train_lmdb),可以大致估算就行,不一定要准确计算
test_iter:设置为1epochs,即test的batch_size*test_iter= val_lmdb的样本总数
test_interval:设置为1个epochs(这里是train_lmdb)

2.一些比较关心的事情
做到这一步,大家会比较关心以下问题:
1.动态位数验证码可以识别吗?         可以
2.怎么做到更多位的识别?                只需要简单的修改即可
3.怎么调用他完成识别任务?             cc提供有案例,我们可以实际操作一下
4.汉字或者复杂的验证码怎么做好?   可以用resnet系列,比如resnet50能做到很好效果
5.比如坐标类的复杂验证码如何识别   这个后续课程会讲到

3.一些异常的处理
caffe的异常常常是以程序崩溃来表现出来,因此很多操作容易导致程序直接崩溃,这不是bug,而是发生比如参数或者哪里错误,他这里的崩溃其实是断言错误而提示出来的,这时候你得看黑色屏幕里面提示的信息来debug
图片1.png


部署时正确的错误检查方法,是使用CC3.0-alpha.4目录下的debug.e(如果是其他语言,也一样在控制台界面中执行)的形式,在控制台程序中,运行模型和识别程序,此时,如果有异常会在黑窗口提示出来。确定没问题再集成到软件中.
图片2.png



点评

深度学习交流群:560950706,群号是这个   江苏省苏州市  发表于 2017-7-20 00:10
希望楼主能建个QQ交流群   河北省唐山市  发表于 2017-7-20 00:03
在线视频处理中随后跟新请大家持续关注   广东省深圳市  发表于 2017-6-28 16:33

评分

参与人数 5好评 +5 精币 +38 收起 理由
う网淅乄 + 1 + 4 感谢分享,很给力!~
leiyh + 1 + 3 感谢分享,很给力!~
hellohexiang + 1 + 3 感谢分享,很给力!~
Cand + 1 + 20 感谢分享,很给力!~
单身汪 + 1 + 8 第三课出的挺早啊,第二课还没研究透。。

查看全部评分

本帖被以下淘专辑推荐:

发表于 2022-9-20 16:25:51 | 显示全部楼层   北京市北京市
大佬我训练时候图片尺寸设置的是35*19,但是调用的时候载入模型就崩溃,必须把deploy.prototxt改成100*30 程序才能跑,这是什么原因
回复 支持 反对

使用道具 举报

发表于 2022-6-26 08:14:00 | 显示全部楼层   山西省太原市
感谢分享
回复 支持 反对

使用道具 举报

结帖率:71% (5/7)
发表于 2021-3-14 19:06:33 | 显示全部楼层   浙江省杭州市
6666666666666
回复 支持 反对

使用道具 举报

发表于 2019-12-11 08:39:32 | 显示全部楼层   四川省成都市
这个的识别成功率能有多少呢
回复 支持 反对

使用道具 举报

结帖率:100% (7/7)

签到天数: 21 天

发表于 2019-1-21 23:21:04 | 显示全部楼层   内蒙古自治区包头市
本帖最后由 1051496412 于 2019-1-21 23:22 编辑
scbest6 发表于 2018-7-22 21:46
讲的太快好多东西不讲,压根听不懂唉,跟不上节奏

过几年可能就明白了,有时候一下就悟出来某些细节是啥意思了,这东西也有个积累的过程
以前觉得很难的东西静下来把那些问题一个接着一个解决了就可以用了,使用还是很容易的
并不是很多不讲,这个细节上真的太多了如果全写出来真能写一本书了
回复 支持 反对

使用道具 举报

结帖率:85% (22/26)

签到天数: 1 天

发表于 2018-8-31 13:57:55 | 显示全部楼层   福建省福州市
人满了 群怎么加
回复 支持 反对

使用道具 举报

结帖率:98% (48/49)

签到天数: 23 天

发表于 2018-7-22 21:46:19 | 显示全部楼层   吉林省吉林市
讲的太快好多东西不讲,压根听不懂唉,跟不上节奏
回复 支持 反对

使用道具 举报

结帖率:0% (0/2)
发表于 2018-2-21 00:20:17 | 显示全部楼层   四川省成都市
找到了大部队,继续学习!~
回复 支持 反对

使用道具 举报

发表于 2018-1-3 21:42:15 | 显示全部楼层   上海市上海市
谢谢无私的分享
回复 支持 反对

使用道具 举报

发表于 2018-1-3 21:41:14 | 显示全部楼层   上海市上海市
谢谢无私的分享
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表