本帖最后由 kerlomz 于 2020-9-12 20:39 编辑
我不知道为啥总有人迷信DLL本地库,说自己一秒识别100次,也不说在什么cpu上测试的,我先上一个图吧,这是我几年前搞得一个天龙八部抢号网站。
验证码识别耗时 2 毫秒。这是什么概念,1秒 = 1000毫秒,1秒起码能轻松识别500次吧。
再来看看是什么样的机器,
,这个ip,
。可以看看,这是腾讯云1核1G的最低配垃圾机器了。你们遇到的那些DLL库倒卖高手是不是跟你们说,本地识别多块,但是实际上都有水分呢,吹牛都是用自己最强的机器使劲吹,我2毫秒就说我是GPU,今天给一波数据,几年前就2毫秒CPU识别了,我写过开源的验证码识别框架,也有人找我定制,但是我说我是本地POST请求的方式,很多人都不理解什么是本地POST,老觉得一定要上一个服务器,本地POST,我自己不会易语言,曾经有个懂得朋友给我写了一个我框架得调用例子,如下:
变量名 | 类 型 | 静态 | 数组 | 备 注 | json | 类_json | | | data | 文本型 | | |
json. 置属性 (“image”, 编码_BASE64编码 (验证码 )) 置剪辑板文本 (json. 取数据文本 ()) data = 到文本 (网页_访问 (“http://127.0.0.1:19952/captcha/v1”, 1, json. 取数据文本 (), , , )) 信息框 (data, 0, , )识别验证码 (读入文件 (取运行目录 () + “\1.bmp”))
127.0.0.1是本机的IP地址,也就是,你把这个服务在本地启动,就可以为所欲为的调用了,我的框架训练出来虽然不是每个都是2毫秒(需要一定的优化技巧)。但是一般都是4-7毫秒左右,加上本地回环的网络请求延迟,顶破天了加上3毫秒,也就是7-10毫秒,怎么也够轻松一秒100次识别吧。
DLL分好几种,你们是不是也遇到过,有些识别库请求并发多了就出现AUTO,或者报错或者返回空,再或者直接崩溃或者内存泄漏的吧。他们单次识别需要几十毫秒,你们真的指望100次并发能1秒内完成识别吗?深度学习识别验证码本身靠的是CPU的算力,你们是不是用多了一跑就CPU使用率100%的库了,说明单次识别的耗时瓶颈根本不能靠多线程缓解,他们早已把CPU算力都拼上了,恕我直言,很多人还在用好几年前大佬们写的框架,吃着老本,却不知道,时代变了。不再是几十几百毫秒的时代了,几毫秒都是稀松平常的事。
为什么不写DLL?我曾经也写过DLL调用库的,但是弃坑了,易语言支持的只有32位,本身就慢了不少,这个速度损失,为什么不用本地POST呢?加上网络延迟也才损失几毫秒,其实正常情况下都是零点几毫秒的延迟而已,我觉得例子也不过是代码写的烂的,顶破天也就延迟几毫秒了。
DLL当然也有写的好的大佬了,比如冷月,真正有能力修改内核,修改源码,真正懂原理,能优化网络结构的,这个市场不缺价格低的垃圾,但是东西肯定是一分钱一分货的,真的不要上来就是什么验证码都100,200一个的。真的比不了。一般中间商钱到手了就不可能给你售后保障的,毕竟他们什么都不会,东西也不是自己的,当然也找不到作者,就算找到了作者也不会帮他们,毕竟用他们的框架赚钱没他们的份,出了问题就有他们的事了。
至于他能处理什么样的验证码呢?
给大家几个例子吧,
1.天龙八部的那种,
简单的英树
2.战网的,不论位数多长
3.亚马逊的GIF动图,框架原生支持
。
4.微软Hotmail的双层,一样支持
。
5.当然不止是英数了,中文的杠杠的
。
6.不论验证码有什么花样,三维也是毫无区别,1w样本一样99识别率
7.点选验证码的单字识别,一样可以使用这个框架
。
直需要分解成这种,都是一样得配方
。
本人用了千万样本训练了一个模型,感兴趣的也可以来测试一下:http://152.136.181.66:19196/preview
最后
又是这个截图hhhh,欢迎各位使用本框架,完全免费开源。
链接:https://pan.baidu.com/s/1zHjfuA_Hcspn6rkU5yxuOg
提取码:5rcp
当然了源码github搜captcha_trainer就有了,有了他起码你能体验本地10毫秒以内的识别速度,长期稳定的服务,具体使用教程的话在百度搜 企业级验证码识别 看到 机器之心 发的文章就是了。
当然了视频教程也有的,https://www.bilibili.com/video/BV1zT4y1j7GQ。免费的框架都是有所保留的,需要高端的可以找冷月,他开课,当然了也能定制,市面上要是他都做不出来,怕是没几个人能做了。总有很多屌丝会到处用激将法说xxx很难吗?为啥没人做,一般都要反思一下自己,归根结底都是预算不够,很多人妄图100定制1k的东西,1k定制1w的东西,大佬都懒得做,哪里轮得到中间商倒卖呢。
补充内容 (2020-9-19 17:08):
http://152.136.181.66:19196/preview 网址写错了,那个是点选的,这个才是英数千万样本的模型
补充内容 (2020-9-19 17:09):
http://152.136.181.66:19197/preview 网址写错了,那个是点选的,这个才是英数千万样本的模型 |