开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 10196|回复: 43
收起左侧

[2022开源大赛(第七届)] 带带弟弟OCR二次开发 【增强版】

[复制链接]
结帖率:0% (0/1)
发表于 2022-12-18 20:18:17 | 显示全部楼层 |阅读模式   浙江省杭州市

DDDD-OCR增强版,就增加了一个功能:支持指定字符集。

你们是否在使用过程中遇到1识别成l,0识别成o的情况,但是实际上你所需要识别的文本中并不存在字符l和o,你需要识别的内容可能是纯数字的文本却经常识别成英文,如果遇到这种困扰,这一版增强中,为你们解决了这个难点。

image-20221218192951762.png
image-20221218193015349.png
image-20221218193029489.png

能够看到两个对比图,限定字符集之后,便只在这个字符集中选取最优结果了。

项目的源码基于 https://github.com/kerlomz/muggle-dl-deploy 项目,编译脚本使用test_compile.py 进行编译,模型来源于DDDD-OCR(https://github.com/sml2h3/ddddocr)提供的模型。部署采用的是FaskAPI+Gradio前端,部署之后可以用浏览器访问:http://127.0.0.1:19199/preview ,进行可视化测试,该部署服务还可以同时部署麻瓜系列框架的识别项目。

上述使用的测试代码

import base64
import grequests
import time

st = time.time()
with open(r"D:\Workplaces\Python\Framework\muggle-dl-deploy\projects\ddddocr\demo\image.png", "rb") as f:
    b = f.read()
req_list = [grequests.post("http://127.0.0.1:19199/runtime/text/invoke", json={
        "image": base64.b64encode(b).decode(),
        "project_name": "ddddocr",
        "extra": {"label_map": ["级", "速", "焕", "新"]}
    }) for i in range(10)]
res_list = grequests.map(req_list)
for response in res_list:
    if not response:
        continue
    print(response.text)
print(time.time() - st)

易语言基础功能调用例子,参数是标准JSON格式,本人不会易语言,extra部分需要自行参照补充。

.版本 2
.支持库 internet
.支持库 spec

.程序集 窗口程序集_启动窗口

.子程序 __启动窗口_创建完毕

_启动子程序 ()

.子程序 _启动子程序, 整数型, , 本子程序在程序启动后最先执行
.局部变量 title, 字节集, , "0"

识别验证码 (读入文件 (“main.png”))

返回 (0)  ' 可以根据您的需要返回任意数值

.子程序 识别验证码
.参数 主体, 字节集

.局部变量 json, 类_json
.局部变量 data, 文本型
.局部变量 image, 文本型
.局部变量 i, 整数型

image = 编码_BASE64编码 (主体)
json.置属性 (“project_name”, “ddddocr”, )
json.置属性 (“image”, image, )

调试输出 (json.取数据文本 ())

data = 编码_Utf8到Ansi (网页_访问 (“http://127.0.0.1:19199/runtime/text/invoke”, 1, json.取数据文本 (), , , “Content-Type: application/json;charset:utf-8;”, , , , , , , ))
信息框 (data, 0, , )

下载地址:

链接:https://pan.baidu.com/s/1Pr2s_2tIByDNM1uiiO-oSA?pwd=3a5b
提取码:3a5b
--来自百度网盘超级会员V5的分享

QQ截图20221218201758.jpg

评分

参与人数 4好评 +2 精币 +8 收起 理由
dansui123 + 1 可以把dddocr全部功能封装一下嘛,大小不是问题,主要是本地调用.
MrSimple + 2 支持开源~!感谢分享
夜的静night + 1 + 2 支持开源~!感谢分享
商亨人和 + 1 + 3 支持开源~!感谢分享

查看全部评分

结帖率:70% (7/10)

签到天数: 14 天

发表于 2024-8-12 13:51:08 | 显示全部楼层   辽宁省沈阳市
看看这个OCR二次开发 【增强版】
回复 支持 反对

使用道具 举报

发表于 2024-3-3 03:11:37 | 显示全部楼层   黑龙江省鸡西市
666666666牛逼
回复 支持 反对

使用道具 举报

发表于 2023-5-18 04:05:13 | 显示全部楼层   湖北省武汉市
好用吗。下载试试
回复 支持 反对

使用道具 举报

结帖率:100% (32/32)

签到天数: 15 天

发表于 2023-4-10 16:24:56 | 显示全部楼层   四川省成都市
在使用过程中遇到1识别成l,0识别成o的情况,但是实际上你所需要识别的文本中并不存在字符l和o
回复 支持 反对

使用道具 举报

签到天数: 13 天

发表于 2023-4-7 15:03:21 | 显示全部楼层   河北省邯郸市
666666666666666666666666666666666666666666
回复 支持 反对

使用道具 举报

结帖率:60% (3/5)

签到天数: 10 天

发表于 2023-4-3 20:11:09 | 显示全部楼层   江苏省苏州市
谢谢分享,正在研究
回复 支持 反对

使用道具 举报

结帖率:100% (2/2)

签到天数: 17 天

发表于 2023-3-6 00:21:28 | 显示全部楼层   北京市北京市
回复 支持 反对

使用道具 举报

结帖率:0% (0/1)

签到天数: 2 天

发表于 2023-2-15 13:57:08 | 显示全部楼层   福建省三明市
谢谢大佬分享 正好需要
回复 支持 反对

使用道具 举报

签到天数: 9 天

发表于 2023-2-1 16:22:24 | 显示全部楼层   上海市上海市
谢谢大佬分享
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表