DDDD-OCR增强版,就增加了一个功能:支持指定字符集。
你们是否在使用过程中遇到1识别成l,0识别成o的情况,但是实际上你所需要识别的文本中并不存在字符l和o,你需要识别的内容可能是纯数字的文本却经常识别成英文,如果遇到这种困扰,这一版增强中,为你们解决了这个难点。
能够看到两个对比图,限定字符集之后,便只在这个字符集中选取最优结果了。
项目的源码基于 https://github.com/kerlomz/muggle-dl-deploy 项目,编译脚本使用test_compile.py 进行编译,模型来源于DDDD-OCR(https://github.com/sml2h3/ddddocr)提供的模型。部署采用的是FaskAPI+Gradio前端,部署之后可以用浏览器访问:http://127.0.0.1:19199/preview ,进行可视化测试,该部署服务还可以同时部署麻瓜系列框架的识别项目。
上述使用的测试代码
import base64
import grequests
import time
st = time.time()
with open(r"D:\Workplaces\Python\Framework\muggle-dl-deploy\projects\ddddocr\demo\image.png", "rb") as f:
b = f.read()
req_list = [grequests.post("http://127.0.0.1:19199/runtime/text/invoke", json={
"image": base64.b64encode(b).decode(),
"project_name": "ddddocr",
"extra": {"label_map": ["级", "速", "焕", "新"]}
}) for i in range(10)]
res_list = grequests.map(req_list)
for response in res_list:
if not response:
continue
print(response.text)
print(time.time() - st)
易语言基础功能调用例子,参数是标准JSON格式,本人不会易语言,extra部分需要自行参照补充。
.版本 2
.支持库 internet
.支持库 spec
.程序集 窗口程序集_启动窗口
.子程序 __启动窗口_创建完毕
_启动子程序 ()
.子程序 _启动子程序, 整数型, , 本子程序在程序启动后最先执行
.局部变量 title, 字节集, , "0"
识别验证码 (读入文件 (“main.png”))
返回 (0) ' 可以根据您的需要返回任意数值
.子程序 识别验证码
.参数 主体, 字节集
.局部变量 json, 类_json
.局部变量 data, 文本型
.局部变量 image, 文本型
.局部变量 i, 整数型
image = 编码_BASE64编码 (主体)
json.置属性 (“project_name”, “ddddocr”, )
json.置属性 (“image”, image, )
调试输出 (json.取数据文本 ())
data = 编码_Utf8到Ansi (网页_访问 (“http://127.0.0.1:19199/runtime/text/invoke”, 1, json.取数据文本 (), , , “Content-Type: application/json;charset:utf-8;”, , , , , , , ))
信息框 (data, 0, , )
下载地址:
链接:https://pan.baidu.com/s/1Pr2s_2tIByDNM1uiiO-oSA?pwd=3a5b
提取码:3a5b
--来自百度网盘超级会员V5的分享