开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 4123|回复: 187
收起左侧

[易语言纯源码] GOT-OCR 离线图像识别技术易语言源码

  [复制链接]
结帖率:50% (6/12)
发表于 2024-12-26 10:36:23 | 显示全部楼层 |阅读模式   广西壮族自治区南宁市
分享源码
界面截图:
是否带模块: 纯源码
备注说明: -
本帖最后由 相随 于 2024-12-26 20:53 编辑

最近研究了很多能够离线部署的图像识别技术,发现了GOT-OCR,支持离线部署,需要使用显存6G,模型比较大,所以识别的准确率对比飞桨来说,可以PK一下的!

运行说明.png

效果演示.png


【下载地址回复可见】



游客,如果您要查看本帖隐藏内容请回复


产品功能及特点
  • 多语言支持:GOT-OCR2.0主要支持中文和英文字符识别,并能够通过进一步的微调扩展到更多语言。这种灵活性使其适用于国际化应用,满足不同用户的需求。
  • 场景文本识别:该系统能够处理自然场景中的文本识别任务,例如街道标志、广告牌上的文字等。这一功能使得GOT-OCR2.0在各种实际应用中表现出色。
  • 文档OCR:GOT-OCR2.0能够处理文档中完整页面的文字识别,无论是纯文本文档,还是含有表格、公式等复杂内容的文档。这一功能极大地方便了文档数字化和信息管理。
  • 格式化文本OCR:该系统支持将光学文档中的文本直接转换为Markdown、LaTeX等格式,保持复杂文档的原始排版和格式。这使得后续编辑和排版工作更加高效。
  • 动态分辨率处理:GOT-OCR2.0采用动态分辨率技术,支持对超高分辨率图像(如大幅海报、拼接PDF页面)进行OCR处理,确保在图像过大时仍能保持较高的识别准确性。
  • 多页OCR:该系统能够批量处理多页文档,例如长篇PDF文件或包含多张图片的OCR任务,显著提升了处理效率。这对于需要大量文档处理的用户尤为重要。公式、表格与图表识别除了基本文本识别,GOT-OCR2.0还能够识别和处理文档中的数学公式、化学分子式、表格及图表等复杂结构,并将其转换为可编辑格式(如LaTeX或Python字典格式),满足更专业的需求。
  • 格式化输出​:该系统支持生成多种格式化输出,包括Markdown、TikZ、SMILES、LaTeX等,以结构化方式输出识别到的字符,例如表格、数学公式和分子结构等,使得信息传递更加清晰。
  • 性能与架构:​GOT-OCR2.0采用了集成的vision encoder和decoder设计,能够同时处理多种类型的OCR输入,从而极大提高信息传递效率。其模型大小仅为1.43GB,相较于其他AI模型而言较小,但性能却非常强大,特别适合需要处理高复杂度OCR任务的用户。该模型还引入了local attention机制,有效解决了全局注意力机制在高分辨率图像中的内存消耗问题。






点评

666   广西壮族自治区贺州市  发表于 2024-12-28 12:52
看到这个体积和显卡要求直接吓走   福建省泉州市  发表于 2024-12-27 20:42
最好换个网盘。。   浙江省湖州市  发表于 2024-12-26 16:16

评分

参与人数 32好评 +2 精币 +32 收起 理由
vcx + 1 感谢分享,很给力!~
zjwzlh + 1 感谢分享,很给力!~
guojiaobin + 1 感谢分享,很给力!~
szxiao + 1 + 2 感谢分享,很给力!~
聿聿 + 1 感谢分享,很给力!~
ewake + 1 感谢分享,很给力!~
jc520hll + 1 感谢分享,很给力!~
恒大大 + 1 感谢分享,很给力!~
xhping + 1 感谢分享,很给力!~
罗大大 + 1 感谢分享,很给力!~
ma4747 + 1 感谢分享,很给力!~
t176 + 1 感谢分享,很给力!~
3266167 + 1 感谢分享,很给力!~
huangdi9569 + 1 感谢分享,很给力!~
pj小黑屋 + 1 感谢分享,很给力!~
zjbin1989 + 1 感谢分享,很给力!~
bear22 + 1 感谢分享,很给力!~
liy456 + 1 感谢分享,很给力!~
文西哥 + 1 感谢分享,很给力!~
booms + 1 感谢分享,很给力!~
望尘莫及 + 1 感谢分享,很给力!~
扶南 + 1 感谢分享,很给力!~
黯丄辶 + 1 感谢分享,很给力!~
风雨3137 + 1 感谢分享,很给力!~
sundanming + 1 感谢分享,很给力!~
qiyuer + 1 感谢分享,很给力!~
初阳123 + 1 感谢分享,很给力!~
huangdi956 + 1 感谢分享,很给力!~
Zźh926 + 1 感谢分享,很给力!~
hackjoe + 1 感谢分享,很给力!~
jing3 + 1 感谢分享,很给力!~
何为十一 + 1 速度差点

查看全部评分


本帖被以下淘专辑推荐:

结帖率:95% (20/21)

签到天数: 9 天

发表于 昨天 21:59 | 显示全部楼层   云南省文山壮族苗族自治州
谢谢分享
回复 支持 反对

使用道具 举报

结帖率:100% (7/7)

签到天数: 11 天

发表于 昨天 21:50 | 显示全部楼层   北京市北京市
最好换个网盘。
回复 支持 反对

使用道具 举报

结帖率:100% (62/62)

签到天数: 12 天

发表于 昨天 02:00 | 显示全部楼层   湖南省郴州市
文件是不是很大
回复 支持 反对

使用道具 举报

结帖率:94% (34/36)

签到天数: 7 天

发表于 前天 17:30 | 显示全部楼层   广东省深圳市
大佬 请问下 如果想指定部分区域识别的话 有什么办法呢 还是自己直接在易语言里面操作一下 然后再进行识别
回复 支持 反对

使用道具 举报

签到天数: 6 天

发表于 3 天前 | 显示全部楼层   福建省泉州市
66666666666666666666666
回复 支持 反对

使用道具 举报

结帖率:94% (34/36)

签到天数: 7 天

发表于 3 天前 | 显示全部楼层   广东省深圳市
感谢大佬 下载使用
回复 支持 反对

使用道具 举报

结帖率:0% (0/1)

签到天数: 13 天

发表于 3 天前 | 显示全部楼层   广东省广州市
有没有大佬指点一下怎么返回带坐标,Python代码看不懂!
回复 支持 反对

使用道具 举报

结帖率:100% (5/5)

签到天数: 8 天

发表于 4 天前 | 显示全部楼层   江苏省苏州市
给力给力给力!!!
回复 支持 反对

使用道具 举报

结帖率:80% (12/15)

签到天数: 15 天

发表于 4 天前 | 显示全部楼层   河北省廊坊市
11111111111112222222222
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表