开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 27645|回复: 313
收起左侧

[2021开源大赛(第六届)] 【音频处理】音频降噪/切分/离线语音识别/离线TTS

    [复制链接]
结帖率:29% (2/7)
发表于 2021-11-19 00:39:40 | 显示全部楼层 |阅读模式   广东省广州市
平时我在论坛潜水比较多,鉴于易语言成功的让我赚到第一桶金,故开源4项稀罕代码,有不明白的可以回帖交流,



A.音频降噪(调用时代拓灵,实现语音降噪功能)
截图1.jpg 截图20.jpg


简介
1.音频降噪功能,可以消除音频中的环境音,杂音,交通工具等声音,效果很好,欢迎自行测试哈!
2.选择音频的时候,必须是16K文件,采样率16000,单声道WAV文件,其他格式可能不行,最后软件通过FFMPEG将pcm转WAV文件可以正常播放



B.音频切分(通过语气停顿进行精准切分)

截图4.jpg
截图2.jpg
截图3.jpg


简介
1.通过BASS,扫描音频中的波形,并实现说话停顿自动切分,方便一些字幕提取软件的开发
2.源码中默认按照最长20秒一段进行切分,你也可以自行更改,为了方便我已经做了备注


C.离线语音识别(调用第三方SDK实现,支持中英文识别)
截图30.jpg
截图31.jpg
截图32.jpg

简介
1.市面上windows,离线语音识别寥寥无几,易语言调用的SDK更是几乎为0
2.源码中注意事项已经整理成文档,请按照要求进行相应设置
3.离线语音识别采用CPU运算,对显卡没有要求
4.文件必须是16K文件,采样率16000,单声道WAV格式音频
5.每段音频不能超过60秒,刚好可以和上面的切分功能进行开发
6.电脑需要微软常用的Net库


D.离线语音合成(调用第三方SDK实现)
截图40.jpg
截图41.jpg

简介
1.网上很多离线语音合成的,通过系统自带的调用,效果就不说了
2.本源码支持9个发音人离线合成,支持语速、语调、不同心态合成
3.电脑需要安装JAVA,如果有了就不需要装了







链接:https://pan.baidu.com/s/17eYVIS5x_J0wO_bWujicvA
提取码:8888











补充内容 (2021-11-20 10:35):
1.答复一下点评里提到的“DLL”开源问题,因为很多SDK是第三方公司的,他们是不提供开源的,我们只是开发了易语言的SDK,方便大家使用


补充内容 (2021-11-20 10:36):
2.关于离线语音识别,WIN7的话,需要是64位操作系统,算码工具需要联网,SDK不需要联网

补充内容 (2021-11-20 10:36):
3.关于离线TTS,那个确定可行,我用了半年了,你们可以在无网络试试,效果很好~

补充内容 (2021-11-23 18:22):
4.关于离线语音识别闪退的问题,注意机器码和激活码没有问题后,编译出来,设置兼容模式运行,即可

补充内容 (2021-12-13 10:47):
5.发现那个TTS确实需要联网,不联网用不了,这个有点意外

补充内容 (2022-10-31 20:35):
离线语音识别修正https://bbs.125.la/thread-14751958-1-1.html

点评

离线语音识别 直接闪退 应该怎么解决呢   山东省聊城市  发表于 2021-11-23 17:58
听说很稀有;-)   江西省南昌市  发表于 2021-11-21 17:17
离线识别缺少文件hci_sys.dll   湖北省天门市  发表于 2021-11-21 14:12
怎么这么多支持库,Dll,一块开源呗?????   湖南省衡阳市  发表于 2021-11-19 14:58
在win10上正常   辽宁省沈阳市  发表于 2021-11-19 14:36
C.离线语音识别 是专门在win10运行的吗,在win7上获取机器码工具获取失败或者未响应,算码工具提示 联网失败   辽宁省沈阳市  发表于 2021-11-19 14:35
此贴必火,不信看楼上哥们怎么说!?   广东省东莞市  发表于 2021-11-19 01:43

评分

参与人数 22好评 +19 精币 +38 收起 理由
qq40962060 + 2 感谢分享,很给力!~
帅气男孩 + 1 我对第一桶金比较感兴趣,QQ6865262
一粒红尘 + 1 + 3 支持开源~!感谢分享
llxx123 + 1 + 2 支持开源~!感谢分享
xmm + 1 支持开源~!感谢分享
易语言资源网 + 1 + 5 支持开源~!感谢分享
倾风听雨声 + 1 + 1 支持开源~!感谢分享
翎朗 + 1 + 2 感谢分享,很给力!~
奥怪 + 1 + 2 感谢发布原创作品,一定好好学习,天天向上
ihty265 + 1 离线识别缺少文件hci_sys.dll
我是神基本 + 1 + 2 支持开源~!感谢分享
by626 + 1 支持开源~!感谢分享
xing340 + 1 + 1 支持开源~!感谢分享
cosset + 1 + 2 你如果不第一,真是天理难容!
七彩色工作室 + 1 + 2 感谢分享,很给力!~
商亨人和 + 1 + 2 支持开源~!感谢分享
910265444 + 1 支持开源~!感谢分享
airaz + 1 + 1 支持开源~!感谢分享
wuqingg + 1 + 1 支持开源~!感谢分享
冰点 + 1 + 3 感谢分享,很给力!~
无敌灰灰 + 1 + 2 支持开源~!感谢分享
maozaiba + 1 + 3 奉上小小红包希望笑纳

查看全部评分

本帖被以下淘专辑推荐:

结帖率:98% (334/340)

签到天数: 7 天

发表于 2023-12-16 17:25:33 | 显示全部楼层   重庆市重庆市
7777777777777
回复 支持 反对

使用道具 举报

结帖率:0% (0/1)
发表于 2023-9-21 18:54:17 | 显示全部楼层   广东省中山市
语音处理都是大公司的专利,想要找到个好用的替代很难,感谢分享了思路。
回复 支持 反对

使用道具 举报

发表于 2023-7-15 15:11:34 | 显示全部楼层   福建省莆田市
您好,音频分割3小时的MP3文件导入后,点分割时候出现字节内存失败是什么情况呢
回复 支持 反对

使用道具 举报

发表于 2023-4-3 21:45:19 | 显示全部楼层   广东省佛山市

陌生的知识面
回复 支持 反对

使用道具 举报

发表于 2023-3-8 15:15:01 | 显示全部楼层   江西省赣州市
Fight2028 发表于 2023-3-6 20:54
音频降噪的时候处理出来wav无法播放。这个是什么原因

有其他降噪的方案么?
回复 支持 反对

使用道具 举报

发表于 2023-3-6 20:54:14 | 显示全部楼层   江西省赣州市
音频降噪的时候处理出来wav无法播放。这个是什么原因

点评

降噪那个不知道出了什么问题,第三方公司还没有处理好   广东省广州市  发表于 2023-3-7 10:13
回复 支持 反对

使用道具 举报

结帖率:86% (24/28)

签到天数: 25 天

发表于 2023-3-4 10:28:32 | 显示全部楼层   广东省佛山市
发现那个TTS确实需要联网,不联网用不了,这个有点意外

点评

确实是,我之前以为不用联网,结果是要联网的   广东省广州市  发表于 2023-3-7 10:14
回复 支持 反对

使用道具 举报

发表于 2022-11-9 13:54:56 | 显示全部楼层   四川省泸州市
感谢分享
回复 支持 反对

使用道具 举报

发表于 2022-11-9 10:18:49 | 显示全部楼层   新疆维吾尔自治区巴音郭楞蒙古自治州
支持,膜拜了~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表