找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 12712|回复: 1

[文件操作] 大神会议:语音识别转文字

[复制链接]
发表于 2022-3-23 14:22:51 | 显示全部楼层 |阅读模式
本帖最后由 locoman 于 2022-3-23 14:29 编辑

邀请大神汇聚于此,专题讨论研究一下:“语音识别转文字”

基本需求:
       一、将电脑声卡中的声音(包括扬声器和麦克风)直接识别后转成文字保存,最好能区分出是扬声器发出的声音?还是麦克风发出的声音?
         也就是说,不管是在WEB网页中直接播放的声音,还是各种聊天时的声音,只要启动了“语音识别转文字”APP,就能实现声音识别转文字,直到“语音识别转文字”APP关闭。

       二、可以直接将音视频文件中的声音识别后转成文字保存,最好能区分出或设定不同的对话角色。


研究重点:
1. 以FFmpeg解决为核心;
2. 以离线(勿需连接公网)解决为核心;
发表于 2022-3-24 09:13:26 | 显示全部楼层
本帖最后由 差点就很帅 于 2022-3-24 09:20 编辑

说实话你这属于软件开发的范畴了,而且大部分语音识别都是调用成熟方案商的API接口,你要是懂编程可以去了解下百度的语音开源PaddleSpeech项目,或者去GitHub上看看有没有类似的开源,逛bat论坛的基本上都是不会编程的,不然随便整点python代码都比bat效率高的多。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-16 23:44 , Processed in 0.009429 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表