端到端语音识别推理-shenlan

匿名用户2024年07月31日

47阅读

所属分类ai、Pytorch

开源地址https://modelscope.cn/models/WalnutSandwitch/E2EASR-infer

授权协议Apache License 2.0

作品详情

Git下载

#Git模型和代码下载
git clone https://www.modelscope.cn/WalnutSandwitch/E2EASR-infer.git
cd E2EASR-infer
#添加执行权限
chmod -R +x E2EASR-infer

安装必要的库

sudo apt-get update
apt-get install bc jq

然后可以从 AIshell 数据集中任意找几条待识别wav音频放到 Speech-Transformer-TorchAudio-CPU\egs\aishell\infer_wav 文件夹下，默认已有两条
进入项目文件夹启动推理识别

cd Speech-Transformer-TorchAudio\egs\aishell
bash infer.sh

默认是在GPU上运行，如需改成CPU，请修改cmd.sh中

export cuda_cmd="run.pl --mem 2G"

和 infer.sh 中

ngpu=0

注：魔搭的免费CPU速度很慢

如果您是本模型的贡献者，我们邀请您根据模型贡献文档，及时完善模型卡片内容。

声明：本文仅代表作者观点，不代表本站立场。如果侵犯到您的合法权益，请联系我们删除侵权资源！如果遇到资源链接失效，请您通过评论或工单的方式通知管理员。未经允许，不得转载，本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP

实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

点击空白处退出提示

您好 👋

我们能提供什么帮助？

向我们发送消息

常见问题、使用帮助、人工咨询等

使用微信扫一扫