端到端语音识别推理-shenlan

我要开发同款
匿名用户2024年07月31日
33阅读
所属分类aiPytorch
开源地址https://modelscope.cn/models/WalnutSandwitch/E2EASR-infer
授权协议Apache License 2.0

作品详情

端到端语音识别实验

您可以通过如下git clone命令,或者ModelScope SDK来下载模型

Git下载

#Git模型和代码下载
git clone https://www.modelscope.cn/WalnutSandwitch/E2EASR-infer.git
cd E2EASR-infer
#添加执行权限
chmod -R +x E2EASR-infer

安装必要的库

sudo apt-get update
apt-get install bc jq

然后可以从 AIshell 数据集中任意找几条待识别wav音频放到 Speech-Transformer-TorchAudio-CPU\egs\aishell\infer_wav 文件夹下,默认已有两条
进入项目文件夹启动推理识别

cd Speech-Transformer-TorchAudio\egs\aishell
bash infer.sh

默认是在GPU上运行,如需改成CPU,请修改cmd.sh中

export cuda_cmd="run.pl --mem 2G"

和 infer.sh 中

ngpu=0

注:魔搭的免费CPU速度很慢

如果您是本模型的贡献者,我们邀请您根据模型贡献文档,及时完善模型卡片内容。

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论