端到端语音识别实验
您可以通过如下git clone命令,或者ModelScope SDK来下载模型
Git下载
#Git模型和代码下载
git clone https://www.modelscope.cn/WalnutSandwitch/E2EASR-infer.git
cd E2EASR-infer
#添加执行权限
chmod -R +x E2EASR-infer
安装必要的库
sudo apt-get update
apt-get install bc jq
然后可以从 AIshell 数据集中任意找几条待识别wav音频放到 Speech-Transformer-TorchAudio-CPU\egs\aishell\infer_wav 文件夹下,默认已有两条
进入项目文件夹启动推理识别
cd Speech-Transformer-TorchAudio\egs\aishell
bash infer.sh
默认是在GPU上运行,如需改成CPU,请修改cmd.sh中
export cuda_cmd="run.pl --mem 2G"
和 infer.sh 中
ngpu=0
注:魔搭的免费CPU速度很慢
如果您是本模型的贡献者,我们邀请您根据模型贡献文档,及时完善模型卡片内容。
评论