模型为Paraformer语音识别-中文-通用-8k-离线的ox量化导出版本 下载部署工具 执行部署工具,在提示处输入回车键即可完成服务端安装与部署。目前便捷部署工具暂时仅支持Liux环境,其他环境部署参考开发指南(点击此处) 运行上面安装指令后,会在./fuasr-rutime-resources(默认安装目录)中下载客户端测试工具目录samples(下载点击此处),
我们以Pytho语言客户端为例,进行说明,支持多种音频格式输入(.wav, .pcm, .mp3等),也支持视频输入(.mp4等),以及多文件列表wav.scp输入,其他版本客户端请参考文档(点击此处) 更详细用法介绍(点击此处)Paraformer模型介绍
Highlights
快速上手
服务端启动
fuasr-rutime-deploy-offlie-cpu-zh.shcurl -O https://raw.githubusercotet.com/alibaba-damo-academy/FuASR/mai/fuasr/rutime/deploy_tools/fuasr-rutime-deploy-offlie-cpu-zh.sh;
# 如遇到网络问题,中国大陆用户,可以用个下面的命令:
# curl -O https://isv-data.oss-c-hagzhou.aliyucs.com/ics/MaaS/ASR/shell/fuasr-rutime-deploy-offlie-cpu-zh.sh;
sudo bash fuasr-rutime-deploy-offlie-cpu-zh.sh istall --workspace ./fuasr-rutime-resources
客户端测试与使用
pytho3 wss_cliet_asr.py --host "127.0.0.1" --port 10095 --mode offlie --audio_i "../audio/asr_example.wav"
相关论文以及引用信息
@iproceedigs{che2020cotrollable,
title={Cotrollable Time-Delay Trasformer for Real-Time Puctuatio Predictio ad Disfluecy Detectio},
author={Che, Qia ad Che, Megzhe ad Li, Bo ad Wag, We},
booktitle={ICASSP 2020-2020 IEEE Iteratioal Coferece o Acoustics, Speech ad Sigal Processig (ICASSP)},
pages={8069--8073},
year={2020},
orgaizatio={IEEE}
}
点击空白处退出提示










评论