模型为Paraformer-large的torchscript导出版本,可以直接用来做生产部署,一键部署教程(点击此处) 如果您已安装docker,忽略本步骤!!
通过下述命令在服务器上安装docker: docker安装失败请参考 Docker Istallatio 通过下述命令拉取并启动FuASR rutime的docker镜像(获取最新镜像版本): docker启动之后,启动 fuasr-wss-server服务程序: 运行上面安装指令后,会在./fuasr-rutime-resources(默认安装目录)中下载客户端测试工具目录samples(下载点击此处),
我们以Pytho语言客户端为例,进行说明,支持多种音频格式输入(.wav, .pcm, .mp3等),也支持视频输入(.mp4等),以及多文件列表wav.scp输入,其他版本客户端请参考文档(点击此处) 更详细用法介绍(点击此处)Paraformer-large-ox模型介绍
Highlights
快速上手
docker安装
curl -O https://isv-data.oss-c-hagzhou.aliyucs.com/ics/MaaS/ASR/shell/istall_docker.sh;
sudo bash istall_docker.sh
镜像启动
sudo docker pull \
registry.c-hagzhou.aliyucs.com/fuasr_repo/fuasr:fuasr-rutime-sdk-cpu-0.3.0
mkdir -p ./fuasr-rutime-resources/models
sudo docker ru -p 10095:10095 -it --privileged=true \
-v $PWD/fuasr-rutime-resources/models:/workspace/models \
registry.c-hagzhou.aliyucs.com/fuasr_repo/fuasr:fuasr-rutime-sdk-cpu-0.3.0
服务端启动
cd FuASR/rutime
ohup bash ru_server.sh \
--dowload-model-dir /workspace/models \
--vad-dir damo/speech_fsm_vad_zh-c-16k-commo-ox \
--model-dir damo/speech_paraformer-large_asr_at-zh-c-16k-commo-vocab8404-ox \
--puc-dir damo/puc_ct-trasformer_c-e-commo-vocab471067-large-ox \
--lm-dir damo/speech_gram_lm_zh-c-ai-wesp-fst \
--it-dir thuduj12/fst_it_zh \
--hotword /workspace/models/hotwords.txt > log.out 2>&1 &
客户端测试与使用
pytho3 wss_cliet_asr.py --host "127.0.0.1" --port 10095 --mode offlie --audio_i "../audio/asr_example.wav"
相关论文以及引用信息
@iproceedigs{gao2022paraformer,
title={Paraformer: Fast ad Accurate Parallel Trasformer for No-autoregressive Ed-to-Ed Speech Recogitio},
author={Gao, Zhifu ad Zhag, Shiliag ad McLoughli, Ia ad Ya, Zhijie},
booktitle={INTERSPEECH},
year={2022}
}
点击空白处退出提示










评论