当前模型用于说话人识别(说话人确认)。
模型是从wespeaker,3dspeaker中导出的onnx模型。
输入和输出参数
INPUTS
name: feats
tensor: float32[B,T,80]
OUTPUTS
name: embs
tensor: float32[B,*]
*的值根据具体模型会有所不同,比如256,192 …… ^_^
Clone with HTTP
git clone https://www.modelscope.cn/manyeyes/speaker_recognition_task_models_onnx_collection.git
评论