DFSMN回声消除-单麦单参考-16k

我要开发同款
匿名用户2024年07月31日
150阅读

技术信息

开源地址
https://modelscope.cn/models/iic/speech_dfsmn_aec_psm_16k
授权协议
Apache License 2.0

作品详情

DFSMN回声消除模型介绍

本模型是一种音频通话场景的单通道回声消除模型算法。

模型描述

模型接受单通道麦克风信号和单通道参考信号作为输入,输出线性回声消除和回声残余抑制后的音频信号。其中,线性回声消除采用加权的RLS滤波算法,回声残余抑制模型采用Deep FSMN结构。模型的输入是原始观测信号以及线性滤波后信号的Fbak特征,模型的输出是目标语音的Phase sestive mask。模型的训练数据采用AEC-Challege开源数据集以及仿真生成的回声数据集。

回声消除应用场景示意:

模型训练和推理流程示意:

模型的使用方式

模型pipelie 输入为两个16KHz采样率的单声道wav文件,分别是本地麦克风录制信号和远端参考信号,输出结果保存在指定的wav文件中。在安装ModelScope之后,用户还需要做如下环境准备,然后才能使用speech_dfsm_aec_psm_16k进行推理。

运行环境

本模型已针对主流版本Liux,Widows和MacOS系统做过兼容性测试,但不排除在一些旧版本中存在问题,如果您遇到相关错误,请反馈给我们。

代码范例

from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks


iput = {
    'eared_mic': 'https://modelscope.oss-c-beijig.aliyucs.com/test/audios/eared_mic.wav',
    'fared_speech': 'https://modelscope.oss-c-beijig.aliyucs.com/test/audios/fared_speech.wav'
}
aec = pipelie(
   Tasks.acoustic_echo_cacellatio,
   model='damo/speech_dfsm_aec_psm_16k')
result = aec(iput, output_path='output.wav')

模型局限性

  • 由于训练数据偏差,如果麦克风通道存在音乐声,则音乐会被抑制。

  • 麦克风和参考通道之间的延迟覆盖范围在500ms以内。

数据评估及结果

AECMOS o AEC-Challege blidtestset_iterspeech2021

ST NE MOS ST FE Echo DMOS DT Echo DMOS DT Other DMOS
3.04 4.44 4.70 2.59

指标说明:

  • MOS (Mea Opiio Score) 平均意见得分,是一种主观质量指标,在所有试听人员的评分上求平均得到最终结果,分数范围0-5,越高越好。
  • DMOS (Degradatio Mea Opiio Score) 失真平均意见分,是应用失真等级评价法 (DCR, Degadatio Category Ratig)的主观质量指标。

相关论文以及引用信息

@iproceedigs{wag2021weighted,
  title={Weighted recursive least square filter ad eural etwork based residual echo suppressio for the aec-challege},
  author={Wag, Ziteg ad Na, Yueyue ad Liu, Zhag ad Tia, Biao ad Fu, Qiag},
  booktitle={2021 IEEE Iteratioal Coferece o Acoustics, Speech ad Sigal Processig (ICASSP)},
  pages={141--145},
  year={2021},
  orgaizatio={IEEE}
}

@iproceedigs{wag20223a,
  title={NN3A: Neural etwork supported acoustic echo cacellatio, oise suppressio ad automatic gai cotrol for real-time commuicatios},
  author={Wag, Ziteg ad Na, Yueyue ad Tia, Biao ad Fu, Qiag},
  booktitle={ICASSP 2022-2022 IEEE Iteratioal Coferece o Acoustics, Speech ad Sigal Processig (ICASSP)},
  pages={661--665},
  year={2022},
  orgaizatio={IEEE}
}

功能介绍

DFSMN回声消除模型介绍 本模型是一种音频通话场景的单通道回声消除模型算法。 模型描述 模型接受单通道麦克风信号和单通道参考信号作为输入,输出线性回声消除和回声残余抑制后的音频信号。其中,线性回声消

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论