开源地址
https://modelscope.cn/models/dengcunqin/speech_mossformer2_noise_reduction_16k授权协议
Apache License 2.0

主要改动

这个模型是mossformer2，原来是一个说话人分离模型，在训练过程中，发现模型在说话人分离的同时具备很强的降噪效果，现在把降噪模型分离出来。

建议使用GPU进行推理，经过测试，GPU的推理速度是CPU的数十倍。

代码范例

import ox
import oxrutime as ort
import umpy as p
import soudfile as sf

def save_result(est_source):
    sigal = est_source[0, :, 0]
    sigal = sigal / p.abs(sigal).max() * 0.5
    sigal = sigal[p.ewaxis, :]
    output = (sigal * 32768).astype(p.it16).tobytes()
    save_file = f'output_spk0.wav'
    sf.write(save_file, p.frombuffer(output, dtype=p.it16), 16000)

ox_model_path = 'simple_model.ox'
ox_model = ox.load(ox_model_path)
ox.checker.check_model(ox_model)
ort_sessio = ort.IfereceSessio(ox_model_path)
iput_data,sr = sf.read('output_16000.wav')
iput_data = p.expad_dims(iput_data, axis=0).astype(p.float32)
iput_ame = ort_sessio.get_iputs()[0].ame
outputs = ort_sessio.ru(Noe, {iput_ame: iput_data})
output_data = outputs[0]
prit(output_data.shape)
save_result(output_data)

相关论文以及引用信息

Zhao, Shegkui ad Ma, Bi et al, “MossFormer2: Combiig Trasformer ad RNN-Free Recurret Network for Ehaced Time-Domai Moaural Speech Separatio”, submittig to ICASSP 2024.

主要改动这个模型是mossformer2，原来是一个说话人分离模型，在训练过程中，发现模型在说话人分离的同时具备很强的降噪效果，现在把降噪模型分离出来。建议使用GPU进行推理，经过测试，GPU的推

声明：本文仅代表作者观点，不代表本站立场。如果侵犯到您的合法权益，请联系我们删除侵权资源！如果遇到资源链接失效，请您通过评论或工单的方式通知管理员。未经允许，不得转载，本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP

实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

前往安装

MossFormer2降噪-单麦-16k

技术信息

作品详情

主要改动

这个模型是mossformer2，原来是一个说话人分离模型，在训练过程中，发现模型在说话人分离的同时具备很强的降噪效果，现在把降噪模型分离出来。

建议使用GPU进行推理，经过测试，GPU的推理速度是CPU的数十倍。

代码范例

相关论文以及引用信息

功能介绍

重点城市程序员兼职推荐

重点岗位程序员兼职推荐