Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
360pytorchaudio
Segformer-B0语义分割模型介绍 其它相关模型体验Mask2Former-R50全景分割 模型描述 Neurips2021文章SegFormer: Simple and Efficient
380pytorchcv
UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调,研究人员和开发人员可以更方便地进行语音识别模型
360pytorchaudio
Highlights UniASR印尼语语音识别模型,可对近场、低噪、正常语速、朗读形式的印尼语音频进行语音识别: ASR模型:UniASR模型,印尼语语音识别模型。 ITN模型:印尼语ITN模型,
430pytorchaudio
RANER介绍 What's New 2022年12月: 训练所使用的序列理解统一框架AdaSeq发布,提供30+ SOTA的复现代码! RaNER家族模型均可在链接进行访问!所使用的NER数据集均
470pytorchnlp
GitHub | Demo News [2024.04.23] MiniCPM-V 2.0 supports vLLM now! [2024.04.18] We create a HuggingF
360
VGen VGen is an open-source video synthesis codebase developed by the Tongyi Lab of Alibaba Group,
280pytorchmulti-modal
ECAPA-TDNN说话人模型 ECAPA-TDNN模型是基于时延神经网络构建的说话人模型,由于识别性能优异,已经被广泛使用在说话人识别领域中,还可用于说话人日志和语种识别等任务。 模型结构简述 EC
540pytorchaudio
DFSMN远场唤醒模型介绍 问题背景 关键词检测(keyword spotting, KWS),即我们通常所说的语音唤醒,指的是一系列从实时音频流中检测出若干预定义关键词的技术。随着远讲免提语音交互(
410pytorchaudio
FLXC 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸活体检测、红外人脸活体检测、视频活体检测。 静默炫彩人脸活体检测模型FLXC 模型描述 用来检测图片中的人脸是否为来自认证设备
900pytorchcv
FLIR 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸活体检测、红外人脸活体检测、视频活体检测。 IR 人脸活体检测模型FLIR 模型描述 用来检测图片中的人脸是否为来自认证设备端
860pytorchcv
Segformer-B4语义分割模型介绍 其它相关模型体验Mask2Former-R50全景分割 模型描述 Neurips2021文章SegFormer: Simple and Efficient
350pytorchcv
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用xlm-roberta-large作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view
280pytorchnlp
17点人体关键点检测模型 输入一张人物图像,实现端到端的人体关键点检测,输出视频中每一帧图像人体的17点人体3D关键点坐标。 17点人体关键点 3D人体关键点系列模型 HDForm
310pytorchcv
UniASR 模型介绍 模型描述 UniASR 模型是一种2遍刷新模型(Two pass)端到端语音识别模型。日益丰富的业务需求,不仅要求识别效果精度高,而且要求能够实时地进行语音识别。一方面,离线语
490pytorchaudio
UniASR 模型介绍 模型描述 UniASR 模型是一种2遍刷新模型(Two pass)端到端语音识别模型。日益丰富的业务需求,不仅要求识别效果精度高,而且要求能够实时地进行语音识别。一方面,离线语
440pytorchaudio
商品图像特征模型介绍 本模型是对商品图像进行表征向量提取,用户可基于表征向量进行大规模的同款/相似款商品搜索;无需额外输入,模型可自动进行箱包商品的主体抠图,并基于主体提取结果完成表征向量提取。 模型
210pytorchcv
English  |   中文 Building the Next Generation of Open-Source and
290
English  |   中文 Building the Next Generation of Open-Source and
320
Vicuna Model Card Model Details Vicuna is a chat assistant trained by fine-tuning Llama 2 on user-sh
370pytorch
当前共161669个项目
×
寻找源码
源码描述
联系方式
提交