pytorch

ChatPLUG介绍 ChatPLUG是一个开放域对话模型,其接收用户对话历史和对话相关的外部知识、用户人设、模型人设信息,输出合适的文本回复。 该模型基于PLUG,使用亿级互联网社交数据、百科数据预
260pytorchnlp
Highlights UniASR德语语音识别模型,可对近场、低噪、正常语速、朗读形式的德语音频进行语音识别: ASR模型:UniASR模型,德语语音识别模型。 ITN模型:德语ITN模型,可用于语
450pytorchaudio
VLDoc文档理解多模态预训练模型介绍 文档理解,即给定一个视觉富文档(visually-rich document),对其自动地分析与处理,包括文档信息抽取、文档版面分析、文档分类与文档VQA等等。
610pytorchmulti-modal
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
450pytorchaudio
ModelScope-FunASR FunASR希望在语音识别方面建立学术研究和工业应用之间的桥梁。通过支持在ModelScope上发布的工业级语音识别模型的训练和微调,研究人员和开发人员可以更方便地
410pytorchaudio
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
360pytorchaudio
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
370pytorchaudio
Paraformer模型介绍 Highlights 新增基于ModelScope的微调 ModelScope-FunASR FunASR希望在语音识别方面建立学术研究和工业应用之间的桥梁。通过支持
480pytorchaudio
Taiyi-Stable-Diffusion-1B-Chinese-v0.1 Github: Fengshenbang-LM Docs: Fengshenbang-Docs API:Fengshen
390pytorchcv
德语逆文本正则化模型 模型描述 德语逆文本正则化模型是基于FunTextProcessing开源代码库生成,用于德语语音识别模型结果后处理中的逆文本正则化部分。 多语言逆文本正则化&文本正则化 逆文本
400pytorchaudio
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用XLM-Roberta作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view Train
330pytorchnlp
室内框架估计算法介绍 输入一张室内空间的全景RGB图像,室内框架估计算法将输出房间的墙线,天花板线跟地线    模型描述 PanoViT 的网络框架可以分为backbone、全景视觉变换器编
280pytorchcv
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用XLM-Roberta作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view Train
360pytorchnlp
Highlights 会议场景端到端说话人日志模型,解决 "who spoke when" 的问题,发表于EMNLP 2022,在AliMeeting数据集上获得SOTA结果。 支持功能: 给定若干
380pytorchaudio
Udever 多语言通用文本表示模型 文本表示是将一个输入句子使用机器学习模型转换为一个固定维度的连续向量: 输入: 吃完海鲜可以喝牛奶吗? 输出: [0.27162,-0.66159,0.3303
300nlp
Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能,可直接对时长为数小时音频进行识别,并输出带标点文字与时间戳: ASR模型:Paraformer-
430pytorchaudio
视频去场纹模型 视频去场纹模型是一种解决隔行扫描导致的场纹问题的技术,它能够自适应地检测输入视频中的场纹,并针对场纹区域进行场纹去除与画面补全,返回画面干净自然的视频结果。 效果展示 以下是在真实网络
350pytorchcv
InternLM-XComposer2 [?Github Repo](https://github.com/InternLM/InternLM-XComposer) InternLM-XC
360
基础视觉模型高效调优:Side-Tuning 基于大规模预训练基础模型的参数高效迁移学习方法在各种下游应用中均取得了优异的表现,其中包括了利用side网络进行调优的方法。该方法仅需训练一个side网络
390pytorchcv
StructBERT中文文本相似度模型介绍 StructBERT中文文本相似度模型是在structbert-base-chinese预训练模型的基础上,用atec、bqcorpus、chineseST
280pytorchnlp
当前共5187个项目
×
寻找源码
源码描述
联系方式
提交