AI

RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用xlm-roberta-large作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view
320pytorchnlp
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用XLM-RoBERTa作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view Train
300pytorchnlp
Yi Vision Language Model Better Bilingual Multimodal Model ? Hugging Face • ? ModelScope • ? w
310
Segformer-B3语义分割模型介绍 其它相关模型体验Mask2Former-R50全景分割 模型描述 Neurips2021文章SegFormer: Simple and Efficient
420pytorchcv
Regularized DINO 自监督说话人识别模型 RDINO模型是基于时延神经网络构建的自监督说话人模型,可用于说话人确认、说话人日志等任务。 模型结构简述 Regularized DINO使用
330pytorchaudio
西班牙语逆文本正则化模型 模型描述 西班牙语逆文本正则化模型是基于FunTextProcessing开源代码库生成,用于西班牙语语音识别模型结果后处理中的逆文本正则化部分。 多语言逆文本正则化&文本正
500pytorchaudio
菲律宾语逆文本正则化模型 模型描述 菲律宾语逆文本正则化模型是基于FunTextProcessing 开源代码库生成,用于菲律宾语语音识别模型结果后处理中的逆文本正则化部分。 多语言逆文本正则化&文本
480pytorchaudio
印尼语逆文本正则化模型 模型描述 印尼语逆文本正则化模型是基于FunTextProcessing 开源代码库生成,用于印尼语语音识别模型结果后处理中的逆文本正则化部分。 多语言逆文本正则化&文本正则化
340pytorchaudio
BRIA Background Removal v1.4 Model Card RMBG v1.4 is our state-of-the-art background removal model,
380remove background
法语逆文本正则化模型 模型描述 法语逆文本正则化模型是基于FunTextProcessing开源代码库生成,用于法语语音识别模型结果后处理中的逆文本正则化部分。 多语言逆文本正则化&文本正则化 逆文本
570pytorchaudio
基于ERes2Net-Large和聚类的说话人日志系统 输入一段多人对话的音频,本模型可以自动的识别音频中的对话人数,并且对其进行区分,适合用于客服对话、会议讨论、采访等场景,该系统配合语音识别可进一
1250pytorchaudio
UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调,研究人员和开发人员可以更方便地进行语音识别模型
320pytorchaudio
DINO-高精度目标检测模型介绍 本模型为基于DINO算法的高精度目标检测模型。 模型描述 DINO模型算法框架图如下,是改进的DETR系列模型。 期望模型使用方式以及适用范围 该模型适用于通用图像
460pytorchcv
Yi Vision Language Model Better Bilingual Multimodal Model ? Hugging Face • ? ModelScope • ? w
250
Highlights UniASR西班牙语语音识别模型,可对近场、低噪、正常语速、朗读形式的西班牙语音频进行语音识别: ASR模型:UniASR模型,西班牙语语音识别模型。 ITN模型:西班牙语IT
570pytorchaudio
Highlights 英文会议对话场景,端到端说话人日志模型,解决 "who spoke when" ICASSP 2023,在 Callhome 数据集上获得 SOTA 结果。 支持功能: 给定若
730pytorchaudio
基础视觉模型高效调优:Prefix 基于大规模预训练基础模型的参数高效迁移学习方法在各种下游应用中均取得了优异的表现,其中包括了利用Prefix进行调优的方法。该方法对多头注意力层中生成的key和va
460pytorchcv
ROM语义相关性-中文-医疗领域模型介绍 文本检索是信息检索领域的核心问题, 其在很多信息检索、NLP下游任务中发挥着非常重要的作用。 近几年, BERT等大规模预训练语言模型的出现使得文本表示效果有
290pytorchnlp
Reranker More details please refer to our Github: FlagEmbedding. Model List Usage Fine-tuning Evalu
530pytorch
Highlights 新增基于ModelScope的微调 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调,研究人员
530pytorchaudio
当前共6731个项目
×
寻找源码
源码描述
联系方式
提交