通用超轻量级检测模型 通用超轻量级检测目标检测的子任务,本模型为高性能通用实时检测模型,提供快速、精确的目标检测能力。 See the world fast and accurately! 模型描述
590pytorchcv
OFA-图片分类 (ImageNet-1K) ImageNet-1K图片分类 ImageNet-1K图片分类任务:给定一张图片,要求模型从1K个候选类别中正确给出图片分类标签。 快速玩起来 玩转OFA
510pytorchmulti-modal
商品评价解析模型介绍 商品评价解析模型是在hfl/chinese-roberta-wwm-ext预训练模型的基础上,结合自研DIRECT模型,用10%商品评价解析数据集(训练集11.7w,验证集1.3
690pytorchnlp
英语逆文本正则化模型 模型描述 英语逆文本正则化模型是基于FunTextProcessing开源代码库生成,用于英语语音识别模型结果后处理中的逆文本正则化部分。 多语言逆文本正则化&文本正则化 逆文本
680pytorchaudio
孟子T5预训练生成模型-中文-base-多任务 孟子T5多任务模型在mengzi-t5-base的基础上,进一步使用27个数据集和301种prompt进行了多任务的混合训练。 关于孟子T5预训练生成模
1060pytorchnlp
动作识别模型介绍 模型描述 Patch Shift Transformers(PST) 是在2D Swin-Transformer的基础上,增加temporal建模能力,使网络具备视频时空特征学习能力
830pytorchcv
FSMN远场唤醒模型介绍 问题背景 关键词检测(keyword spotting, KWS),即我们通常所说的语音唤醒,指的是一系列从实时音频流中检测出若干预定义关键词的技术。随着远讲免提语音交互(d
620pytorchaudio
电商领域StructBERT中文文本相似度模型介绍 电商领域StructBERT中文文本相似度模型是在structbert-base-chinese预训练模型的基础上,使用电商领域标注数据训练出来的相
770pytorchnlp
读光文字检测 News 2023年6月: 新增轻量化端侧行检测模型和行识别模型 2023年3月: 新增DBNet训练/微调流程,支持自定义参数及数据集,详见代码示例。 2023年2月: 新增业界主流
1070tensorflowcv
CAM++说话人识别模型 CAM++模型是基于密集连接时延神经网络的说话人识别模型,具有准确的说话人识别效果和更快的推理速度。该模型使用大规模的中英文说话人数据集进行训练,适用于中英文语种的说话人识别
560pytorchaudio
BERT base model (uncased) Pretrained model on English language using a masked language modeling (MLM
420
ERes2Net 说话人识别模型 ERes2Net模型是在Res2Net的基础上,对全局和局部特征进一步融合,从而提高说话人识别性能。局部特征融合将一个单一残差块内的特征融合提取局部信号;全局特征融合
630pytorchaudio
基础视觉模型高效调优:Adapter 基于大规模预训练基础模型的参数高效迁移学习方法在各种下游应用中均取得了优异的表现,其中包括了利用Adapter进行调优的方法。该方法通过额外添加了类bottlen
540pytorchcv
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
540pytorchaudio
全身133点关键点检测模型 输入一张人物图像,端到端检测全身133点关键点,输出人体框和对应的全身关键点,包含68个人脸关键点、42个手势关键点、17个骨骼关键点和6个脚部关键点。 133点人体关键点
2320pytorchcv
OFA-视觉问答(英文) News 2023年2月: 优化了finetune流程,支持参数更新、自定义数据及脚本分布式训练等,见finetune示例。 2022年11月: 新增OFA Tutoria
550pytorchmulti-modal
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用StructBERT作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-View Traini
520pytorchnlp
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用StructBERT作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view Traini
730pytorchnlp
TL; DL 为RAG而生-BCEmbedding技术报告 本项目是bce-embedding-base_v1)的国内模型权重下载通道,原模型开源地址huggingface。 使用方式: git c
950
实时交通标识检测-自动驾驶领域 模型介绍 本模型为高性能热门应用系列检测模型中的 实时交通标识检测模型,基于面向工业落地的高性能检测框架DAMOYOLO,其精度和速度超越当前经典的YOLO系列方法。
790pytorchcv
当前共162049个项目
×
寻找源码
源码描述
联系方式
提交