实时猫脸检测模型 输入一张图像,对其中的猫脸进行检测,输出图片中所有目标的检测框、置信度和标签及关键点。 视觉模型边缘+端侧部署指南 阿里云免费0代码开发10+种主流芯片的c++硬件加速SDK/性
740pytorchcv
OpenBuddy - Open Multilingual Chatbot GitHub and Usage Guide: https://github.com/OpenBuddy/OpenBuddy
370
CAM++说话人识别模型 CAM++模型是基于密集连接时延神经网络的说话人识别模型。相比于一些主流的说话人识别模型,比如ResNet34和ECAPA-TDNN,CAM++具有更准确的说话人识别性能和更
540pytorchaudio
Stable Diffusion v1-5 Model Card Stable Diffusion is a latent text-to-image diffusion model capable
330pytorchmm
模型描述 (Model Description) StableSR是一种利用预训练文生图扩散模型中封装的先验知识进行盲超分的图像超分方法。该方法通过使用time-aware encoder,在不改变预
760pytorchcv
模型介绍 孙思邈, 唐代医药学家、道士, 被后人尊称为"药王". 其十分重视民间的医疗经验, 不断积累走访, 及时记录下来, 写下著作《千金要方》. 唐朝建立后, 孙思邈接受朝廷的邀请, 与政府合作
510pytorchnlp
VideoComposer Official repo for VideoComposer: Compositional Video Synthesiswith with Motion Control
400pytorchmulti-modal
Ziya-LLaMA-13B-v1.1 Main Page:Fengshenbang Github: Fengshenbang-LM 姜子牙系列模型 Ziya-LLaMA-13B-v1.1 Zi
410pytorch
ChatPLUG介绍 ChatPLUG是一个开放域对话模型,其接收用户对话历史和对话相关的外部知识、用户人设、模型人设信息,输出合适的文本回复。 该模型基于PLUG,使用亿级互联网社交数据、百科数据预
400pytorchnlp
FAQ问答任务介绍 FAQ问答是智能对话系统(特别是垂直领域对话系统)的核心业务场景,业务专家基于经验或数据挖掘的结果,将用户会频繁问到的业务知识以Q&A的形式维护起来,称之为知识库, 当用户使用对话
610pytorchnlp
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
440pytorchaudio
>>返回卡通化系列模型专题页 卡通系列文生图模型-剪贴画 输入一段文本提示词,实现特定风格卡通图像生成,返回符合文本描述的剪贴风格结果图像。 其生成效果如下所示: (1) 人物生成 (2) 物体场景
490pytorchcv
DeOldify for Video Colorizaiton English Version | 中文版本 Input a grayscale video and automatically out
420pytorchcv
Highlights UniASR葡萄牙语语音识别模型,可对近场、低噪、正常语速、朗读形式的葡萄牙语音频进行语音识别: ASR模型:UniASR模型,葡萄牙语语音识别模型。 ITN模型:葡萄牙语IT
990pytorchaudio
基于连续语义增强的神经机器翻译模型介绍 本模型基于邻域最小风险优化策略,backbone选用先进的transformer-base模型,编码器和解码器深度分别为24和6,相关论文已发表于ACL 202
420tensorflownlp
Bert实体向量-中文-通用领域-base 实体链接旨在区分文本中的mention和大规模知识图谱中实体的对应关系,也是自然语言处理(NLP)领域的基础问题,在很多对话、检索、关系抽取等下游任务中发挥
480pytorchnlp
CodeGeeX: 多语言代码生成\翻译模型 CodeGeeX是一个具有130亿参数的多编程语言代码生成预训练模型。CodeGeeX采用华为MindSpore框架实现,在鹏城实验室“鹏城云脑II”中的
390pytorchnlp
MTTR视频目标分割模型介绍 本模型使用RoBERTa-base和video swin transformer分别来提取输入的文本特征和视频特征,并给出视频中由此文本指定的物体mask。 本模型的生成
480pytorchcv
基于连续语义增强的神经机器翻译模型介绍 本模型基于邻域最小风险优化策略,backbone选用先进的transformer-base模型,编码器和解码器深度分别为24和6,相关论文已发表于ACL 202
410tensorflownlp
OFA-文本生成图像 (英文) 文本生成图像是什么? 文本生成图像即根据输入的文本,生成与文本描述一致的图像。在本模型中,OFA将根据给定文本输出分辨率为256*256的图片。 注1:OFA实现文本生
370pytorchmulti-modal
当前共161988个项目
×
寻找源码
源码描述
联系方式
提交