Vintedois (22h) Diffusion 由 Predogl 和 piEsposito 利用开源的模型权重、配置文件、prompts训练而来。 该模型在大量高质量图像上训练,只需要简单的pr
390pytorchtext2image generation
VoP: 通用跨模态视频检索模型-系列-partial 论文 [点击阅读] 为了对 VoP 进行全方位验证,我们复现了一系列对比方法并纳入VoP的代码架构。这些其他研究者公布的模型也有非常高的使用价值
670pytorchcv
VoP: 通用跨模态视频检索模型-系列-proj 论文 [点击阅读] 为了对 VoP 进行全方位验证,我们复现了一系列对比方法并纳入VoP的代码架构。这些其他研究者公布的模型也有非常高的使用价值,且可
560pytorchcv
VoP: 通用跨模态视频检索模型-系列-bias 论文 [点击阅读] 为了对 VoP 进行全方位验证,我们复现了一系列对比方法并纳入VoP的代码架构。这些其他研究者公布的模型也有非常高的使用价值,且可
440pytorchcv
Randeng-T5-784M-MultiTask-Chinese Github: Fengshenbang-LM Docs: Fengshenbang-Docs 简介 Brief Introdu
480pytorchText2Text Generation
Randeng-T5-784M-QA-Chinese T5 for Chinese Question Answering Github: finetune and predict codes in
600pytorchRougeL
FAQ问答任务介绍 FAQ问答是智能对话系统(特别是垂直领域对话系统)的核心业务场景,业务专家基于经验或数据挖掘的结果,将用户会频繁问到的业务知识以Q&A的形式维护起来,称之为知识库, 当用户使用对话
550pytorchnlp
FAQ问答任务介绍 FAQ问答是智能对话系统(特别是垂直领域对话系统)的核心业务场景,业务专家基于经验或数据挖掘的结果,将用户会频繁问到的业务知识以Q&A的形式维护起来,称之为知识库, 当用户使用对话
600pytorchnlp
Portrait+ 本模型利用dreambooth方法微调Stable Diffusion 1.5而来,数据集为中近距离的人像照片。 在prompt中加入portrait+ style以实现该效果(
380pytorchtext2image generation
Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能,可直接对时长为数小时音频进行识别,并输出带标点文字与时间戳: ASR模型:Paraformer-
660pytorchaudio
CoROM语义相关性-英文-通用领域模型介绍 文本检索是信息检索领域的核心问题, 其在很多信息检索、NLP下游任务中发挥着非常重要的作用。 近几年, BERT等大规模预训练语言模型的出现使得文本表示效
400pytorchnlp
Analog Diffusion 本模型利用dreambooth方法微调Stable Diffusion 1.5而来,数据集为胶片摄影数据集。 在prompt中加入analog style 以实现胶
320pytorchtext2image generation
AdaInt: Learning Adaptive Intervals for 3D Lookup Tables on Real-time Image Enhancement 模型描述 该模型为图像色
350pytorchcv
图像去色带介绍 输入由于色彩精度不够存在色带的图片,返回去除色带后的图片。模型使用RealESRAGN网络结构进行训练,能实现较好的去除色带效果。 模型描述 在Debanding数据集的基础之上,采用
580pytorchcv
视频全景分割 给定一个输入视频,输出视频每一帧的全景分割掩膜,类别,分数(虚拟分数),矩形框和跟踪的id。 与图像全景分割不同之处在于视频全景分割能够得到每个物体跟踪的id。 全景分割是要分割出图像中
500pytorchcv
>>返回卡通化系列模型专题页 卡通系列文生图模型-扁平风 输入一段文本提示词,实现特定风格卡通图像生成,返回符合文本描述的扁平风格结果图像。 其生成效果如下所示: (1) 人物生成 (2) 物体场景
600pytorchcv
>>返回卡通化系列模型专题页 卡通系列文生图模型-水彩风 输入一段文本提示词,实现特定风格卡通图像生成,返回符合文本描述的水彩风格结果图像。 其生成效果如下所示: (1) 人物生成 (2) 物体场景
370pytorchcv
>>返回卡通化系列模型专题页 卡通系列文生图模型-漫画风 输入一段文本提示词,实现特定风格卡通图像生成,返回符合文本描述的漫画风格结果图像。 其生成效果如下所示: (1) 人物生成 (2) 物体场景
460pytorchcv
17点人体关键点检测模型 输入一段包含人物的视频,实现端到端的人体关键点检测,输出视频中每一帧图像人体的17点人体3D关键点坐标。 3D人体关键点系列模型 HDFormer Cann
500pytorchcv
基于视觉和语言的知识蒸馏的开放词汇目标检测模型介绍 模型描述 利用视觉和语言的知识蒸馏提取来学习开放词汇目标检测,提出了一种从开放词汇图像分类模型中知识蒸馏的开放词汇检测方法ViLD,ViLD是第一个
540tensorflowcv
当前共162911个项目
×
寻找源码
源码描述
联系方式
提交