AI

Please use 'Bert' related functions to load this model! This repository contains the resources in ou
280pytorchbert
三井绘蓝 Mitsua Diffusion CC0 三井绘蓝 Mitsua Diffusion CC0 是一个基于隐空间的文生图模型,它的UNet完全从零开始训练,使用的数据是公开的、CC0的或是允许
290pytorchtext2image generation
动漫图像扩散生成模型 EimisAnimeDiffusion 本模型使用具有高质量和丰富细节的动漫图像训练而来。 Sample generations 本模型擅长生成动漫人物和风景。 一些示例如下:
350pytorchtext2image generation
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
520pytorchaudio
The Medkit-Learn(ing) Environment Alex J. Chan, Ioana Bica, Alihan Huyuk, Daniel Jarrett, and Mihael
250
基于StructBERT的中文口语Base预训练模型介绍 StructBERT的中文Large预训练模型是使用wikipedia数据和masked language model任务训练的中文自然语言理
260pytorchnlp
VoP: 通用跨模态视频检索模型-系列-bias 论文 [点击阅读] 为了对 VoP 进行全方位验证,我们复现了一系列对比方法并纳入VoP的代码架构。这些其他研究者公布的模型也有非常高的使用价值,且可
340pytorchcv
VoP: 通用跨模态视频检索模型-系列-proj 论文 [点击阅读] 为了对 VoP 进行全方位验证,我们复现了一系列对比方法并纳入VoP的代码架构。这些其他研究者公布的模型也有非常高的使用价值,且可
450pytorchcv
二次元女性角色生成器 waifu-diffusion v1.4 waifu-diffusion 基于latent diffusion模型打造,使用大量高质量动漫图片微调而来。 masterpiece
470pytorchtext2image generation
多风格生成扩散模型 Nitro Diffusion 欢迎使用Nitro Diffusion - 第一个从零训练的多风格模型!这是一个经过微调的Stable Diffusion模型,同时训练了三种艺术风
520pytorchtext2image generation
模型描述 这里我们提供基于SOLIDER框架训练的通用人体预训练大模型:SOLIDER-Base。SOLIDER是一个专门用于支持各种人体任务的视觉预训练框架。在现今的各种视觉智能场景中,对图像中人的
430
Vintedois (22h) Diffusion 由 Predogl 和 piEsposito 利用开源的模型权重、配置文件、prompts训练而来。 该模型在大量高质量图像上训练,只需要简单的pr
280pytorchtext2image generation
模型描述 NFL Health & Safety - Helmet Assignment 是Kaggle上的一个热门竞赛,由于其高额的奖金和极富挑战的任务设置吸引了许多实力强劲的队伍参与竞争。NFL
360pytorchcv
Please use 'Bert' related functions to load this model! This repository contains the resources in ou
200pytorchbert
Randeng-T5-784M-MultiTask-Chinese Github: Fengshenbang-LM Docs: Fengshenbang-Docs 简介 Brief Introdu
400pytorchText2Text Generation
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
500pytorchaudio
视频实例分割 给定一个输入视频,输出视频每一帧的实例分割掩膜,类别,分数(虚拟分数),矩形框和跟踪的id。 实例分割是要分割出图像中的things。things是指可数的物体,例如人,车,猫等。
430pytorchcv
SOONet: 基于自然语言输入的长视频时序片段定位 论文链接 模型描述 SOONet是第一个端到端的长视频时序定位框架。不同于现有基于滑动窗口的方法需要将长视频切割成多个短视频进行重复推理,SOO
710pytorchmulti-modal
Highlights UniASR语音识别-中文-金融-8k模型是在1000小时金融数据上微调的领域模型,使用词表3445vocab。 Release Notes 2023年3月(3月16号发布
1160pytorchaudio
VoP: 通用跨模态视频检索模型-系列-partial 论文 [点击阅读] 为了对 VoP 进行全方位验证,我们复现了一系列对比方法并纳入VoP的代码架构。这些其他研究者公布的模型也有非常高的使用价值
540pytorchcv
当前共6731个项目
×
寻找源码
源码描述
联系方式
提交