系统开发_APP小程序平台开发-程序员客栈

全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

vintedois-diffusion-v0-1

Vintedois (22h) Diffusion 由 Predogl 和 piEsposito 利用开源的模型权重、配置文件、prompts训练而来。该模型在大量高质量图像上训练，只需要简单的pr

390pytorchtext2image generation

VoP: 通用跨模态视频检索模型-系列-partial

VoP: 通用跨模态视频检索模型-系列-partial 论文 [点击阅读] 为了对 VoP 进行全方位验证，我们复现了一系列对比方法并纳入VoP的代码架构。这些其他研究者公布的模型也有非常高的使用价值

670pytorchcv

VoP: 通用跨模态视频检索模型-系列-proj

VoP: 通用跨模态视频检索模型-系列-proj 论文 [点击阅读] 为了对 VoP 进行全方位验证，我们复现了一系列对比方法并纳入VoP的代码架构。这些其他研究者公布的模型也有非常高的使用价值，且可

560pytorchcv

VoP: 通用跨模态视频检索模型-系列-bias

VoP: 通用跨模态视频检索模型-系列-bias 论文 [点击阅读] 为了对 VoP 进行全方位验证，我们复现了一系列对比方法并纳入VoP的代码架构。这些其他研究者公布的模型也有非常高的使用价值，且可

440pytorchcv

燃灯-T5-784M-多任务-中文

Randeng-T5-784M-MultiTask-Chinese Github: Fengshenbang-LM Docs: Fengshenbang-Docs 简介 Brief Introdu

480pytorchText2Text Generation

燃灯-T5-784M-问答-中文

Randeng-T5-784M-QA-Chinese T5 for Chinese Question Answering Github: finetune and predict codes in

600pytorchRougeL

MGIMN FAQ问答-中文-政务领域-base

FAQ问答任务介绍 FAQ问答是智能对话系统(特别是垂直领域对话系统)的核心业务场景，业务专家基于经验或数据挖掘的结果，将用户会频繁问到的业务知识以Q&A的形式维护起来，称之为知识库，当用户使用对话

550pytorchnlp

MGIMN FAQ问答-中文-金融领域-base

600pytorchnlp

人像生成模型plus

Portrait+ 本模型利用dreambooth方法微调Stable Diffusion 1.5而来，数据集为中近距离的人像照片。在prompt中加入portrait+ style以实现该效果（

380pytorchtext2image generation

UniASR语音识别-波斯语-通用-16k

Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能，可直接对时长为数小时音频进行识别，并输出带标点文字与时间戳： ASR模型：Paraformer-

660pytorchaudio

CoROM语义相关性-英文-通用领域-tiny

CoROM语义相关性-英文-通用领域模型介绍文本检索是信息检索领域的核心问题, 其在很多信息检索、NLP下游任务中发挥着非常重要的作用。近几年, BERT等大规模预训练语言模型的出现使得文本表示效

400pytorchnlp

胶片质感扩散生成模型

Analog Diffusion 本模型利用dreambooth方法微调Stable Diffusion 1.5而来，数据集为胶片摄影数据集。在prompt中加入analog style 以实现胶

320pytorchtext2image generation

Adaptive-Interval-3DLUT图像调色

AdaInt: Learning Adaptive Intervals for 3D Lookup Tables on Real-time Image Enhancement 模型描述该模型为图像色

350pytorchcv

RealESRGAN图像去色带

图像去色带介绍输入由于色彩精度不够存在色带的图片，返回去除色带后的图片。模型使用RealESRAGN网络结构进行训练，能实现较好的去除色带效果。模型描述在Debanding数据集的基础之上，采用

580pytorchcv

视频全景分割-VideoKNet-SwinB

视频全景分割给定一个输入视频，输出视频每一帧的全景分割掩膜，类别，分数（虚拟分数），矩形框和跟踪的id。与图像全景分割不同之处在于视频全景分割能够得到每个物体跟踪的id。全景分割是要分割出图像中

500pytorchcv

卡通系列文生图模型-扁平风

>>返回卡通化系列模型专题页卡通系列文生图模型-扁平风输入一段文本提示词，实现特定风格卡通图像生成，返回符合文本描述的扁平风格结果图像。其生成效果如下所示： (1) 人物生成 (2) 物体场景

600pytorchcv

卡通系列文生图模型-水彩风

>>返回卡通化系列模型专题页卡通系列文生图模型-水彩风输入一段文本提示词，实现特定风格卡通图像生成，返回符合文本描述的水彩风格结果图像。其生成效果如下所示： (1) 人物生成 (2) 物体场景

370pytorchcv

卡通系列文生图模型-漫画风

>>返回卡通化系列模型专题页卡通系列文生图模型-漫画风输入一段文本提示词，实现特定风格卡通图像生成，返回符合文本描述的漫画风格结果图像。其生成效果如下所示： (1) 人物生成 (2) 物体场景

460pytorchcv

HDFormer人体关键点-通用领域-3D

17点人体关键点检测模型输入一段包含人物的视频，实现端到端的人体关键点检测，输出视频中每一帧图像人体的17点人体3D关键点坐标。 3D人体关键点系列模型 HDFormer Cann

500pytorchcv

基于视觉和语言的知识蒸馏的开放词汇目标检测

基于视觉和语言的知识蒸馏的开放词汇目标检测模型介绍模型描述利用视觉和语言的知识蒸馏提取来学习开放词汇目标检测，提出了一种从开放词汇图像分类模型中知识蒸馏的开放词汇检测方法ViLD，ViLD是第一个

540tensorflowcv

当前共162911个项目

...8140 8141 8142 8143 8144 8145 8146

登录后即可上传、下载作品

搜索

分类

html 文创旅游物联网 uniapp 服务器端JavaScript 金融 Ruby 直播工业软件

重点城市程序员兼职推荐

重点岗位程序员兼职推荐