全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

pytorch

stable-diffusion-xl-refiner-1.0

SD-XL 1.0-refiner Model Card Modelscope Usage from modelscope.utils.constant import Tasks from mode

270pytorchmm

基于频域融合的人像图片生成

该模型当前使用的是默认介绍模版，处于“预发布”阶段，页面仅限所有者可见。请根据模型贡献文档说明，及时完善模型卡片内容。ModelScope平台将在模型卡片完善后展示。谢谢您的理解。 Clone wi

430cv

MossFormer语音分离-两人-8k-funasr

MossFormer语音分离模型介绍我们日常可能会遇到在嘈杂环境中进行语言交流的场景，比如在人多的餐厅里或者拥挤的人群中，同时存在着许多不同的说话人的声音，这时听者可能只对一个主说话人的声音感兴趣，

3070pytorchaudio

openbuddy-atom-13b-v9-bf16

OpenBuddy - Open Multilingual Chatbot GitHub and Usage Guide: https://github.com/OpenBuddy/OpenBuddy

350

PAI中文Diffusion模型-动漫

Chinese Diffusion Model (Anime, 512 Resolution) 简介 Brief Introduction 我们开源了一个中文 Diffusion 模型，您可以直接输入

290pytorchstable-diffusion

LayoutDM布局生成-通用领域

模型描述 (Model Description) 这是布局生成方法LayoutDM的官方实现。 Top: LayoutDM is trained to gradually gene

340pytorchcv

菜鸟视觉算法-文字识别-文本行识别模型-中英

文字识别模型介绍文字识别，即给定一张文本图片，识别出图中所含文字并输出对应字符串。本模型用于通用场景(不包含手写场景)的文字识别任务。欢迎使用！模型描述本模型主要包括两个主要部分，统一卷积与

370pytorchcv

so-vits-svc

# SoftVC VITS Singing Voice Conversion [**English**](./README.md) | [**中文简体**](./README_zh_CN.md)

410

MDQE视频实例分割

模型描述 (Model Description) MDQE (Mining Discriminative Query Embeddings) (CVPR2023) 是一种视频实例分割算法，对视频中遮挡

330pytorchcv

control-lora

Control-LoRA Model Card Introduction By adding low-rank parameter efficient fine tuning to ControlNe

400pytorchtext-to-image

multi-modal_mplug_owl_bilingual_multimodal-dialogu

mPLUG-Owl介绍 mPLUG-Owl是一种面向多模态语言模型的模块化的训练范式。其能学习与语言空间相适应的视觉知识，并支持在多模态场景(支持图片、文本输入)下进行多轮对话。它涌现多图关系理解，场

420pytorchmulti-modal

openbuddy-falcon-40b-v9-bf16

OpenBuddy - Open Multilingual Chatbot GitHub and Usage Guide: https://github.com/OpenBuddy/OpenBuddy

310

SOND说话人日志-英文-swbd_sre-8k-离线-pytorch

Highlights 英文会议对话场景，端到端说话人日志预训练模型，解决 "who spoke when"，发表于ICASSP 2023，通过finetune可以在 Callhome 数据集上获得 S

600pytorchaudio

文本绘制扩散模型TextDiffuser-英文-通用领域

文本绘制扩散模型TextDiffuser 扩散模型(Diffusion Models)目前无法在图像中绘制准确清晰的文字内容，而TextDiffuser专注于解决该问题，可以生成与背景融合的带文字的图

410pytorchmulti-modal

FastSAM快速分割一切

Fast Segment Anything Paper ｜ GitHub Fast Segment Anything Model（FastSAM）是一个

860pytorchcv

T2MGPT_文本驱动的人体运动生成

功能概述输入一段英文文本，生成符合文本描述的3D人体运动序列（Skeleton-Based）输入示例： ‘a man is walking ’ 输出示例：输出为环境准备从github下载代

440pytorchcv

openbuddy-openllama-3b-v10-bf16

OpenBuddy - Open Multilingual Chatbot GitHub and Usage Guide: https://github.com/OpenBuddy/OpenBuddy

330pytorch

ELITE图像内容迁移

模型描述 (Model Description) ELITE是一种基于扩散模型实现图像主体保ID内容迁移的算法。该方法借助基于训练的encoder提取原图的语义信息，从而实现保ID的文生图和图像内容迁

390pytorchcv

MasaCtrl图像合成与编辑

MasaCtrl: Tuning-free Mutual Self-Attention Control for Consistent Image Synthesis and Editing M

330

3D人体姿态估计模型

输入一张人体图像，输出人体参数化模型SMPL的pose和shape估计结果，已经对应的vertices，3D关键点。 SMPL模型 pose 维度(24, 3)，包含1个global rota

370pytorch

当前共5187个项目

...250 251 252 253 254 255 256 257 258 259 260

登录后即可上传、下载作品

搜索

分类

建站系统 golang BBS论坛前端 Visual Studio Code 扩展 echarts 日志分析和统计 VR/AR HTML/CSS HTML5开发相关

pytorch

重点城市程序员兼职推荐

重点岗位程序员兼职推荐