全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

AI

openbuddy-mistral-7b-v13.1

OpenBuddy - Open Multilingual Chatbot GitHub and Usage Guide: https://github.com/OpenBuddy/OpenBuddy

420pytorchMultilingual

Yi-34B-Chat-8bits

English | 中文 Building the Next Generation of Open-Source and

350

Siamfc视频单目标跟踪-通用领域-S

单目标跟踪算法模型介绍对于一个输入视频，只需在第一帧图像中用矩形框指定待跟踪目标，单目跟踪算法将在整个视频帧中持续跟踪该目标，输出跟踪目标在所有图像帧中的矩形框信息。模型描述本模型是基于Sia

380pytorchcv

语音合成-中文-通用领域-16k-发音人aixiang

Sambert-Hifigan模型介绍框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用，故此处仅涉及参数法。参数TTS系统可分为两

350pytorchaudio

语音合成-中文-通用领域-16k-发音人zhishuo

330pytorchaudio

逆境清醒_人像卡通化模型-白化手绘效果test

人像卡通化模型-白化手绘效果输入一张人物图像，实现端到端全图卡通化转换，生成手绘风格虚拟形象，返回风格化后的结果图像。原图效果如下所示：其生成效果如下所示：模型描述该任务采用一种全新的域

490cv

CSANMT连续语义增强机器翻译-英俄-通用领域-base

基于连续语义增强的神经机器翻译模型介绍本模型基于邻域最小风险优化策略，backbone选用先进的transformer-base模型，编码器和解码器深度分别为24和6，相关论文已发表于ACL 202

460tensorflownlp

无人机小目标检测-VisDrone

模型描述无人机俯拍图像由于其空中拍摄的独特视角，能够对道路、交通等场景进行完整的呈现,对无人机的图像数据进行检测分析具有重要的应用价值。在此，我们提供基于DAMO-YOLO的无人机小目标检测场景模型

850pytorchcv

CAM++语种识别-中英粤日韩识别-8k

CAM++识别模型 CAM++模型是基于密集连接时延神经网络的识别模型。相比于一些主流模型，比如ResNet34和ECAPA-TDNN，CAM++具有更准确的识别性能和更快的推理速度。该模型可以用于语

360pytorchaudio

中文对话0.2B小模型

# 中文对话0.2B小模型 ChatLM-Chinese-0.2B 中文 | [English](https://github.com/charent/ChatLM-mini-Chinese/

370pytorchnlp

ViDT标识检测模型

ViDT标识检测模型基于ViDT系列算法训练的标识检测模型，支持对台标、车标、交通、品牌等常见标识的检测。输入一张图片，返回标识所在的位置。本项目实现的模型为ViDT+，采用的Backbone为S

330pytorchcv

UniASR语音识别-波斯语-通用-16k-离线

Highlights UniASR波斯语语音识别模型，可对近场、低噪、正常语速、朗读形式的波斯语音频进行语音识别： ASR模型：UniASR模型，波斯语语音识别模型。 VAD模型：语音端点检查VAD

410pytorchaudio

实时变声

Retrieval-based-Voice-Conversion-WebUI 一个基于VITS的简单易用的变声框架 [![madewithlove](https://img.shields.io/b

1000

nomic-embed-text-v1

nomic-embed-text-v1: A Reproducible Long Context (8192) Text Embedder nomic-embed-text-v1 is 8192 co

450pytorchfeature-extraction

sdxl-vae-fp16-fix

SDXL-VAE-FP16-Fix SDXL-VAE-FP16-Fix is the SDXL VAE*, but modified to run in fp16 precision without

360stable-diffusion

SDXL-Lightning

SDXL-Lightning SDXL-Lightning is a lightning-fast text-to-image generation model. It can generate h

470pytorchtext-to-image

语音合成-中文-通用领域-16k-发音人zhiyuan

340pytorchaudio

Regularized DINO说话人确认-中文-CNCeleb-16k

CN-Celeb RDINO 说话人识别模型 RDINO模型是基于时延神经网络构建的自监督说话人模型，可用于说话人确认、说话人日志等任务。模型简述 Regularized DINO使用使用teach

1080pytorchaudio

mPLUG-Owl-多模态对话-英文-7B

mPLUG-Owl介绍 mPLUG-Owl是一种面向多模态语言模型的模块化的训练范式。其能学习与语言空间相适应的视觉知识，并支持在多模态场景(支持图片、文本输入)下进行多轮对话。它涌现多图关系理解，场

430pytorchmulti-modal

PhotoMaker

PhotoMaker Model Card [**Project Page**](https://photo-maker.github.io/) **|** [**Paper (ArXiv)**]

330

当前共6731个项目

...270 271 272 273 274 275 276 277 278 279 280 ...

登录后即可上传、下载作品

搜索

分类

任务/项目管理 Atom 插件网页(Webview)Qt Delphi/Pascal React 门户平台PORTAL 政府文化 IM/聊天/语音工具服务框架/平台

AI

重点城市程序员兼职推荐

重点岗位程序员兼职推荐