AI

OpenBuddy - Open Multilingual Chatbot GitHub and Usage Guide: https://github.com/OpenBuddy/OpenBuddy
420pytorchMultilingual
English  |   中文 Building the Next Generation of Open-Source and
350
单目标跟踪算法模型介绍 对于一个输入视频,只需在第一帧图像中用矩形框指定待跟踪目标,单目跟踪算法将在整个视频帧中持续跟踪该目标,输出跟踪目标在所有图像帧中的矩形框信息。 模型描述 本模型是基于Sia
380pytorchcv
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
350pytorchaudio
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
330pytorchaudio
人像卡通化模型-白化手绘效果 输入一张人物图像,实现端到端全图卡通化转换,生成手绘风格虚拟形象,返回风格化后的结果图像。 原图效果如下所示: 其生成效果如下所示: 模型描述 该任务采用一种全新的域
490cv
基于连续语义增强的神经机器翻译模型介绍 本模型基于邻域最小风险优化策略,backbone选用先进的transformer-base模型,编码器和解码器深度分别为24和6,相关论文已发表于ACL 202
460tensorflownlp
模型描述 无人机俯拍图像由于其空中拍摄的独特视角,能够对道路、交通等场景进行完整的呈现,对无人机的图像数据进行检测分析具有重要的应用价值。在此,我们提供基于DAMO-YOLO的无人机小目标检测场景模型
850pytorchcv
CAM++识别模型 CAM++模型是基于密集连接时延神经网络的识别模型。相比于一些主流模型,比如ResNet34和ECAPA-TDNN,CAM++具有更准确的识别性能和更快的推理速度。该模型可以用于语
360pytorchaudio
# 中文对话0.2B小模型 ChatLM-Chinese-0.2B 中文 | [English](https://github.com/charent/ChatLM-mini-Chinese/
370pytorchnlp
ViDT标识检测模型 基于ViDT系列算法训练的标识检测模型,支持对台标、车标、交通、品牌等常见标识的检测。输入一张图片,返回标识所在的位置。 本项目实现的模型为ViDT+,采用的Backbone为S
330pytorchcv
Highlights UniASR波斯语语音识别模型,可对近场、低噪、正常语速、朗读形式的波斯语音频进行语音识别: ASR模型:UniASR模型,波斯语语音识别模型。 VAD模型:语音端点检查VAD
410pytorchaudio
Retrieval-based-Voice-Conversion-WebUI 一个基于VITS的简单易用的变声框架 [![madewithlove](https://img.shields.io/b
1000
nomic-embed-text-v1: A Reproducible Long Context (8192) Text Embedder nomic-embed-text-v1 is 8192 co
450pytorchfeature-extraction
SDXL-VAE-FP16-Fix SDXL-VAE-FP16-Fix is the SDXL VAE*, but modified to run in fp16 precision without
360stable-diffusion
SDXL-Lightning SDXL-Lightning is a lightning-fast text-to-image generation model. It can generate h
470pytorchtext-to-image
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
340pytorchaudio
CN-Celeb RDINO 说话人识别模型 RDINO模型是基于时延神经网络构建的自监督说话人模型,可用于说话人确认、说话人日志等任务。 模型简述 Regularized DINO使用使用teach
1080pytorchaudio
mPLUG-Owl介绍 mPLUG-Owl是一种面向多模态语言模型的模块化的训练范式。其能学习与语言空间相适应的视觉知识,并支持在多模态场景(支持图片、文本输入)下进行多轮对话。它涌现多图关系理解,场
430pytorchmulti-modal
PhotoMaker Model Card [**Project Page**](https://photo-maker.github.io/) **|** [**Paper (ArXiv)**]
330
当前共6731个项目
×
寻找源码
源码描述
联系方式
提交