AI

轻量级快速图像特征点匹配介绍 模型描述 本模型基于ICCV2023 LightGLue 算法,是 SuperGlue 算法的加强版本,内存占用更小,计算效率和精度更高。 技术细节请见: LightGL
350cv
Highlights 适用于中英文的语音量化编码(Speech Codec)模型,在大规模内部数据上训练得到,适用于多领域场景。 更低的比特率 更高的量化语音质量 训练时采用结构化 dropout,
560pytorchaudio
SD-Turbo Model Card SD-Turbo is a fast generative text-to-image model that can synthesize photorea
300
Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personlized Stylization 图像超分辨率
450pytorchcv
Ziya2-13B-Chat Main Page:Fengshenbang Github: Fengshenbang-LM 姜子牙系列模型 Ziya-LLaMA-13B-v1.1 Ziya-LL
430nlp
浦语·灵笔 InternLM-XComposer ? ?   | InternLM-XComposer-VL ? ?   | Technical Report ? [
530pytorch
创意艺术字设计 (WordArt Designer) 模型描述 创意艺术字设计 (WordArt Designer)是一个基于用户驱动,依赖于大型语言模型(LLMs)的艺术字生成框架系统。该
370pytorchcv
实时人头人体检测模型 输入一张图像,对其中的人头人体进行检测,输出图片中所有目标的检测框、置信度和标签。 视觉模型边缘+端侧部署指南 阿里云免费0代码开发10+种主流芯片的c++硬件加速SDK/性
380pytorchcv
ECAPA-TDNN说话人模型 ECAPA-TDNN模型是基于时延神经网络构建的说话人模型,由于识别性能优异,已经被广泛使用在说话人识别领域中,还可用于说话人日志和语种识别等任务。 模型结构简述 EC
560pytorchaudio
tasks: 知识图谱 时序图数据库 命名实体识别 关系抽取 事件抽取 属性抽取 安装包下载 git clone https://www.modelscope.cn/AbutionGraph/a
240知识图谱
OpenBuddy - Open Multilingual Chatbot GitHub and Usage Guide: https://github.com/OpenBuddy/OpenBuddy
390pytorchMultilingual
?‍? Github • ? Hugging Face• ? ModelScope • ? WeChat• ?Tech Report [?天工在线对话平台已正式向公众开放](https://
370skywork
Qwen-1.8B-Chat-Int4 ? Hugging Face   |   ? ModelScope   |    ? Paper    |   ?️ Demo
440pytorchqwen
DreamTalk: When Expressive Talking Head Generation Meets Diffusion Probabilistic Models DreamTalk
380pytorch
星语StarWhisper ? GitHub项目 ? 绘画权重 在国家天文台人工智能工作组的支持下,基于天文大模型StarGLM开发经验,我们进一步训练了星语StarWhisper系列模型(包括
1210qwen
CogVLM CogVLM 是一个强大的开源视觉语言模型(VLM)。CogVLM-17B 拥有 100 亿视觉参数和 70 亿语言参数,在 10 个经典跨模态基准测试上取得了 SOTA 性能,包括 N
270
功能概述 输入一张透明背景的主体图,输入一张参考图,模型根据参考图的语义在透明区域生成合适的背景 模型结构 基于开源SD模型,修改生成引导条件,并在开源数据集laion-5B的部分数据上训练而来,模型
540pytorchcv
AnimateDiff is a method that allows you to create videos using pre-existing Stable Diffusion Text to
230pytorch
人脸检测&五官定位模型介绍 人脸检测&五官定位模型。输出与开放视觉平台人脸检测与五官定位 API一致。 参数介绍 模型使用方式和使用范围 本模型可以检测输入图片中人脸的位置,105关键点,人脸po
340pytorch
ERes2Net-large 说话人识别模型 ERes2Net模型是在Res2Net的基础上,对全局和局部特征进一步融合,从而提高说话人识别性能。局部特征融合将一个单一残差块内的特征融合提取局部信号;
480pytorchaudio
当前共6731个项目
×
寻找源码
源码描述
联系方式
提交