AI

读光文字识别 News 2023年6月: 新增轻量化端侧识别LightweightEdge-通用场景模型和轻量化端侧行检测模型。 2023年4月: 新增训练/微调时读取本地数据集的lmdb,用训练/
810pytorchcv
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用StructBERT作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view Traini
590pytorchnlp
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
680pytorchaudio
实时人体检测-通用 模型介绍 本模型为高性能热门应用系列检测模型中的 实时人体检测模型,基于面向工业落地的高性能检测框架DAMOYOLO,其精度和速度超越当前经典的YOLO系列方法。用户使用的时候,
740pytorchcv
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
720pytorchaudio
OFA-文字识别 News 2023年1月: 优化了finetune流程,支持参数更新、自定义数据及脚本分布式训练等,见finetune示例。 2022年12月: 上线创空间:OFA的中文OCR体验
990pytorchmulti-modal
中文CLIP News 2022年11月: 发布ModelScope 1.0版本,以下能力请使用1.0.2及以上版本。 上线Huge模型(224分辨率) 上线创空间,更强大的demo展示:中文图文检
660pytorchmulti-modal
图像上色介绍 输入一张黑白图片,全自动的输出相对应的彩色图片。 模型描述 DeOldify是图像上色领域比较有名的开源算法,模型利用resnet作为encoder构建一个unet结构的网络,并提出了多
890pytorchcv
Baichuan 2 ?GitHub | ?WeChat ? 百川大模型在线对话平台 已正式向公众开放 ? 目录 ? 模型介绍 ⚙️ 快速开始 ? Benchmark评估 ?
640pytorch
GLM-4-9B-Chat Read this in English. 2024/07/24,我们发布了与长文本相关的最新技术解读,关注 这里 查看我们在训练 GLM-4-9B 开源模型中关于长文本技
730glm
M2FP单人人体解析模型介绍 模型描述 M2FP(Mask2Former for Parsing,官方代码)基于 Mask2Former 架构,并进行了一些改进以适应人体解析。 M2FP 可以适应几乎
640pytorchcv
News 2023年1月: 优化了finetune流程,支持参数更新、自定义数据及脚本分布式训练等,见finetune示例。 2022年09月: 上线Huge模型,欢迎试用。 OFA-图像描述(英
830pytorchmulti-modal
EMOTION2VEC emotion2vec通用语音情感表征模型 emotion2vec: Self-Supervised Pre-Training for S
1050pytorch
中文StableDiffusion-文本生成图像-通用领域 中文Stable Diffusion文生图模型, 输入描述文本,返回符合文本描述的2D图像。 模型描述 本模型采用的是Stable Dif
800pytorchmulti-modal
DeepLPF: Deep Local Parametric Filters for Image Enhancement 模型描述 该模型为图像色彩增强模型,输入为待调色的图像,输出为增强后的图像。D
690pytorchcv
手部检测模型 输入一张图像,并对其中手部区域进行检测,输出所有手部区域检测框、置信度和标签。 模型描述 该模型主要用于手部检测任务,从图像中检测出人手框坐标、置信度和标签。该任务使用阿里云PAI-Ea
840pytorchcv
Highlights SenseVoice专注于高精度多语言语音识别、情感辨识和音频事件检测 多语言识别: 采用超过40万小时数据训练,支持超过50种语言,识别效果上优于Whisper模型。 富文本
2920pytorch
FaceMask 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸比对1:1、口罩人脸比对1:1、人脸搜索1:N、公众人物识别、明星识别。 口罩人脸识别模型FaceMask, 推荐使用
480pytorchcv
Qwen-7B ? Hugging Face   |   ? ModelScope   |    ? Paper    |   ?️ Demo WeChat (微信
900pytorchqwen
MossFormer2语音分离模型介绍 本次发布为上一代单声道语音分离算法MossFormer的升级版。并在单声道语音分离任务上比MossFormer取得显著的性能提升。MossFormer模型主要采
1020pytorchaudio
当前共6728个项目
×
寻找源码
源码描述
联系方式
提交