Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能,可直接对时长为数小时音频进行识别,并输出带标点文字与时间戳: ASR模型:Parformer-l
2670pytorchaudio
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
1210pytorchaudio
coROM中文电商文本表示模型 文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展,尤其是预训练语言模型的出现极大
760pytorchnlp
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
1440pytorchaudio
MossFormer语音分离模型介绍 我们日常可能会遇到在嘈杂环境中进行语言交流的场景,比如在人多的餐厅里或者拥挤的人群中,同时存在着许多不同的说话人的声音,这时听者可能只对一个主说话人的声音感兴趣,
950pytorchaudio
实时口罩检测-通用 模型介绍 本模型为高性能热门应用系列检测模型中的 实时口罩检测模型,基于面向工业落地的高性能检测框架DAMOYOLO,其精度和速度超越当前经典的YOLO系列方法。用户使用的时候,
1050pytorchcv
DDColor 图像上色模型 该模型为黑白图像上色模型,输入一张黑白图像,实现端到端的全图上色,返回上色处理后的彩色图像。 English Version | 中文版本 Paper | Github
960pytorchcv
StructBERT中文情绪分类模型介绍 情绪分类任务,通常为输入一段句子或一段话,识别该句话情绪类别的模型。 在用户评价、观点抽取、意图识别中往往起到重要作用。 模型描述 模型基于Structber
1240pytorchnlp
Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能,可直接对时长为数小时音频进行识别,并输出带标点文字与时间戳: ASR模型:Paraformer-
1070pytorchaudio
视频描述介绍 视频描述:给定一个视频,模型根据视频信息生成一句对应描述。可以应用于给一张视频配上一句文字或者打个标签的场景。你只需要输入任意一个视频,很快你就能收获对于该视频的描述。 模型描述 本任务
880pytorchmulti-modal
Paraformer-large模型介绍 Highlights 热词版本:Paraformer-large热词版模型支持热词定制功能,基于提供的热词列表进行激励增强,提升热词的召回率和准确率。 长音
1200pytorchaudio
车牌检测模型介绍 给定一张图片,检测出图中车牌的位置并输出车的类型(比如小汽车,挂车,新能源车等)。 模型描述 本模型是以自底向上的方式: 1)首先识别出车牌的中心点;2)基于中心点回归出车牌的bbo
970pytorchcv
RTS模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸比对1:1、口罩人脸比对1:1、人脸搜索1:N、公众人物识别、明星识别。 人脸识别OOD模型RTS, 论文详见:Improving
1190pytorchcv
FLCM 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸属性识别、表情识别。 人脸关键点置信度模型FLCM 模型描述 FLCM为达摩院自研的关键点置信度算法,基于关键点的好坏来判断输
940pytorchcv
FairFace 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸属性识别、表情识别。 人脸属性模型FairFace 模型描述 FairFace是结构简单性能不错的人脸属性模型(代码地
1070pytorchcv
RANER介绍 What's New 2023年8月: 开放域文本理解大模型 已上线,无需训练,即可完成实体识别、文本分类、阅读理解等多种任务! 2023年4月: - 如您需要自定义实体类型,请尝试
2190pytorchnlp
RANER介绍 What's New 2023年8月: 开放域文本理解大模型 已上线,无需训练,即可完成实体识别、文本分类、阅读理解等多种任务! 2022年12月: 训练所使用的序列理解统一框架Ad
880pytorchnlp
中文CLIP News 2022年11月: 发布ModelScope 1.0版本,以下能力请使用1.0.2及以上版本。 上线Huge模型(224分辨率) 上线创空间,更强大的demo展示:中文图文检
1090pytorchmulti-modal
DCT-Net人像卡通化模型-艺术风 论文 | 项目主页 输入一张人物图像,实现端到端全图卡通化转换,生成艺术风格虚拟形象,返回风格化后的结果图像。 其生成效果如下所示: >>返回卡通化系列模型专题
1260tensorflowcv
DCT-Net人像卡通化模型-素描风 论文 | 项目主页 输入一张人物图像,实现端到端全图卡通化转换,生成素描风格虚拟形象,返回风格化后的结果图像。 其生成效果如下所示: >>返回卡通化系列模型专题
1090tensorflowcv
当前共162036个项目
×
寻找源码
源码描述
联系方式
提交