StructBERT中文情感分类模型介绍 情感分类任务,通常为输入一段句子或一段话,返回该段话正向/负向的情感极性,在用户评价,观点抽取,意图识别中往往起到重要作用。而在电商场景中,情感分类显得尤为重
580pytorchnlp
Highlights Paraformer 模型是一种非自回归(Non-autoregressive)端到端语音识别模型。非自回归模型相比于自回归模型,可以对整条句子并行输出目标文字,具有更高的计算效
720pytorchaudio
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
640pytorchaudio
Image-to-Video高清图像生成视频大模型 本项目Image-to-Video旨在解决根据输入图像生成高清视频任务。Image-to-Video由达摩院研发的高清视频生成基础模型之一,其核心部
1080pytorchmulti-modal
LORE无线表格结构识别模型介绍 表格结构识别,即给定一张图片,检测出图中单元格的物理坐标(四个顶点)以及逻辑坐标(行号列号)。在无线表格中,单元格的物理坐标使用表格内文字的外接框。 模型描述 本模型
1190pytorchcv
MFCCA多说话人语音识别模型介绍 Highlights 本模型主要是解决会议场景下多说话人语音识别的问题,基于ICASSP2022 M2MeT竞赛发布的真实会议场景语料库AliMeeting进行训练
750pytorchaudio
Bad Image Detecting 模型描述 基于mobilenet-v2的一个简单基线,可以有效检测异常图像,包括编解码或者图像宽高、行偏移错误等造成的花屏,绿屏图像。 Bad
510pytorchcv
人像图片生成介绍 输入随机种子,基于StyleGAN2人像生成模型,返回高清晰(分辨率为1024x1024)的人像图片。 模型描述 StyleGAN是图像生成领域的代表性工作,StyleGAN2在St
520pytorchcv
OFA-文字识别 News 2023年1月: 优化了finetune流程,支持参数更新、自定义数据及脚本分布式训练等,见finetune示例。 2022年11月: 发布ModelScope 1.0版
650pytorchmulti-modal
RANER介绍 What's New 2022年12月: 训练所使用的序列理解统一框架AdaSeq发布,提供30+ SOTA的复现代码! RaNER家族模型均可在链接进行访问!所使用的NER数据集均
1000pytorchnlp
视频人像抠图(Video human matting)是计算机视觉的经典任务,输入一个视频(图像序列),得到对应视频中人像的alpha图,其中alpha与分割mask不同,mask将视频分为前景与背景
660pytorchcv
OFA-视觉定位 (中文) 视觉定位是什么? 如果你想找出某个物体在图片上的位置,你只需要输入对这个物体的描述,比如“一个圆头的蓝色宝可梦”, OFA模型便能框出它的所在位置。本页面右侧提供了在线体验
670pytorchmulti-modal
Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
810pytorchaudio
MiniCPM-V News [4/11]?MiniCPM-V-2.0 is out. MiniCPM-V (i.e., OmniLMM-3B) is an efficient version w
880
全中文任务支持零样本学习模型 PromptCLUE:支持最多中文任务的开源预训练模型 这个模型是基于PromptCLUE-base进一步训练(+50%步数),以及更多任务(+50%任务)以及更多任务类
600pytorchnlp
HRN人脸重建模型 论文 | 项目主页 | github 人脸重建模型以单张人像图作为输入,利用层次化表征实现快速人脸几何、纹理恢复,输出高精度3D人脸重建mesh,相关论文HRN已被CVPR2023
810pytorchcv
RANER介绍 What's New 2023年4月: 如当前模型不满足您的需求,请尝试零样本信息抽取能力。具体可以体验我们的创空间!当前在发力优化中,如有相关需求请加我们的钉钉群(41700255
1010pytorchnlp
SiameseUIE通用信息抽取模型介绍 SiameseUIE通用信息抽取模型,基于提示(Prompt)+文本(Text)的构建思路,利用指针网络(Pointer Network)实现片段抽取(Spa
780pytorchnlp
动作检测模型介绍 模型描述 输入视频文件,输出该段时间内视频所包含的动作。算法内部每两秒均匀采样4帧输入到动作检测模型中,然后按设定时间步长滑动对整个视频的动作进行检测并返回结果。CUDA和CPU运行
980ONNXcv
AnyText多语言文字生成与编辑 近年来,随着AIGC的爆火,图片生成技术得到飞速发展,当前AI生成的图片已达到真假难辨的高保真度。不过,当合成图片中出现文字内容时,仍能够使AI露出马脚,因为当前主
860pytorchmulti-modal
当前共161914个项目
×
寻找源码
源码描述
联系方式
提交