软件平台系统开发_APP网站小程序开发-程序员客栈

全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

StructBERT情感分类-中文-电商-base

StructBERT中文情感分类模型介绍情感分类任务，通常为输入一段句子或一段话，返回该段话正向/负向的情感极性，在用户评价，观点抽取，意图识别中往往起到重要作用。而在电商场景中，情感分类显得尤为重

580pytorchnlp

Paraformer语音识别-中文-通用-16k-实时-pytorch

Highlights Paraformer 模型是一种非自回归（Non-autoregressive）端到端语音识别模型。非自回归模型相比于自回归模型，可以对整条句子并行输出目标文字，具有更高的计算效

720pytorchaudio

语音合成-中文-通用领域-16k-发音人zhida

Sambert-Hifigan模型介绍框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用，故此处仅涉及参数法。参数TTS系统可分为两

640pytorchaudio

Image-to-Video高清图像生成视频大模型

Image-to-Video高清图像生成视频大模型本项目Image-to-Video旨在解决根据输入图像生成高清视频任务。Image-to-Video由达摩院研发的高清视频生成基础模型之一，其核心部

1080pytorchmulti-modal

读光-表格结构识别-无线表格

LORE无线表格结构识别模型介绍表格结构识别，即给定一张图片，检测出图中单元格的物理坐标（四个顶点）以及逻辑坐标（行号列号）。在无线表格中，单元格的物理坐标使用表格内文字的外接框。模型描述本模型

1190pytorchcv

MFCCA多通道多说话人语音识别-中文-AliMeeting-16k-离线

MFCCA多说话人语音识别模型介绍 Highlights 本模型主要是解决会议场景下多说话人语音识别的问题，基于ICASSP2022 M2MeT竞赛发布的真实会议场景语料库AliMeeting进行训练

750pytorchaudio

异常图像检测

Bad Image Detecting 模型描述基于mobilenet-v2的一个简单基线，可以有效检测异常图像，包括编解码或者图像宽高、行偏移错误等造成的花屏，绿屏图像。 Bad

510pytorchcv

StyleGAN2人脸生成

人像图片生成介绍输入随机种子，基于StyleGAN2人像生成模型，返回高清晰(分辨率为1024x1024)的人像图片。模型描述 StyleGAN是图像生成领域的代表性工作，StyleGAN2在St

520pytorchcv

OFA文字识别-中文-通用场景-base

OFA-文字识别 News 2023年1月：优化了finetune流程，支持参数更新、自定义数据及脚本分布式训练等，见finetune示例。 2022年11月：发布ModelScope 1.0版

650pytorchmulti-modal

RaNER命名实体识别-中文-小说领域-base

RANER介绍 What's New 2022年12月：训练所使用的序列理解统一框架AdaSeq发布，提供30+ SOTA的复现代码！ RaNER家族模型均可在链接进行访问！所使用的NER数据集均

1000pytorchnlp

视频人像抠图模型-通用领域

视频人像抠图（Video human matting）是计算机视觉的经典任务，输入一个视频（图像序列），得到对应视频中人像的alpha图，其中alpha与分割mask不同，mask将视频分为前景与背景

660pytorchcv

OFA通过描述定位图像物体-中文-通用领域-large

OFA-视觉定位 (中文) 视觉定位是什么？如果你想找出某个物体在图片上的位置，你只需要输入对这个物体的描述，比如“一个圆头的蓝色宝可梦”， OFA模型便能框出它的所在位置。本页面右侧提供了在线体验

670pytorchmulti-modal

SambertHifigan语音合成-中文-多人预训练-24k

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

810pytorchaudio

MiniCPM-V

MiniCPM-V News [4/11]?MiniCPM-V-2.0 is out. MiniCPM-V (i.e., OmniLMM-3B) is an efficient version w

880

全中文任务支持零样本学习模型v1.5

全中文任务支持零样本学习模型 PromptCLUE：支持最多中文任务的开源预训练模型这个模型是基于PromptCLUE-base进一步训练(+50%步数)，以及更多任务(+50%任务)以及更多任务类

600pytorchnlp

人脸重建模型

HRN人脸重建模型论文 | 项目主页 | github 人脸重建模型以单张人像图作为输入，利用层次化表征实现快速人脸几何、纹理恢复，输出高精度3D人脸重建mesh，相关论文HRN已被CVPR2023

810pytorchcv

RaNER命名实体识别-中文-医疗领域-base

RANER介绍 What's New 2023年4月：如当前模型不满足您的需求，请尝试零样本信息抽取能力。具体可以体验我们的创空间！当前在发力优化中，如有相关需求请加我们的钉钉群（41700255

1010pytorchnlp

SiameseUIE通用信息抽取-中文-base

SiameseUIE通用信息抽取模型介绍 SiameseUIE通用信息抽取模型，基于提示（Prompt）+文本（Text）的构建思路，利用指针网络（Pointer Network）实现片段抽取（Spa

780pytorchnlp

日常动作检测

动作检测模型介绍模型描述输入视频文件，输出该段时间内视频所包含的动作。算法内部每两秒均匀采样4帧输入到动作检测模型中，然后按设定时间步长滑动对整个视频的动作进行检测并返回结果。CUDA和CPU运行

980ONNXcv

AnyText多语言视觉文字生成与编辑模型

AnyText多语言文字生成与编辑近年来，随着AIGC的爆火，图片生成技术得到飞速发展，当前AI生成的图片已达到真假难辨的高保真度。不过，当合成图片中出现文字内容时，仍能够使AI露出马脚，因为当前主

860pytorchmulti-modal

当前共161914个项目

...7750 7751 7752 7753 7754 7755 7756 7757 7758 7759 7760 ...

登录后即可上传、下载作品

搜索

分类

低代码 3D图形处理库 Android 汽车 PaaS系统/容器 Swift 物联网手机开发工具 SNS社交按钮(Button)

重点城市程序员兼职推荐

重点岗位程序员兼职推荐