系统开发_APP小程序平台开发-程序员客栈

全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

读光-表格结构识别-无线表格

LORE无线表格结构识别模型介绍表格结构识别，即给定一张图片，检测出图中单元格的物理坐标（四个顶点）以及逻辑坐标（行号列号）。在无线表格中，单元格的物理坐标使用表格内文字的外接框。模型描述本模型

1220pytorchcv

MFCCA多通道多说话人语音识别-中文-AliMeeting-16k-离线

MFCCA多说话人语音识别模型介绍 Highlights 本模型主要是解决会议场景下多说话人语音识别的问题，基于ICASSP2022 M2MeT竞赛发布的真实会议场景语料库AliMeeting进行训练

870pytorchaudio

异常图像检测

Bad Image Detecting 模型描述基于mobilenet-v2的一个简单基线，可以有效检测异常图像，包括编解码或者图像宽高、行偏移错误等造成的花屏，绿屏图像。 Bad

540pytorchcv

StyleGAN2人脸生成

人像图片生成介绍输入随机种子，基于StyleGAN2人像生成模型，返回高清晰(分辨率为1024x1024)的人像图片。模型描述 StyleGAN是图像生成领域的代表性工作，StyleGAN2在St

560pytorchcv

OFA文字识别-中文-通用场景-base

OFA-文字识别 News 2023年1月：优化了finetune流程，支持参数更新、自定义数据及脚本分布式训练等，见finetune示例。 2022年11月：发布ModelScope 1.0版

720pytorchmulti-modal

RaNER命名实体识别-中文-小说领域-base

RANER介绍 What's New 2022年12月：训练所使用的序列理解统一框架AdaSeq发布，提供30+ SOTA的复现代码！ RaNER家族模型均可在链接进行访问！所使用的NER数据集均

1110pytorchnlp

视频人像抠图模型-通用领域

视频人像抠图（Video human matting）是计算机视觉的经典任务，输入一个视频（图像序列），得到对应视频中人像的alpha图，其中alpha与分割mask不同，mask将视频分为前景与背景

730pytorchcv

OFA通过描述定位图像物体-中文-通用领域-large

OFA-视觉定位 (中文) 视觉定位是什么？如果你想找出某个物体在图片上的位置，你只需要输入对这个物体的描述，比如“一个圆头的蓝色宝可梦”， OFA模型便能框出它的所在位置。本页面右侧提供了在线体验

750pytorchmulti-modal

SambertHifigan语音合成-中文-多人预训练-24k

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

880pytorchaudio

MiniCPM-V

MiniCPM-V News [4/11]?MiniCPM-V-2.0 is out. MiniCPM-V (i.e., OmniLMM-3B) is an efficient version w

910

全中文任务支持零样本学习模型v1.5

全中文任务支持零样本学习模型 PromptCLUE：支持最多中文任务的开源预训练模型这个模型是基于PromptCLUE-base进一步训练(+50%步数)，以及更多任务(+50%任务)以及更多任务类

610pytorchnlp

人脸重建模型

HRN人脸重建模型论文 | 项目主页 | github 人脸重建模型以单张人像图作为输入，利用层次化表征实现快速人脸几何、纹理恢复，输出高精度3D人脸重建mesh，相关论文HRN已被CVPR2023

900pytorchcv

RaNER命名实体识别-中文-医疗领域-base

RANER介绍 What's New 2023年4月：如当前模型不满足您的需求，请尝试零样本信息抽取能力。具体可以体验我们的创空间！当前在发力优化中，如有相关需求请加我们的钉钉群（41700255

1060pytorchnlp

SiameseUIE通用信息抽取-中文-base

SiameseUIE通用信息抽取模型介绍 SiameseUIE通用信息抽取模型，基于提示（Prompt）+文本（Text）的构建思路，利用指针网络（Pointer Network）实现片段抽取（Spa

830pytorchnlp

日常动作检测

动作检测模型介绍模型描述输入视频文件，输出该段时间内视频所包含的动作。算法内部每两秒均匀采样4帧输入到动作检测模型中，然后按设定时间步长滑动对整个视频的动作进行检测并返回结果。CUDA和CPU运行

1040ONNXcv

AnyText多语言视觉文字生成与编辑模型

AnyText多语言文字生成与编辑近年来，随着AIGC的爆火，图片生成技术得到飞速发展，当前AI生成的图片已达到真假难辨的高保真度。不过，当合成图片中出现文字内容时，仍能够使AI露出马脚，因为当前主

1140pytorchmulti-modal

mPLUG图像描述模型-英文-large

图像描述介绍图像描述：给定一张图片，模型根据图片信息生成一句对应描述。可以应用于给一张图片配上一句文字或者打个标签的场景。本页面右侧提供了在线体验的服务，欢迎使用！注：本模型为mPLUG-图像描述的

810pytorchmulti-modal

mPLUG图像描述模型-英文-base

660pytorchmulti-modal

CTC语音唤醒-移动端-单麦-16k-小云小云

语音唤醒模型介绍 Highlight 本文档适配modelscope-1.5.0至当前最新版本，其他版本请阅读对应README。模型描述移动端语音唤醒模型，检测关键词为“小云小云”。

2390pytorchaudio

通义千问-72B-Chat

Qwen-72B-Chat ? Hugging Face | ? ModelScope | ? Paper ｜ ?️ Demo WeCh

1400pytorchqwen

当前共162350个项目

...7770 7771 7772 7773 7774 7775 7776 7777 7778 7779 7780 ...

登录后即可上传、下载作品

搜索

分类

娱乐性能优化 docker Activity 开源3D打印机 c++工业软件 flutter Perl 门户平台PORTAL

重点城市程序员兼职推荐

重点岗位程序员兼职推荐