软件平台系统开发_APP网站小程序开发-程序员客栈

全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

SenseVoice多语言语音理解模型Small

Highlights SenseVoice专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别：采用超过40万小时数据训练，支持超过50种语言，识别效果上优于Whisper模型。富文本

4180pytorch

MossFormer2语音分离-单麦-8k

MossFormer2语音分离模型介绍本次发布为上一代单声道语音分离算法MossFormer的升级版。并在单声道语音分离任务上比MossFormer取得显著的性能提升。MossFormer模型主要采

1310pytorchaudio

通义千问-7B-预训练

Qwen-7B ? Hugging Face | ? ModelScope | ? Paper ｜ ?️ Demo WeChat (微信

1100pytorchqwen

OFA图像描述-英文-通用领域-蒸馏33M

News 2023年1月: 优化了finetune流程，支持参数更新、自定义数据及脚本分布式训练等，见finetune示例。 2022年09月: 上线Huge模型，欢迎试用。 OFA-图像描述(英

910pytorchmulti-modal

glm-4-9b-chat

GLM-4-9B-Chat Read this in English. 2024/07/24，我们发布了与长文本相关的最新技术解读，关注这里查看我们在训练 GLM-4-9B 开源模型中关于长文本技

890glm

读光-文字识别-行识别模型-中英-手写文本领域

读光文字识别 News 2023年6月：新增轻量化端侧识别LightweightEdge-通用场景模型和轻量化端侧行检测模型。 2023年4月：新增训练/微调时读取本地数据集的lmdb，用训练/

950pytorchcv

DeOldify图像上色

图像上色介绍输入一张黑白图片，全自动的输出相对应的彩色图片。模型描述 DeOldify是图像上色领域比较有名的开源算法，模型利用resnet作为encoder构建一个unet结构的网络，并提出了多

1030pytorchcv

语音合成-中文-直播领域-16k-发音人zhisha

Sambert-Hifigan模型介绍框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用，故此处仅涉及参数法。参数TTS系统可分为两

880pytorchaudio

语音合成-中文-通用领域-16k-发音人ainan

820pytorchaudio

YOLOX-PAI手部检测模型

手部检测模型输入一张图像，并对其中手部区域进行检测，输出所有手部区域检测框、置信度和标签。模型描述该模型主要用于手部检测任务，从图像中检测出人手框坐标、置信度和标签。该任务使用阿里云PAI-Ea

990pytorchcv

百川2-13B-对话模型-4bits量化版

Baichuan 2 ?GitHub | ?WeChat ? 百川大模型在线对话平台已正式向公众开放 ? 目录 ? 模型介绍 ⚙️ 快速开始 ? Benchmark评估 ?

890pytorch

emotion2vec情感通用表征模型base

EMOTION2VEC emotion2vec通用语音情感表征模型 emotion2vec: Self-Supervised Pre-Training for S

1300pytorch

中文StableDiffusion-通用领域

中文StableDiffusion-文本生成图像-通用领域中文Stable Diffusion文生图模型, 输入描述文本，返回符合文本描述的2D图像。模型描述本模型采用的是Stable Dif

900pytorchmulti-modal

RaNER命名实体识别-中文-通用领域-base

RANER介绍模型描述本方法采用Transformer-CRF模型，使用StructBERT作为预训练模型底座，结合使用外部工具召回的相关句子作为额外上下文，使用Multi-view Traini

690pytorchnlp

CLIP模型-中文-通用领域-base

中文CLIP News 2022年11月：发布ModelScope 1.0版本，以下能力请使用1.0.2及以上版本。上线Huge模型(224分辨率) 上线创空间，更强大的demo展示：中文图文检

730pytorchmulti-modal

OFA文字识别-中文-日常场景-base

OFA-文字识别 News 2023年1月：优化了finetune流程，支持参数更新、自定义数据及脚本分布式训练等，见finetune示例。 2022年12月：上线创空间：OFA的中文OCR体验

1180pytorchmulti-modal

口罩人脸识别模型FaceMask

FaceMask 模型介绍稳定调用及效果更好的API，详见视觉开放智能平台：人脸比对1:1、口罩人脸比对1:1、人脸搜索1:N、公众人物识别、明星识别。口罩人脸识别模型FaceMask, 推荐使用

560pytorchcv

DeepLPF图像调色

DeepLPF: Deep Local Parametric Filters for Image Enhancement 模型描述该模型为图像色彩增强模型，输入为待调色的图像，输出为增强后的图像。D

840pytorchcv

StructBERT情感分类-中文-电商-base

StructBERT中文情感分类模型介绍情感分类任务，通常为输入一段句子或一段话，返回该段话正向/负向的情感极性，在用户评价，观点抽取，意图识别中往往起到重要作用。而在电商场景中，情感分类显得尤为重

580pytorchnlp

Paraformer语音识别-中文-通用-16k-实时-pytorch

Highlights Paraformer 模型是一种非自回归（Non-autoregressive）端到端语音识别模型。非自回归模型相比于自回归模型，可以对整条句子并行输出目标文字，具有更高的计算效

810pytorchaudio

当前共162332个项目

...7770 7771 7772 7773 7774 7775 7776 7777 7778 7779 7780 ...

登录后即可上传、下载作品

搜索

分类

性能优化网络游戏 .NET 通信任务/项目管理 Node.js 扩展 Visual Studio Code 扩展 Perl Scala 数据库调整和优化

重点城市程序员兼职推荐

重点岗位程序员兼职推荐