全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

pytorch

ChatPLUG-开放域对话模型-3.7B

ChatPLUG介绍 ChatPLUG是一个开放域对话模型，其接收用户对话历史和对话相关的外部知识、用户人设、模型人设信息，输出合适的文本回复。该模型基于PLUG，使用亿级互联网社交数据、百科数据预

260pytorchnlp

UniASR语音识别-德语-通用-16k-实时

Highlights UniASR德语语音识别模型，可对近场、低噪、正常语速、朗读形式的德语音频进行语音识别： ASR模型：UniASR模型，德语语音识别模型。 ITN模型：德语ITN模型，可用于语

450pytorchaudio

读光-文档理解-文档理解多模态预训练模型

VLDoc文档理解多模态预训练模型介绍文档理解，即给定一个视觉富文档(visually-rich document)，对其自动地分析与处理，包括文档信息抽取、文档版面分析、文档分类与文档VQA等等。

610pytorchmulti-modal

语音合成-意大利语-通用领域-16k-发音人perla

Sambert-Hifigan模型介绍框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用，故此处仅涉及参数法。参数TTS系统可分为两

450pytorchaudio

ParaformerBert语音识别-中文-aishell1-16k-离线-pytorch

ModelScope-FunASR FunASR希望在语音识别方面建立学术研究和工业应用之间的桥梁。通过支持在ModelScope上发布的工业级语音识别模型的训练和微调，研究人员和开发人员可以更方便地

410pytorchaudio

语音合成-西班牙语-通用领域-16k-发音人camila

360pytorchaudio

语音合成-中文-通用领域-16k-发音人zhiyue

370pytorchaudio

Paraformer语音识别-中文-aishell2-16k-离线-pytorch

Paraformer模型介绍 Highlights 新增基于ModelScope的微调 ModelScope-FunASR FunASR希望在语音识别方面建立学术研究和工业应用之间的桥梁。通过支持

480pytorchaudio

太乙-Stable-Diffusion-1B-动漫-中文-v0.1

Taiyi-Stable-Diffusion-1B-Chinese-v0.1 Github: Fengshenbang-LM Docs: Fengshenbang-Docs API：Fengshen

390pytorchcv

语音识别-德语-后处理- ITN模型

德语逆文本正则化模型模型描述德语逆文本正则化模型是基于FunTextProcessing开源代码库生成，用于德语语音识别模型结果后处理中的逆文本正则化部分。多语言逆文本正则化&文本正则化逆文本

400pytorchaudio

RaNER命名实体识别-西班牙语-电商领域-large

RANER介绍模型描述本方法采用Transformer-CRF模型，使用XLM-Roberta作为预训练模型底座，结合使用外部工具召回的相关句子作为额外上下文，使用Multi-view Train

330pytorchnlp

全景图室内框架估计

室内框架估计算法介绍输入一张室内空间的全景RGB图像，室内框架估计算法将输出房间的墙线，天花板线跟地线模型描述 PanoViT 的网络框架可以分为backbone、全景视觉变换器编

280pytorchcv

RaNER命名实体识别-俄语-电商领域-large

RANER介绍模型描述本方法采用Transformer-CRF模型，使用XLM-Roberta作为预训练模型底座，结合使用外部工具召回的相关句子作为额外上下文，使用Multi-view Train

360pytorchnlp

SOND说话人日志-中文-alimeeting-16k-离线-pytorch

Highlights 会议场景端到端说话人日志模型，解决 "who spoke when" 的问题，发表于EMNLP 2022，在AliMeeting数据集上获得SOTA结果。支持功能：给定若干

380pytorchaudio

Udever 多语言通用文本表示模型 560m

Udever 多语言通用文本表示模型文本表示是将一个输入句子使用机器学习模型转换为一个固定维度的连续向量: 输入: 吃完海鲜可以喝牛奶吗? 输出: [0.27162,-0.66159,0.3303

300nlp

UniASR语音识别-中文-通用-8k-离线-pytorch

Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能，可直接对时长为数小时音频进行识别，并输出带标点文字与时间戳： ASR模型：Paraformer-

430pytorchaudio

视频去场纹

视频去场纹模型视频去场纹模型是一种解决隔行扫描导致的场纹问题的技术，它能够自适应地检测输入视频中的场纹，并针对场纹区域进行场纹去除与画面补全，返回画面干净自然的视频结果。效果展示以下是在真实网络

350pytorchcv

浦语·灵笔2-视觉问答-7B

InternLM-XComposer2 [?Github Repo](https://github.com/InternLM/InternLM-XComposer) InternLM-XC

360

基础视觉模型高效调优-SideTuning

基础视觉模型高效调优：Side-Tuning 基于大规模预训练基础模型的参数高效迁移学习方法在各种下游应用中均取得了优异的表现，其中包括了利用side网络进行调优的方法。该方法仅需训练一个side网络

390pytorchcv

StructBERT文本相似度-中文-通用-tiny

StructBERT中文文本相似度模型介绍 StructBERT中文文本相似度模型是在structbert-base-chinese预训练模型的基础上，用atec、bqcorpus、chineseST

280pytorchnlp

当前共5187个项目

...200 201 202 203 204 205 206 207 208 209 210 ...

登录后即可上传、下载作品

搜索

分类

网店系统/电子商务 Visual Studio Code 扩展其他(Others)大数据 Oa crm 3D图形处理库 Clojure 网页开发工具教程与指南

pytorch

重点城市程序员兼职推荐

重点岗位程序员兼职推荐