软件平台系统开发_APP网站小程序开发-程序员客栈

全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

语音合成-英式英文-通用领域-16k-多发音人

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

360pytorchaudio

Segformer-B0实时语义分割

Segformer-B0语义分割模型介绍其它相关模型体验Mask2Former-R50全景分割模型描述 Neurips2021文章SegFormer: Simple and Efficient

380pytorchcv

UniASR语音识别-印尼语-通用-16k-实时

UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调，研究人员和开发人员可以更方便地进行语音识别模型

360pytorchaudio

UniASR语音识别-印尼语-通用-16k-离线

Highlights UniASR印尼语语音识别模型，可对近场、低噪、正常语速、朗读形式的印尼语音频进行语音识别： ASR模型：UniASR模型，印尼语语音识别模型。 ITN模型：印尼语ITN模型，

430pytorchaudio

RaNER命名实体识别-英文-人工智能领域-large

RANER介绍 What's New 2022年12月：训练所使用的序列理解统一框架AdaSeq发布，提供30+ SOTA的复现代码！ RaNER家族模型均可在链接进行访问！所使用的NER数据集均

470pytorchnlp

MiniCPM-V-2

GitHub | Demo News [2024.04.23] MiniCPM-V 2.0 supports vLLM now! [2024.04.18] We create a HuggingF

360

I2VGen-XL高清图像生成视频大模型

VGen VGen is an open-source video synthesis codebase developed by the Tongyi Lab of Alibaba Group,

280pytorchmulti-modal

ECAPA-TDNN说话人确认-中文-CNCeleb-16k

ECAPA-TDNN说话人模型 ECAPA-TDNN模型是基于时延神经网络构建的说话人模型，由于识别性能优异，已经被广泛使用在说话人识别领域中，还可用于说话人日志和语种识别等任务。模型结构简述 EC

540pytorchaudio

DFSMN远场唤醒-双麦-16k-你好米雅

DFSMN远场唤醒模型介绍问题背景关键词检测（keyword spotting, KWS），即我们通常所说的语音唤醒，指的是一系列从实时音频流中检测出若干预定义关键词的技术。随着远讲免提语音交互（

410pytorchaudio

静默人脸活体检测模型-炫彩

FLXC 模型介绍稳定调用及效果更好的API，详见视觉开放智能平台：人脸活体检测、红外人脸活体检测、视频活体检测。静默炫彩人脸活体检测模型FLXC 模型描述用来检测图片中的人脸是否为来自认证设备

900pytorchcv

人脸活体检测模型-IR

FLIR 模型介绍稳定调用及效果更好的API，详见视觉开放智能平台：人脸活体检测、红外人脸活体检测、视频活体检测。 IR 人脸活体检测模型FLIR 模型描述用来检测图片中的人脸是否为来自认证设备端

860pytorchcv

Segformer-B4实时语义分割

Segformer-B4语义分割模型介绍其它相关模型体验Mask2Former-R50全景分割模型描述 Neurips2021文章SegFormer: Simple and Efficient

350pytorchcv

RaNER命名实体识别-英文-科学领域-large

RANER介绍模型描述本方法采用Transformer-CRF模型，使用xlm-roberta-large作为预训练模型底座，结合使用外部工具召回的相关句子作为额外上下文，使用Multi-view

280pytorchnlp

人体关键点检测-通用领域-3D

17点人体关键点检测模型输入一张人物图像，实现端到端的人体关键点检测，输出视频中每一帧图像人体的17点人体3D关键点坐标。 17点人体关键点 3D人体关键点系列模型 HDForm

310pytorchcv

UniASR语音识别-中文-通用-8k-离线

UniASR 模型介绍模型描述 UniASR 模型是一种2遍刷新模型（Two pass）端到端语音识别模型。日益丰富的业务需求，不仅要求识别效果精度高，而且要求能够实时地进行语音识别。一方面，离线语

490pytorchaudio

UniASR语音识别-中文-通用-8k-实时

440pytorchaudio

商品图像同款特征

商品图像特征模型介绍本模型是对商品图像进行表征向量提取，用户可基于表征向量进行大规模的同款/相似款商品搜索；无需额外输入，模型可自动进行箱包商品的主体抠图，并基于主体提取结果完成表征向量提取。模型

210pytorchcv

Yi-34B-Chat

English | 中文 Building the Next Generation of Open-Source and

290

Yi-6B

English | 中文 Building the Next Generation of Open-Source and

320

vicuna-13b-v1.5

Vicuna Model Card Model Details Vicuna is a chat assistant trained by fine-tuning Llama 2 on user-sh

370pytorch

当前共161669个项目

...7990 7991 7992 7993 7994 7995 7996 7997 7998 7999 8000 ...

登录后即可上传、下载作品

搜索

分类

uniapp BUG跟踪管理视频(Video)C/C++Delphi/Pascal golang 物联网 jQuery分页插件数据备份 VR/AR

重点城市程序员兼职推荐

重点岗位程序员兼职推荐