AI

Highlights 适用于中英文的语音量化编码(Speech Codec)模型。 内部通用场景数据训练,适用性更强 训练时采用结构化 dropout,推理时可根据需要选用不同比特率 项目介绍 F
470pytorchaudio
reStructured Pre-training (RST) official repository, paper, easter eggs RST is a new paradigm for la
260pytorch
Highlights 适用于英文的语音量化编码(Speech Codec)模型。 采用幅度相位谱作为信号的表示形式,更好的利用音频的时频域结构 极少的模型参数(0.52M),极低的计算量(0.34G
540pytorchaudio
A cutting-edge foundation for your very own LLM. ?Github • ? TigerBot • ? Hugging Face 快速开始
340
Highlights 新增基于ModelScope的微调 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调,研究人员
470pytorchaudio
Highlights 适用于英文的语音量化编码(Speech Codec)模型。 采用幅度相位谱作为信号的表示形式,更好的利用音频的时频域结构 较少的模型参数(4.50 M),较低的计算量(2.18
430pytorchaudio
reStructured Pre-training (RST) official repository, paper, easter eggs RST is a new paradigm for la
330pytorch
reStructured Pre-training (RST) official repository, paper, easter eggs RST is a new paradigm for la
260pytorch
SAM SAM 产生高质量的对象蒙版从输入提示,如点或框,它可以用来为图像中的所有对象生成蒙版。它已经在1100万张图像和11亿个掩模的数据集上进行了训练,并且在各种分割任务上具有很强的零射击性能
430
reStructured Pre-training (RST) official repository, paper, easter eggs RST is a new paradigm for la
260pytorch
reStructured Pre-training (RST) official repository, paper, easter eggs RST is a new paradigm for la
280pytorch
SAM-HQ (Segment Anything in High Quality) Segment Anything in High Quality Lei Ke, Mingqiao Ye,
500
A cutting-edge foundation for your very own LLM. ?Github • ? TigerBot • ? Hugging Face 快速开始
300
SMT Scale-Aware Modulation Meet Transformer 介绍 SMT 最初是在paper(released soon)中描述的,它能够作为一种有前途的新的通用主干,用于
440
MobileSAM 1、MobileSAM是如何训练的? MobileSAM在单个GPU上使用10万个数据集(原始图像的1%)进行不到一天的训练。培训代码将很快发布。 2、如何从SAM向Mobile
280
A cutting-edge foundation for your very own LLM. ?Github • ? TigerBot • ? Hugging Face 快速开始
300
Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
450pytorchaudio
A cutting-edge foundation for your very own LLM. ?Github • ? TigerBot • ? Hugging Face 快速开始
280
Highlights 适用于英文的语音量化编码(Speech Codec)模型 以原始时域信号上作为输入的Encodec模型 训练时采用结构化 dropout,推理时可根据需要选用不同比特率 项目
510pytorchaudio
reStructured Pre-training (RST) official repository, paper, easter eggs RST is a new paradigm for la
250pytorch
当前共6731个项目
×
寻找源码
源码描述
联系方式
提交