系统开发_APP小程序平台开发-程序员客栈

全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

UniASR语音识别-德语-通用-16k-实时

Highlights UniASR德语语音识别模型，可对近场、低噪、正常语速、朗读形式的德语音频进行语音识别： ASR模型：UniASR模型，德语语音识别模型。 ITN模型：德语ITN模型，可用于语

440pytorchaudio

语音合成-中文-通用领域-16k-发音人zhiyue

Sambert-Hifigan模型介绍框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用，故此处仅涉及参数法。参数TTS系统可分为两

370pytorchaudio

视频去场纹

视频去场纹模型视频去场纹模型是一种解决隔行扫描导致的场纹问题的技术，它能够自适应地检测输入视频中的场纹，并针对场纹区域进行场纹去除与画面补全，返回画面干净自然的视频结果。效果展示以下是在真实网络

340pytorchcv

语音合成-西班牙语-通用领域-16k-发音人camila

350pytorchaudio

语音合成-意大利语-通用领域-16k-发音人perla

440pytorchaudio

读光-文档理解-文档理解多模态预训练模型

VLDoc文档理解多模态预训练模型介绍文档理解，即给定一个视觉富文档(visually-rich document)，对其自动地分析与处理，包括文档信息抽取、文档版面分析、文档分类与文档VQA等等。

600pytorchmulti-modal

VoP: 通用跨模态视频检索模型

VoP: 通用跨模态视频检索模型论文 [点击阅读] VoP是第一个同时具有视频和文字Prompt的端到端视频文本跨模态检索框架，基于Prompt的高效微调与完全微调相比，VoP利用0.1%的训练参数

320pytorchcv

太乙-Stable-Diffusion-1B-中文-v0.1

Taiyi-Stable-Diffusion-1B-Chinese-v0.1 Github: Fengshenbang-LM Docs: Fengshenbang-Docs API：Fengshen

380pytorchcv

RaNER命名实体识别-法语-电商领域-large

RANER介绍模型描述本方法采用Transformer-CRF模型，使用XLM-Roberta作为预训练模型底座，结合使用外部工具召回的相关句子作为额外上下文，使用Multi-view Train

600pytorchnlp

CSANMT连续语义增强机器翻译-英法-通用领域-base

基于连续语义增强的神经机器翻译模型介绍本模型基于邻域最小风险优化策略，backbone选用先进的transformer-base模型，编码器和解码器深度分别为24和6，相关论文已发表于ACL 202

460tensorflownlp

BAStructBERT词性标注-中文-新闻领域-lite

BAStructBERT通用领域中文词性标注模型介绍词性标注任务是将给定句子中的每个单词从给定标签组 (tag set)中赋予一个词性标签 (part-of-speech tag)。中文词性标注任务

230pytorchnlp

手部关键点检测-通用领域-2D

手部2D关键点检测模型介绍输入一张手部图像，实现端到端的手部关键点检测，输出完整的手部21个关键点。模型描述该模型采用自顶向下的Heatmap手部关键点检测框架，通过端对端的快速推理可

420pytorchcv

CLIP模型-中文-通用领域-large

中文CLIP News 2022年11月：发布ModelScope 1.0版本，以下能力请使用1.0.2及以上版本。上线Huge模型(224分辨率) 上线创空间，更强大的demo展示：中文图文检

520pytorchmulti-modal

剧本编辑器

构建游戏数据处理器，将文字剧本转为xml、json格式的游戏脚本供驱动。可以通过修改数据完善游戏脚本可以关联图片资源和音乐资源

32010

免税店小助手

爬虫类应用。主要用于爬取韩国各大免税店的商品，监控爆款商品上货、自动下单抢货（类似于抢火车票的软件）主要技术栈： 1、爬虫 2、微信小程序、微信公众号、支付、消息推送等 3、高并发处理 4、微信机器人 5、机器人自动短信接收发送 6、自建邮件服务器等等

1980

雄安电网智慧供应链运营中心

”雄安电网智慧供应链运营中心“是国家电网在雄安新区的电力物资仓储管理试点项目，主要解决国家电网在雄安新区电力物资的仓储、检测、调度指挥、配送等相关业。

4310

动画、Logo、图形设计

多个Logo及插图设计。其中包括SVG+CSS实现的图形动画动态图形用于反映网站上图标的交互。运动可能是实现目标的最佳方法。我使用Adobe Illustrator为HTML创建SVG格式的图形，并通过CSS代码控制动画效果。

2760

Llama3-Chinese

中文｜ English Llama3-Chinese

440

cogagent-chat

CogAgent CogAgent is an open-source visual language model improved based on CogVLM. ? Paper: https:

310pytorch

Udever 多语言通用文本表示模型 3b

Udever 多语言通用文本表示模型文本表示是将一个输入句子使用机器学习模型转换为一个固定维度的连续向量: 输入: 吃完海鲜可以喝牛奶吗? 输出: [0.27162,-0.66159,0.3303

300nlp

当前共161938个项目

...8010 8011 8012 8013 8014 8015 8016 8017 8018 8019 8020 ...

登录后即可上传、下载作品

搜索

分类

DBA 菜单 (Menu)旅游 jQuery表单及相关 Visual Studio Code 扩展 Perl redis 智能硬件 SAAS Unity

重点城市程序员兼职推荐

重点岗位程序员兼职推荐