音视频多媒体

写词/管词:用配置好的歌词大模型(如DeepSeek)生成歌词,曲库里维护「仅歌词→生成音乐→去痕/转码」等状态;歌名会与曲库去重、两阶段起名+写词等逻辑。生成音乐:对接Suno/TTAPI等云端或本机流程,排队生成、下载、入库。后期与物料:FFmpeg去痕、转码、整理发布用物料(音频、歌词、封面等
440Python人工智能
wu-img开源项目
离线图片格式转换客户端,基于Electron构建?️支持拖拽或点击选择图片文件?支持多种格式互转:PNG、JPEG、WebP、AVIF、TIFF、GIF、ICO、ICNS?支持调整输出尺寸?️支持调节JPEG/WebP/AVIF/TIFF输出质量?ICO转换支持自定义多尺寸?批量转换,实时日志?完全
350HTML5开发工具
项目功能模块包括:1、时间线编辑,各类视频、音频Clip的添加、删除,时间线修改,叠加等;2、各类格式的导出。支持MP4、mov、webp等各类主流音视频格式的导出;3、视频添加各类滤镜效果,mask等。
530自动化测试音视频多媒体
该项目主要实现基于WebRTC的实时视频预览能力,支持设备端视频流接入、信令交互、音视频流播放以及低延迟显示。系统可结合现有流媒体服务完成实时画面拉取、播放控制和链路联调,重点解决预览时延高、播放不稳定、兼容性差等问题。项目支持结合安防业务场景进行实时查看,并对弱网环境下的连接成功率、首帧速度和播放
790C++音视频多媒体
-支持将多张图片合成视频:-支持添加单个音烦文件:-支持随机选择音频文件夹中的音频:-支持合成无声视频。-可批量创建视频合成任务,操作简单,可大大提升视频创造的效率。
480Python开发工具
系统主要功能模块如下:1.视频摄入与规范化:支持本地文件上传或远程URL输入,使用ffmpeg自动提取音频、标准化视频格式2.自动语音识别(ASR):对音频进行语音转文字,生成带时间戳的逐字稿3.智能分段:通过LLM对转录文本进行语义分析,自动切分为30-120秒的知识片段4.AI元数据生成:为每个
520Java音视频多媒体
项目采用画布节点化设计,核心功能模块包括:1.**智能画布系统**:支持图片上传、拖拽编排、节点连线,提供缩放、平移、多选等丰富交互能力2.**AI图像生成**:集成多种主流AI图像模型(如Midjourney、DALL-E等),支持文本生成图像、图像编辑、风格迁移等能力3.**工具处理链**:内置
1040TypeScript音视频多媒体
1.这是一个基于Tauri2、Vue3与FastAPI的本地音乐播放器桌面应用,主要面向macOS桌面场景。2.项目包含曲库管理、正在播放、设置与日志诊断等功能模块。3.用户可以选择本地音乐目录进行扫描,自动建立曲库索引,按名称、更新时间、时长等方式排序和检索歌曲,并完成播放、暂停、上一首、下一首、
1310Python音视频多媒体
duo-video开源项目
Duo-Video是一个强大的Java视频编辑SDK。通过简洁的json结构组织视频结构,并生成剪映草稿工程文件。支持最新的剪映版本,支持文本模板、花字、多段文本;支持复合片段、特效、支持绿幕...
830Java音视频多媒体
VDD的设计哲学是:**简单、快速、不打扰。***极简主义设计:没有乱七八糟的广告,没有复杂的弹窗。侧边栏导航,逻辑清晰,打开就能用。*原生性能怪兽:基于Go+Fyne开发,编译为原生二进制文件。内存占用低,启动速度快,不像Electron应用那样吃内存。*订阅自动下载:(v1.4.0重磅功能)支持
870Go工业互联网
AI翻译字幕开源项目
ai-subtitle-translate是一个基于人工智能的开源字幕识别与翻译工具,专为视频内容创作者、教育工作者与本地化团队设计。它能自动从音视频中识别语音生成字幕,保留时间轴信息并将字幕翻译成多种语言,支持常见字幕格式(如SRT、VTT)和批量处理。项目提供命令行与可扩展的接口,方便集成第三方
750Python音视频多媒体
音效管理系统产品系统
1、产品主要做音效库管理2、扫描用户音效库独立展示3、可以为音频文件添加标签4、可以把音频文件添加到收藏夹5、可以通过文件名或者标签实现快速搜索6、可以一键将音频从音效库复制到工程文件夹使用
1140Rust音视频多媒体
Aeroshell产品系统
TermDev是一个面向开发者与技术团队的效率工具产品体系,围绕主机连接、设备管理与数据共享构建完整解决方案。核心产品Aeroshell提供安全稳定的SSH/SFTP连接能力,支持多设备管理、会话复用、密钥与多因素认证,并集成智能命令辅助与自动化能力。
990C++音视频多媒体
视频监控平台产品系统
面向视图设备上云场景提供视图接入、视图存储、视图分发及视图分析的一体化产品。智慧城市、智慧能源、智慧连锁、智慧社区、智慧工地等行业场景应用集成。支持GB28181/GB35114/GA1400/RTMP/RTSP/EHOME等多种接入协议,为用户提供就近的边缘节点接入设备,提供多种AI算法满足不同应
1930C++云计算
NSMusicS开源项目
独立完成核心架构设计与全程落地实现,实现首个ToC音乐场景的全部功能研发与部署:NineSong|NSMusicS;‌1.跨平台架构与部署​​:设计并实现了应用的四层架构,通过​​Vite​​构建工具提升冷启动速度​​。利用​​Electron-builder​​完成一键多平台打包,并引入​​Doc
3830JavaScript项目任务
sony公司的录播服务器控制软件,用于广播电视现场直播导播切换控制台8路4k分辨率,8k分辨率各种格式的视频浏览,实时剪裁,摄像机轨迹预订,视频图像编辑,导播控制台,clip生成,录播控制,ui定制
2850C++音视频多媒体
Sony公司的高分辨率摄像机转码软件,可把摄像机录制内容浏览,播放,非线性编辑,各种格式的转码,及转码任务管理使用qtc++统一开发,windowsmacos通用
5760C++音视频多媒体
当前共17个项目more
×
寻找源码
源码描述
联系方式
提交