音视频多媒体

1、项目有哪些具体功能模块包括:终端鉴权接入模块、音视频处理模块(混音/多画面/适配/视频叠加)、信令控制模块、会议会场管理模块、全适配全编全解引擎、协议栈模块(H.323/SIP)、互控级联模块、V-Link抗丢包模块、混合端口资源管理模块、单画面纯转发模块。2、项目的主要功能描述实现视频会议MC
160C++智能硬件
1、项目有哪些具体功能模块1.1、视频采集与预处理模块(支持HDMI/SDI/VGA/Type-C等多路输入,最高4K60)1.2、4K60编解码模块(H.264/H.265硬件编解码)1.3、本地YUV预览与渲染模块1.4、人脸识别与虚拟背景模块1.5、声源定位与摄像头智能追踪模块1.6、本地会议
190C++智能硬件
1、音频、视频采集(游戏进程内采集、系统桌面采集)2、音频、视频软/硬件编码(H264/H265/AAC)3、无花屏低延迟音视频传输(WebRTC、UDP/KCP、webSocket,网络自适应)4、音视频编码、播放控制5、操作同步与适配(手柄、键鼠、触屏、摇控器,按键映射)6、显示控制(720P/
400C++音视频多媒体
1,信号源列表展示2,音视频切换基本操作3,分布式节点信息同步和设备控制4,界面个性化设置,操作快捷键设置。5,节点协同操作,码流推送和拉取,邀请和请求控制主机。
230C++音视频多媒体
该项目主要实现跨平台播放器SDK能力建设,支持多协议视频流接入、音视频解码、渲染显示、直播播放和云回放等功能。系统覆盖Android、iOS、Windows等多个终端平台,支持RTSP、WebRTC等常见场景接入,并重点针对黑屏、花屏、卡顿、音画不同步、首帧慢等常见问题进行优化。项目在播放器兼容性、
530C++音视频多媒体
该项目主要实现面向安防视频场景的S3兼容云存储能力,支持录像数据上云、对象存储管理以及云端回放相关能力建设。系统结合流媒体链路和存储流程,对录像文件进行缓存、上传、归档和访问管理,提升录像保存的可靠性与扩展能力。项目兼顾性能与成本,在写盘、缓存和上传策略上进行了优化,适合用于安防视频录像长期保存、云
350C++企业服务
该项目主要实现基于WebRTC的实时视频预览能力,支持设备端视频流接入、信令交互、音视频流播放以及低延迟显示。系统可结合现有流媒体服务完成实时画面拉取、播放控制和链路联调,重点解决预览时延高、播放不稳定、兼容性差等问题。项目支持结合安防业务场景进行实时查看,并对弱网环境下的连接成功率、首帧速度和播放
420C++音视频多媒体
驾照考场需要将多机位摄像头(RTSP协议、H264/H265/AAC等编码)、实时地图合并到一个视频流作为监控直播/备份记录。且考试过程中,需要接收机位变换信息(导播切换)。要求延迟不超过4秒,多机位时间戳相差不超过1秒。要求支持摄像头断开自动重连,要求多频道配置。
310C++音视频多媒体
天外来电是一个完全自托管的全双工实时语音AI对话系统,支持实时打断、语音克隆、角色定制。核心功能包括:(1)语音对话,用户可随时与角色零延迟对话,支持实时打断说话,接近0秒延迟;(2)对话记忆,每个角色有极强的对话记忆能力,对于自定义角色,上传的所有聊天记录都可实现长期记忆;(3)预设角色,项目包含
570Python人工智能
系统主要功能模块如下:1.视频摄入与规范化:支持本地文件上传或远程URL输入,使用ffmpeg自动提取音频、标准化视频格式2.自动语音识别(ASR):对音频进行语音转文字,生成带时间戳的逐字稿3.智能分段:通过LLM对转录文本进行语义分析,自动切分为30-120秒的知识片段4.AI元数据生成:为每个
370Java音视频多媒体
该系统以内容产品注入、分发、调度为核心,为用户提供稳定的互动多媒体电视及多终端业务。该系统在满足点播、直播、支持高、标清互联网编码格式等多种融合流媒体业务需求的基础上也可进一步满足广电高清互动电视业务的运营,从而实现高效的VOD点播与直播产品的多互联网终端数字电视业务系统,并兼容播控平台。
380Python音视频多媒体
本项目为AI语音转换系统,基于Python+PyTorch开发,支持本地离线部署运行。主要功能包括:支持音色迁移、语音转换,可将输入音频转换为指定目标音色。支持本地模型加载与推理,保障数据隐私,不上传云端。可在Windows/Linux环境运行,转换效率高。可用于内容创作、语音演示、音频处理等场景,
430Python人工智能
使用pytest测试流媒体后端CDN服务能端到端检测服务站点的状态;自动控制服务器进程的启动,终止;自动部署功能;自动检测功能;模拟终端行为——登录,登出,播放频道选择,流数据分片拉取,NAT穿透等需求;自动化脚本依赖一次mock服务器,完成以上链路。说明:mock服务器不在源码中,脚本不能运行,只
330自动化测试音视频多媒体
duo-video开源项目
Duo-Video是一个强大的Java视频编辑SDK。通过简洁的json结构组织视频结构,并生成剪映草稿工程文件。支持最新的剪映版本,支持文本模板、花字、多段文本;支持复合片段、特效、支持绿幕...
680Java音视频多媒体
1.最多支持添加32个摄像头,支持摄像头实时音视频浏览。2.支持水印和遮罩添加,保护隐私。3.支持录像回复和运动侦测。4.支持摄像头PTZ控制5.支持摄像头双向音频6.支持摄像头手动录像和参数设置
420C++音视频多媒体
VDD的设计哲学是:**简单、快速、不打扰。***极简主义设计:没有乱七八糟的广告,没有复杂的弹窗。侧边栏导航,逻辑清晰,打开就能用。*原生性能怪兽:基于Go+Fyne开发,编译为原生二进制文件。内存占用低,启动速度快,不像Electron应用那样吃内存。*订阅自动下载:(v1.4.0重磅功能)支持
670Go工业互联网
专注车载中控与智能座舱底层软件全栈开发,提供从芯片选型评估到量产交付的一站式解决方案:1.BSP开发与板级支持:精通主流车规级芯片平台(如Telechips803x/805x系列,QualcommSnapdragonSA8155/8295等)的Bring-up,负责U-Boot移植、内核裁剪、设备树
3320C++汽车
AI翻译字幕开源项目
ai-subtitle-translate是一个基于人工智能的开源字幕识别与翻译工具,专为视频内容创作者、教育工作者与本地化团队设计。它能自动从音视频中识别语音生成字幕,保留时间轴信息并将字幕翻译成多种语言,支持常见字幕格式(如SRT、VTT)和批量处理。项目提供命令行与可扩展的接口,方便集成第三方
570Python音视频多媒体
这款适配T28181协议的SIP协议库,深度集成音视频流媒体编解码、传输与处理能力,全面兼容TCP、UDP双传输协议,通信稳定且适配性强,可满足安防监控、政企通信等多行业音视频交互场景的开发需求。
520C++音视频多媒体
AI音乐产品系统
1.通过提示词生成音乐,可以使用参考音乐,音乐风格,音乐流派等精确生成一首完整音乐2.生成的音乐进入我的曲库,可以实时查看,发布音乐,也可以分享给别人,也可以手机查看3.音乐工具有人生分离,音乐剪辑,音质提升等
770Python音视频多媒体
当前共40个项目more
×
寻找源码
源码描述
联系方式
提交