音视频多媒体

从VueI18n打包后的language-*.js中提取中文→英文词条,与标准Excel对照表比对,并导出便于人工校对的Excel报告。适用于HubAI等项目的界面文案版本核对与翻译一致性检查。解析language-*.js中的Xe(英文)与Ke(中文)语言包生成路径级中英配对JSON与rulefi
140Python音视频多媒体
基于Python开发的相机时间码同步脚本,可自动校准多台设备的时间戳,解决拍摄素材时间对齐问题,提升后期剪辑效率。将原4个Python脚本(Cr2CutIntoJpg.py/CS8K_n_Timecode.py/Copy_False.py/Clear_folder.py)重构、模块化、配置外置,并打
110Python音视频多媒体
OLM Smoother v2产品系统
OLMSmootherv2基于改良版MorphologicalAnti-Aliasing(MLAA)与SMAA思想开发,可在不产生传统模糊(Blur)副作用的情况下,对动画线稿边缘进行智能平滑处理。新版支持基于色彩空间(ColorSpace)的颜色插值,可根据不同作品风格动态调整线条平滑度、粗细与浓
120C++音视频多媒体
旨在打造一款跨端的本地音乐播放器,涵盖Windows、Android、MacOS、iOS、HarmonyOS功能模块:本地音乐列表导入、歌手/专辑/文件夹列表、歌单创建删除导入导出等播放器常用功能。暂只完成Windows端,Android进行中,后续覆盖MacOS、iOS、HarmonyOS等以云盘
120Vue音视频多媒体
各种设备集中控制;物联网设备切换,状态信息显示,设备控制;视频设备视频流预览展示;支持mqtt协议、支持串口控制和各种网络协议;采用ffmpeg解码视频,支持各种视频流和视频矩阵分割;
190C++物联网
https://zrq2.batch.icu/posts/qt-media-player-v1/https://zrq2.batch.icu/posts/qt-media-player-v1/https://zrq2.batch.icu/posts/qt-media-player-v1/https:
290C++音视频多媒体
本软件是一款基于局域网实现的跨设备高速无线文件传输工具,支持电脑、安卓、鸿蒙、苹果多终端无缝互联。软件摒弃传统网盘、流量传输以及数据线拷贝的繁琐方式,全程局域网内部点对点传输,无需外网、无需注册会员、无文件大小限制。软件界面简洁轻量化,操作简单,实现一键扫码互联、批量文件秒传,解决了日常办公与生活中
310PHP脚本插件
将超大图片做无失真压缩,支持tiff、jpeg、png、bmp等主流格式,压缩率超50%图片按原格式输出,例如:1G的图片最高可以压缩到20M,将超大图片做无失真压缩,支持tiff、jpeg、png、bmp等主流格式,压缩率超50%图片按原格式输出,例如:1G的图片最高可以压缩到20M,
260C#项目任务
写词/管词:用配置好的歌词大模型(如DeepSeek)生成歌词,曲库里维护「仅歌词→生成音乐→去痕/转码」等状态;歌名会与曲库去重、两阶段起名+写词等逻辑。生成音乐:对接Suno/TTAPI等云端或本机流程,排队生成、下载、入库。后期与物料:FFmpeg去痕、转码、整理发布用物料(音频、歌词、封面等
460Python人工智能
图像视频传输产品系统
本项目主要包含图像传输模块和H.264视频流传输模块。图像传输模块负责读取本地图片文件,将图片按固定大小分片后通过UDP发送,接收端再根据分片编号完成组包和文件恢复。视频传输模块负责从视频文件中提取H.264码流,以帧为单位进行分片发送,接收端按照帧号缓存、重组并输出为视频流文件。除此之外,项目还实
370C++项目任务
实现Windows平台下ComfyUI与StableDiffusion深度学习绘图框架搭建。封装Bat/PowerShell脚本自动化启停脚本,内置显存优化策略,同时汇总环境配置、版本兼容、依赖报错等全套落地排坑方案,实现开箱即用的私有化AI绘图服务。
680Python人工智能
本项目的主要目标是通过人工智能技术创建具有与真实人类类似的外貌、声音和行为数字人形象,以帮助用户实现输入文本即可获取具有面部嘴型与姿态符合需求的授课需求的视频。同时,本产品还支持多个场景与多个人物模型的选择,以满足用户的不同需求。基础功能包括:1、通过人工智能技术创建具有与真实人类类似的外貌、声音和
400Python人工智能
多终端并行自动化:支持Android模拟器与真机集群同时运行,兼容Android9-13系统,同步执行APP启动、页面跳转、交易链路等操作,替代人工完成全流程测试;性能实时监测:采集各终端APP的启动耗时、页面加载速度、CPU占用率等数据,生成可视化性能对比报表;结构化数据提取:自动抓取APP内商品
320Android内容平台
wu-img开源项目
离线图片格式转换客户端,基于Electron构建?️支持拖拽或点击选择图片文件?支持多种格式互转:PNG、JPEG、WebP、AVIF、TIFF、GIF、ICO、ICNS?支持调整输出尺寸?️支持调节JPEG/WebP/AVIF/TIFF输出质量?ICO转换支持自定义多尺寸?批量转换,实时日志?完全
370HTML5开发工具
AIVideoFactoryPro是一个面向自动化视频生产的AI视频工厂项目。它以统一的Director调度器为核心,把剧本解析、角色与台词管理、镜头提示词生成、图片一致性、视频生成、桥接片段、语音合成、口型同步、质量检查和最终合成都串在同一条生产流水线中。项目支持从剧本文件和项目配置出发,自动管理
550postgres工业互联网
screenstream产品系统
自研PC-to-Android低延迟投屏系统,支持1080P60fps稳定传输,端到端延迟低至30~38ms(720p实测);支持多点触控接力、自定义虚拟按键映射、虚拟鼠标;实现零卡顿、无撕裂的游戏串流体验,同时支持跨平台调试与实时操作反馈。
360Python音视频多媒体
数独命题程序,任给一个数独,运行出题程序,能给出成千上万个难度较高的题目,答案都是给定的数独.。六道棋小程序,双人模式,视频录制播放器小程序,功能同照相机APP,可以录制视频,拍照,播放照片库的视频,照片。
510C++游戏
Python爬虫产品系统
系统学习了Python爬虫开发,目前已经能独立完成多种场景的数据采集任务。静态网站方面,我能稳定爬取新闻网、人才网、企业黄页等公开信息,自动整理成结构化数据;动态网站方面,我也能处理淘宝这类电商平台的接口,完成商品信息、价格、销量等数据的采集,同时处理Cookie和简单的签名验证。我会认真对待每一个
440Python电商
1.48kHz录音室级音色克隆:利用本地4090算力,实现对特定人声的超高还原度建模,彻底跨越“恐怖谷效应”,支持多语言身份对齐。2.VLM视觉自愈RPA:引入视觉语言模型导航,AI像人眼一样识别UI界面,彻底摆脱脆弱的CSS/DOM选择器,网页改版逻辑自动适配。3.HITL人机协同安全锁:通过3D
460Java音视频多媒体
1.实时音频响应矩阵:基于WebGL实现毫秒级的音画同步,AI的每一声回应都会在视觉场中产生物理级精确的波动反馈。2.电影级视觉氛围:通过定制Shader营造crystalline(晶体感)交互场,利用魔术心理学线索引导用户注意力,彻底消除视觉违和感。3.动态感知架构:模拟生物律动,赋予AI智能体“
480Java音视频多媒体
当前共86个项目more
×
寻找源码
源码描述
联系方式
提交