行业:AI 图像生成 / AIGC 人像生成
具体落地的应用场景:
场景 说明
个性化证件照/写真 上传几张自拍,生成不同风格的专业人像
虚拟试衣/电商模特 用真人面部生成不同服装造型的展示图
影视/游戏角色设计 基于真人面部特征生成动画/游戏风格角色
社交媒体内容创作 生成统一人设的多种风格配图
数字人/虚拟形象 为数字人生成统一的 ID 特征图像
核心价值:只需 1-4 张照片即可生成个性化人像,
点击空白处退出提示
行业:AI 图像生成 / AIGC 人像生成
具体落地的应用场景:
场景 说明
个性化证件照/写真 上传几张自拍,生成不同风格的专业人像
虚拟试衣/电商模特 用真人面部生成不同服装造型的展示图
影视/游戏角色设计 基于真人面部特征生成动画/游戏风格角色
社交媒体内容创作 生成统一人设的多种风格配图
数字人/虚拟形象 为数字人生成统一的 ID 特征图像
核心价值:只需 1-4 张照片即可生成个性化人像,
UI 功能(Gradio Web 界面)
左侧输入区:
上传人脸照片(1-4 张,自动 OpenCV 人脸检测)
文本提示词(需包含触发词 img,如 a photo of a woman img)
11 种风格模板:Cinematic、Disney、Digital Art、Photographic、Fantasy、Neonpunk、Enhance、Comic、Lowpoly、Line art、无风格
高级选项(折叠):负向提示词、采样步数(5-50)、风格强度(15-50%)、输出数量(1-4)、CFG(1-10)、随机种子、自动随机种子
右侧输出区:
Gallery 网格展示生成结果
桌面端:
原生 Windows 窗口(WebView2/Edge Chromium)
托盘式隐藏启动,无控制台窗口
预加载模型并显示加载进度
VScode+Claude code+deepseek+photomaker开发
层 技术 用途
深度学习框架 PyTorch 2.x + CUDA GPU 加速推理
扩散模型 diffusers 0.38.0 (HuggingFace) SDXL 管线构建
基础模型 RealVisXL V4.0 (SDXL) 底座文生图模型
人脸检测 OpenCV Haar Cascade 照片中检测人脸区域
人脸识别 ONNX Runtime + w600k_r50 提取 512 维人脸嵌入向量
ID 编码 PhotoMaker V2 ID Encoder (CLIP ViT-L/14 + Perceiver Resampler) 将人脸特征注入扩散过程
参数微调 LoRA (PEFT) UNet 的低秩适配
UI 框架 Gradio 5.x Web 交互界面
桌面窗口 PyWebView + WebView2 (Edge Chromium) 原生 Windows 桌面体验
打包分发 PyInstaller (--windowed --onedir) 打包为独立 EXE
量化/加速 FP16 + model_cpu_offload + attention_slicing + VAE tiling 显存优化
用 PyInstaller 将总大小 5.2GB 的 PyTorch/CUDA/Gradio 应用打包为 dist/PhotoMakerV2/PhotoMakerV2.exe。build_exe.bat 处理了大量兼容性问题:
--exclude PyQt5 PySide6 避免 Qt 绑定冲突





评论