旨在给用户提供完善的日常能用到的ai功能,例如:一键p图,上传图片,选择要隐藏修复的部分,只保留自己为人物主体,点击确定即可等待生成,还有诸多类似的功能集成在这个APP里面
点击空白处退出提示
旨在给用户提供完善的日常能用到的ai功能,例如:一键p图,上传图片,选择要隐藏修复的部分,只保留自己为人物主体,点击确定即可等待生成,还有诸多类似的功能集成在这个APP里面
举几个常用功能:
1.文生图:上传一段文字,可以据此生成图片
2:文生视频:与文生图类似
3.配音:用户上传一段视频,选择想要替换的音色和文字,即可据此视频生成对应音色讲出的对应文字
4.图片动起来:上次一张图片,扫描,可据此出现动图模型
等等
技术栈:uniapp+aframe+uview+canvas+three.js+mindAR.js+deepseek
1.封装项目中所有需要访问手机权限才能使用的功能,通过封装只有调取相关函数就能开启相关手机权限如摄像头录音等
2.换装3d通过原生h5开发通过three.js和aframe展示3d模型,获取手机摄像头数据用canvas进行渲染,app进行网页嵌套完成。AR换装功能主要是做人体姿态跟踪,预估人体骨骼点的各个点位将模型穿戴在人体身上
3.用AR.js等方法完成扫描图片实时转3D模型的功能,需要利用AR.js提供的方法生成图片的target.mind图片模型标点文件,将glb模型与图片对应完成该功能,如果模型大小不对可在前端标签上手动修改,并且前端可以使用标签自带的模型动画进行优化。
4.文生图生成功能对接阿里云api生成语音文字,deepseek人工智能大模型根据获取到的文字生成相关图片上传服务器获取到图片链接进行展示。
5.通过画布渲染获取到图片每个像素点已四个一组的方式分析到画笔颜色修改透明的生成图片,对接阿里云的图片修复功能生成完整图片然后上传到服务器获取链接在app展示
项目难点:
1.最明显的问题是3D扫描和AR换装的页面加载速度问题,将模型预加载,在登录时就开始调取这两个页面的摄像头并开始渲染可以很好的解决这个问题。
2.3d展示功能经过分析市面上转app的兼容性不好最后我决定采用网页嵌套功能去解决兼容性问题
3.智能图片后端没办法通过画笔颜色分析进行抠图后来我通过博客等文章完成了图片分析的工作




评论