1. 行业背景与问题:全球抑郁患者超3.32亿,中国面临老龄化与医疗资源城乡分布不均。传统诊断依赖精神科医师访谈与自评量表,但医师资源严重不足(中国仅5.6万名),且量表评估易受主观偏差、回忆误差影响,确诊周期长。基层及偏远地区筛查可及性极差,超75%患者无法获得及时治疗,存在巨大"治疗缺口"。
2. 旨在解决的问题:构建基于音视频数据的AI辅助筛查系统,通过计算机视觉与深度学习技术自动捕捉微表情、面部动作单元及语音韵律等客观生物标志物,实现低成本、实时、一键式抑郁风险初筛。系统定位于大规模人群早期分流,缓解医师资源短缺压力,提升基层筛查覆盖率,避免最佳干预时机的延误。
具体功能模块:
1. 一键式筛查:集成视频录制/上传、质量检测、自动预处理及模型推理全流程,输出低/中/高三类风险等级与就医建议。
2. 批量筛查:支持多视频队列处理,导入被试者信息后自动批量分析,生成群体统计报告与高风险名单。
3. 数据处理:基于OpenFace提取面部动作单元(AU)序列,Librosa提取音频频谱特征,建立缓存机制避免重复计算。
4. 模型推理:支持ViDA-GCAM(基础)与ViDA-GCNN(增强)双模型,提供GPU精准模式与CPU轻量模式,适配不同硬件环境。
5. 用户交互:提供Web端与桌面客户端双平台,支持联网或离线单机部署,非技术人员经简单培训即可操作。
主要功能描述:
系统实现端到端抑郁风险辅助筛查。用户上传3-5分钟视频后,自动完成人脸对齐、AU提取、音频频谱分析;基于深度学习模型输出风险概率,划分三级风险并生成可视化报告;采用本地部署架构确保数据隐私,支持消费级硬件运行,单视频分析耗时10分钟内,适用于高校、社区等大规模早期筛查场景。
负责了Web端辅助筛查系统的全栈开发与架构设计。主导搭建基于B/S架构的三层系统:数据处理层实现视频质量检测、OpenFace面部对齐、AU序列提取及音频频谱转换;业务逻辑层完成模型服务化封装(PyTorch→ONNX)、双模式(精准/轻量)调度及批量队列管理;前端展示层开发Vue.js单页应用,实现视频上传、进度追踪、风险可视化(红黄蓝等级)及报告导出功能。同时负责本地服务器部署方案,确保数据不出域。
技术栈采用PyTorch+ONNX实现模型推理服务,OpenFace+FFmpeg+Librosa构建多模态特征提取链路,后端使用Flask提供RESTful API与WebSocket实时通信,前端基于Vue.js 2.0+Element UI实现交互界面,数据库采用MySQL存储筛查记录与队列状态。
项目亮点在于实现浏览器端的医疗级隐私保护,通过本地服务器部署确保视频数据不出域;支持Web端一键筛查与批量导入双模式,适配单机构
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论