通过AVEC2017获取抑郁症患者视频数据,每一患者平均帧数为1.5万帧。训练集107人,校验集35人,测试集47人;数据总帧数超过200万帧。
通过Spectral Representation将患者长度不同的视频数据转化为长度相同,维度固定的数据。
通过面部特征点分布及表情运动单元的共现概率进行连接,形成图结构。
通过pytorch进行模型训练与保存,通过学习率衰减及脚本进行模型调参,最终RMSE为5.2,优于现有论文报道水平。
点击空白处退出提示
通过AVEC2017获取抑郁症患者视频数据,每一患者平均帧数为1.5万帧。训练集107人,校验集35人,测试集47人;数据总帧数超过200万帧。
通过Spectral Representation将患者长度不同的视频数据转化为长度相同,维度固定的数据。
通过面部特征点分布及表情运动单元的共现概率进行连接,形成图结构。
通过pytorch进行模型训练与保存,通过学习率衰减及脚本进行模型调参,最终RMSE为5.2,优于现有论文报道水平。




评论