本项目面向深度学习模型压缩与部署优化场景,针对神经网络模型在资源受限设备上存在模型体积大、推理延迟高、部署成本高等问题,构建一个可视化混合精度量化实验平台。系统用于完成模型训练、量化、评估、敏感度分析和实验结果管理,为毕业设计实验、模型压缩研究和工程化部署验证提供支撑。
点击空白处退出提示
本项目面向深度学习模型压缩与部署优化场景,针对神经网络模型在资源受限设备上存在模型体积大、推理延迟高、部署成本高等问题,构建一个可视化混合精度量化实验平台。系统用于完成模型训练、量化、评估、敏感度分析和实验结果管理,为毕业设计实验、模型压缩研究和工程化部署验证提供支撑。
系统主要包括实验运行、模型训练、模型量化、模型评估、敏感度分析、混合精度分配、实验结果管理、实验报告生成和单张图片推理展示等功能。用户可以在网页端选择实验配置,运行 MNIST、Fashion-MNIST、CIFAR-10 等实验,对比 FP32、FP16、INT8 和 Mixed 混合精度模型的准确率、模型大小和推理延迟,并查看每个网络层的量化敏感度和最终精度分配结果。
本人主要负责项目整体设计与代码实现,包括 PyTorch 模型训练流程、数据集加载模块、量化仿真模块、逐层敏感度分析算法、实验指标统计、报告生成和 Streamlit 可视化页面开发。项目采用模块化结构,将数据集、模型、训练评估、量化、实验管理和部署推理功能分离,实现了从模型训练到量化对比再到网页展示的完整实验闭环。系统支持自动保存实验配置、模型文件、评估指标、混合精度分配结果和实验报告,便于后续论文撰写和答辩展示。



评论