语言技术
Python、Nginx、Redis、SQLite、Vue系统类型
Web行业分类
教育校园、科学研究参考价格
2000演示地址
http://121.40.247.211:8088/
立项原因:随着国家"双碳"目标与生态文明建设持续深化推进,教育和科研领域对生态文明素养的系统性评估需求日益迫切。然而现实中,传统问卷调研数据依赖人工处理,效率极低、分析维度单一,难以快速形成具有科学参考价值的分析报告。本项目旨在解决多源调研数据分散管理难、AI分析易产生幻觉引用、专业报告生成周期长等核心痛点,为研究人员与教育机构提供一站式智能化数据分析工具。
行业场景与业务背景:项目聚焦教育行业与生态文明研究领域,服务对象涵盖小学、初中、高中、高校、教师及社会群体等多类人群,支持跨省份、跨年级、跨性别维度的生态素养调研数据的统一管理、对比分析与可视化呈现,有效支撑生态教育政策制定、学术研究及区域发展评估等多元场景。
主要功能模块:
模块 说明
用户权限管理 超管 / 数据管理员 / 查看者三级角色,JWT双Token认证,多设备安全登出
数据上传管理 Excel批量上传并自动解析四维度评分,支持本地/阿里云OSS双存储切换,按省份、群体、年级、性别多维筛选
AI智能分析引擎 基于Celery异步任务队列调度,集成Kimi K2大模型,6步流水线自动完成数据聚合 → 统计计算 → AI分析 → 报告生成
学术文献集成 接入Semantic Scholar + arXiv真实学术数据库,自动提取关键词检索文献、引用验证评分,有效抑制AI幻觉
多格式报告导出 同一分析结果支持Markdown / HTML / Word(.docx)三种格式一键下载
地理统计看板 基于全国完整省市行政区划数据,输出地图可视化所需接口数据
评估类型管理 支持自定义数据分类配置,灵活适配不同调研场景
主要功能描述:
平台核心在于AI驱动的全自动数据分析链路:用户上传Excel调研数据后,系统自动解析并提取均值、标准差、四分位数、偏态/峰态等统计指标,同步检测异常值;随后调用大模型结合真实学术文献生成具有引用背书的专业研究报告,全程异步处理并实时推送进度(0-100%),最终输出可直接用于学术发表或政策汇报的多格式文档,将原本数天的人工分析流程压缩至分钟级自动完成。
我负责的具体任务:
本项目由本人独立从0到1完成全部后端开发,包括:
整体系统架构设计与技术选型
数据库Schema设计及全部ORM模型开发
全部API接口开发(认证、数据管理、分析任务、报告、地理统计等共30+接口)
AI分析服务核心模块开发(数据预处理、模型调用、事实验证、响应解析)
Celery异步任务流水线搭建与跨平台兼容处理
阿里云OSS与本地双存储后端切换机制实现
Excel多格式解析与四维度评分自动提取逻辑
多格式报告渲染引擎(Markdown / HTML / Word)
学术文献搜索集成与AI幻觉抑制机制
专业prompt编写
全量中国省市行政区划数据库初始化及地图数据接口
技术栈:
FastAPI + SQLAlchemy 2.0 + MySQL + Redis + Celery + OpenRouter API (Kimi K2) + Aliyun OSS + Pandas/NumPy + python-docx + JWT
架构亮点:
异步解耦:FastAPI异步接口 + Celery后台任务队列,分析任务不阻塞主进程,支持进度实时查询
可配置双存储:通过配置项一键切换本地文件系统与阿里云OSS,天然适配本地开发与云端生产环境
三层RBAC权限体系:接口级权限守卫 + 数据级可见性控制(如报告仅创建者可查)
技术难点:
AI幻觉抑制:结合Semantic Scholar / arXiv真实文献进行引用验证评分,若AI生成内容与检索文献不符则降权或替换,从根源保障分析报告的学术可信度
Celery跨平台兼容:Windows开发环境使用solo pool,Linux生产环境自动切换prefork pool,无需修改代码即可跨平台运行
多源数据聚合流水线:多个Excel数据集并行解析 → 数据校验 → 统计聚合 → Token控制 防止超出模型上下文限制
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论