线上课程库需要大量试题,以往收集和出题都需要大量人工操作,此项目为解决这个痛点而生。
点击空白处退出提示
线上课程库需要大量试题,以往收集和出题都需要大量人工操作,此项目为解决这个痛点而生。
- 构建知识结构化工作流,使用opencv课件视频中提取关键帧ocr、语音转文本、课件pdf、ppt,通过多模态对齐+数据清洗,转换为高质量文本文档。
- 基于rag构建课程知识库,使用BGE模型向量化文本块,存入Chroma。
- 针对指定课程章节,构建查询。用余弦相似度和bm25检索相关知识点片段,Rerank重排后作为上下文注入Agent,结合动态 Prompt 模板,实现按题型(单选、多选、填空、简答)可控生成试题。
- 对于专业类的课程(数学、英语、日语等),通用提示词无法达到好效果,使用agent节点路由,导航到对应的出题agent节点。
- 多维度的质量评估机制,从是否重复、是否合规、难度、知识点匹配、选项是否合理等多个维度,使用多个专家agent打分,筛选高分题目入库。
技术栈:Python、Pydantic、langchain、langgraph、Chroma
我负责架构设计和绝大部分功能实现




评论