培训机构将纸质/截图题库数字化为结构化 Excel
护理执业/职称考试题库录入与「教材向」表述统一
讲师备课:自动生成要点提醒、口播稿、Word 讲义
点击空白处退出提示
培训机构将纸质/截图题库数字化为结构化 Excel
护理执业/职称考试题库录入与「教材向」表述统一
讲师备课:自动生成要点提醒、口播稿、Word 讲义
vlm-text:多模态读图 → 每页 JSON(题号/类型/内容)+ txt + pages.jsonl
vlm-refine:按题号合并题干与解析,LLM 修正 → refined_merged.xlsx / jsonl
llm-compose(可选):整页文本再拆为题目数组
xlsx-lecture-tips:对已导出 xlsx 批注「讲师提醒」,流式 CSV 断点续跑
GUI:选文件夹/多图、开始/暂停/结束、进度条、完成后打开输出目录
把护理题库数字化拆成清晰几步:先 VLM 读图转文字,再 LLM 按题号合并修正,最后导出可直接用的 Excel,中间每步都能单独重跑。
VLM 和 LLM 分开配网关和密钥,读图用贵一点的视觉模型、改文字用文本模型,成本可控。
做了 GUI 的暂停/继续/结束,长任务不怕中途打断;跑完自动打开输出文件夹,教研同事上手成本低。
额外做了「讲师提醒」「讲课 Word 讲义」等 LLM 后处理,以及 CSV 断点续跑,大表批注断了能接着干。
写了 PyInstaller 打包脚本,整包拷到别的 Windows 机器,旁边放 .env 就能跑。



评论