长期使用 Obsidian 记笔记的人,往往会积累数千篇结构松散的 Markdown 文档:Inbox 持续堆积未整理、单篇笔记过长难以检索、缺少统一的元数据、分类层级混乱。本项目面向拥有大规模个人知识库的创作者、研究者与开发者,立项目的是把笔记整理这件高频又繁琐的事交给 AI 自动完成,让知识库长期保持可检索、可复用的有序状态,把人从重复的手工归档中解放出来。
点击空白处退出提示
长期使用 Obsidian 记笔记的人,往往会积累数千篇结构松散的 Markdown 文档:Inbox 持续堆积未整理、单篇笔记过长难以检索、缺少统一的元数据、分类层级混乱。本项目面向拥有大规模个人知识库的创作者、研究者与开发者,立项目的是把笔记整理这件高频又繁琐的事交给 AI 自动完成,让知识库长期保持可检索、可复用的有序状态,把人从重复的手工归档中解放出来。
系统覆盖知识库整理的全流程:①Inbox 自动处理——识别新增笔记并按内容智能归类到 PARA 目录;②长笔记自动拆分——将超长文档按主题切分为多篇原子笔记并建立双向链接;③元数据自动生成——为每篇笔记补全 frontmatter(标签、分类、摘要、创建日期);④内容优化——规范标题层级、补全缺失链接、清理冗余排版;⑤学习路线图生成——按主题聚合相关笔记,自动生成知识地图与学习路径。各处理环节通过脚本批量驱动,可对 6000 篇以上规模的本地 Markdown 文件稳定运行。
独立完成需求设计、系统架构与全部开发。技术栈:Python 负责批量文件扫描、解析与读写,Claude API 负责笔记语义理解、分类判断与摘要生成,配合正则与 Markdown 解析处理 frontmatter 和双链。技术亮点:用分批与增量处理应对 6000 篇以上的笔记规模,避免一次性加载;用幂等设计保证脚本可重复运行而不破坏已整理内容。难点在于大模型输出的不确定性与本地文件安全——通过结构化输出约束、改动前自动备份、dry-run 预览三重保障,确保不误删、不错分。



评论