个人介绍
我叫 悠悠,现为 南京农业大学 信息资源管理专业大二学生。进入大学以来,我逐渐对本专业「信息组织、存储、检索与知识服务」的核心命题产生了浓厚兴趣——这个专业不是简单地学数据库或者写代码,而是研究如何把海量、异构、分散的信息,变成人和机器都能高效理解和使用的知识。
大一下学期开始,我自学了 Python 和 Django Web 框架,并在一门专业选修课中接触到了知识图谱(Knowledge Graph)的概念。过去以为数据就该存在表格里、用 SQL 去关联几张表,但知识图谱完全刷新了我的认知:原来「实体-关系-实体」这种三元组结构,可以用 Cypher 单次查询走到第三层、第四层语义关联,还能把结果用图的方式直观渲染给用户。这种「数据结构决定表达能力,表达能力决定认知深度」的思维,是我在大学学到的最重要的东西之一。
从大二上学期起,我开始尝试独立完成一个端到端的知识图谱应用——「蒿草知识图谱问答系统」。这个项目从数据建模、图数据库部署,到后端 API 开发,再到前端可视化交互,全程由我独立摸索和实现。最开始只是想在 Neo4j 里建一张植物百科的图玩玩,但陆续遇到了很多超出预期的问题:怎么让不懂翻译的人用中文自然语言提问就能检索到图中的节点?全文索引的 CJK 分词器怎么配?检索结果太多时怎么控制邻域的展开深度?LLM 生成的答案怎么确保不胡编、每条结论都有图里的来源节点可溯?
通过一学期边学边做,我最终交付了一个完整可用的系统,也由此建立了对「知识图谱 + 大语言模型 + 信息检索」这条技术路线的基础理解。我享受这种「把一个模糊想法拆成小问题、一个一个小问题修掉、最后拼起来跑通」的过程。目前我正在学习更系统地做 NLP 管道设计(意图识别、指代消解、多跳推理),希望未来能在这个方向上做出更有意义的东西。
课余之外,我习惯用文档记录自己的学习轨迹。这个项目的 README 我写到了 140 行,包括环境准备、API 文档、安全说明——不是因为有人要求,而是因为我发现自己写好之后再回头看的时候,能节省 80% 的回忆成本。写清楚本身,就是最好的复习。
工作经历
2025-09-09 -至今南京农业大学数字人文与知识工程实验室 · 科研助理
数字人文与知识工程实验室 · 科研助理1. 独立构建「蒿草知识图谱问答系统」(全栈开发) 该项目围绕蒿属(Artemisia)植物的分类学、化学成分、地理分布等结构化数据,设计并实现了一个基于 Django + Neo4j + DeepSeek 大语言模型的知识图谱问答平台。 我的工作内容: 知识架构设计:在 Neo4j 中定义 13 种节点类型(Plant、ChemicalCompound、Location、Use、Habitat、Family、Genus、Section、Series、Alias、Adaptation、FloweringPeriod、Allergen)及其关系模式,撰写 Cypher 全文索引建表语句(CJK 分词器,覆盖 name/title/description 三字段),为数百条蒿属植物百科数据完成结构化入库。 后端开发:独立实现 Neo4j 只读客户端(~560 行 Python),采用「全文索引优先 → jieba 中文分词 + CONTAINS 降级」的双路径检索策略,支持节点邻域 1-3 跳展开、结果去重合并、大整数 ID 安全转换;封装 D
教育经历
2024-07-06 - 南京农业大学信息资源管理本科



