ceacaecaacPython-程序员客栈

1月前来过

D级

数字人文与知识工程实验室 · 科研助理

南京

全职 · 300/日 · 6525/月信用正常

工作时间: 工作地点: 远程

服务企业: 0家累计提交: 0工时

立即雇佣

聊一聊

APP聊一聊

去下载APP

主页

我叫悠悠，现为南京农业大学信息资源管理专业大二学生。进入大学以来，我逐渐对本专业「信息组织、存储、检索与知识服务」的核心命题产生了浓厚兴趣——这个专业不是简单地学数据库或者写代码，而是研究如何把海量、异构、分散的信息，变成人和机器都能高效理解和使用的知识。

大一下学期开始，我自学了 Python 和 Django Web 框架，并在一门专业选修课中接触到了知识图谱（Knowledge Graph）的概念。过去以为数据就该存在表格里、用 SQL 去关联几张表，但知识图谱完全刷新了我的认知：原来「实体-关系-实体」这种三元组结构，可以用 Cypher 单次查询走到第三层、第四层语义关联，还能把结果用图的方式直观渲染给用户。这种「数据结构决定表达能力，表达能力决定认知深度」的思维，是我在大学学到的最重要的东西之一。

从大二上学期起，我开始尝试独立完成一个端到端的知识图谱应用——「蒿草知识图谱问答系统」。这个项目从数据建模、图数据库部署，到后端 API 开发，再到前端可视化交互，全程由我独立摸索和实现。最开始只是想在 Neo4j 里建一张植物百科的图玩玩，但陆续遇到了很多超出预期的问题：怎么让不懂翻译的人用中文自然语言提问就能检索到图中的节点？全文索引的 CJK 分词器怎么配？检索结果太多时怎么控制邻域的展开深度？LLM 生成的答案怎么确保不胡编、每条结论都有图里的来源节点可溯？

通过一学期边学边做，我最终交付了一个完整可用的系统，也由此建立了对「知识图谱 + 大语言模型 + 信息检索」这条技术路线的基础理解。我享受这种「把一个模糊想法拆成小问题、一个一个小问题修掉、最后拼起来跑通」的过程。目前我正在学习更系统地做 NLP 管道设计（意图识别、指代消解、多跳推理），希望未来能在这个方向上做出更有意义的东西。

课余之外，我习惯用文档记录自己的学习轨迹。这个项目的 README 我写到了 140 行，包括环境准备、API 文档、安全说明——不是因为有人要求，而是因为我发现自己写好之后再回头看的时候，能节省 80% 的回忆成本。写清楚本身，就是最好的复习。

2025-09-09 -至今南京农业大学数字人文与知识工程实验室 · 科研助理
数字人文与知识工程实验室 · 科研助理1. 独立构建「蒿草知识图谱问答系统」（全栈开发）该项目围绕蒿属（Artemisia）植物的分类学、化学成分、地理分布等结构化数据，设计并实现了一个基于 Django + Neo4j + DeepSeek 大语言模型的知识图谱问答平台。我的工作内容：知识架构设计：在 Neo4j 中定义 13 种节点类型（Plant、ChemicalCompound、Location、Use、Habitat、Family、Genus、Section、Series、Alias、Adaptation、FloweringPeriod、Allergen）及其关系模式，撰写 Cypher 全文索引建表语句（CJK 分词器，覆盖 name/title/description 三字段），为数百条蒿属植物百科数据完成结构化入库。后端开发：独立实现 Neo4j 只读客户端（~560 行 Python），采用「全文索引优先 → jieba 中文分词 + CONTAINS 降级」的双路径检索策略，支持节点邻域 1-3 跳展开、结果去重合并、大整数 ID 安全转换；封装 D