ceacaecaac
2小时前在线
全职 · 300/日  ·  6525/月
工作时间: 工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

我叫 悠悠,现为 南京农业大学 信息资源管理专业大二学生。进入大学以来,我逐渐对本专业「信息组织、存储、检索与知识服务」的核心命题产生了浓厚兴趣——这个专业不是简单地学数据库或者写代码,而是研究如何把海量、异构、分散的信息,变成人和机器都能高效理解和使用的知识。

大一下学期开始,我自学了 Python 和 Django Web 框架,并在一门专业选修课中接触到了知识图谱(Knowledge Graph)的概念。过去以为数据就该存在表格里、用 SQL 去关联几张表,但知识图谱完全刷新了我的认知:原来「实体-关系-实体」这种三元组结构,可以用 Cypher 单次查询走到第三层、第四层语义关联,还能把结果用图的方式直观渲染给用户。这种「数据结构决定表达能力,表达能力决定认知深度」的思维,是我在大学学到的最重要的东西之一。

从大二上学期起,我开始尝试独立完成一个端到端的知识图谱应用——「蒿草知识图谱问答系统」。这个项目从数据建模、图数据库部署,到后端 API 开发,再到前端可视化交互,全程由我独立摸索和实现。最开始只是想在 Neo4j 里建一张植物百科的图玩玩,但陆续遇到了很多超出预期的问题:怎么让不懂翻译的人用中文自然语言提问就能检索到图中的节点?全文索引的 CJK 分词器怎么配?检索结果太多时怎么控制邻域的展开深度?LLM 生成的答案怎么确保不胡编、每条结论都有图里的来源节点可溯?

通过一学期边学边做,我最终交付了一个完整可用的系统,也由此建立了对「知识图谱 + 大语言模型 + 信息检索」这条技术路线的基础理解。我享受这种「把一个模糊想法拆成小问题、一个一个小问题修掉、最后拼起来跑通」的过程。目前我正在学习更系统地做 NLP 管道设计(意图识别、指代消解、多跳推理),希望未来能在这个方向上做出更有意义的东西。

课余之外,我习惯用文档记录自己的学习轨迹。这个项目的 README 我写到了 140 行,包括环境准备、API 文档、安全说明——不是因为有人要求,而是因为我发现自己写好之后再回头看的时候,能节省 80% 的回忆成本。写清楚本身,就是最好的复习。

工作经历

  • 2025-09-09 -至今南京农业大学数字人文与知识工程实验室 · 科研助理

    数字人文与知识工程实验室 · 科研助理1. 独立构建「蒿草知识图谱问答系统」(全栈开发) 该项目围绕蒿属(Artemisia)植物的分类学、化学成分、地理分布等结构化数据,设计并实现了一个基于 Django + Neo4j + DeepSeek 大语言模型的知识图谱问答平台。 我的工作内容: 知识架构设计:在 Neo4j 中定义 13 种节点类型(Plant、ChemicalCompound、Location、Use、Habitat、Family、Genus、Section、Series、Alias、Adaptation、FloweringPeriod、Allergen)及其关系模式,撰写 Cypher 全文索引建表语句(CJK 分词器,覆盖 name/title/description 三字段),为数百条蒿属植物百科数据完成结构化入库。 后端开发:独立实现 Neo4j 只读客户端(~560 行 Python),采用「全文索引优先 → jieba 中文分词 + CONTAINS 降级」的双路径检索策略,支持节点邻域 1-3 跳展开、结果去重合并、大整数 ID 安全转换;封装 D

教育经历

  • 2024-07-06 - 南京农业大学信息资源管理本科

语言

中文可口语交流
0
1
2
3
4
5

技能

C掌握
Python熟练
CSS掌握
前端掌握
0
1
2
3
4
5
0
1
2
3
4
5
作品
蒿草知识图谱问答系统

功能模块总览系统由4大模块构成:模块 说明①智能问答 三阶段流水线:意图分类+实体抽取→图谱检索→LLM带引用答案生成②图谱可视化 vis-network力导向图,18种节点类型配色,交互式探索③RESTAPI 6个JSON端点,覆盖问答、图谱数据、搜索、类型筛选、统计④页面架构 首页(问答+图谱预

0
2026-05-31 13:21
更新于: 2小时前 浏览: 1