个人介绍
深耕人工智能本地私有化部署与企业信息化定制开发,专注离线私有 AI 知识库 RAG 系统落地多年。熟练掌握 Ollama 本地大模型调度、量化模型适配、多格式文档解析、Windows 一键运维脚本开发全流程。
擅长为中小企业、工厂、培训机构打造纯离线不上云、数据安全保密、零基础一键即用的内部智能问答系统;从架构搭建、功能开发、异常容错调试到交付手册编写一站式全包,项目稳定落地无后顾之忧。支持一对一远程部署调试 + 售后答疑,用心做好每一套定制交付项目。
工作经历
2025-03-01 -2026-03-03零点科技开发
针对大模型存在的有害生成、偏见输出、违规回答、隐私泄露等安全风险,开展安全专项优化,构建安全对齐体系,使模型 满足合规使用要求,可对外提供安全稳定的对话服务。核心职责:负责安全数据集构建、安全对齐训练、安全评测与漏洞修 复,主导模型安全全流程优化。梳理暴力、色情、歧视、隐私、违法违规、误导性信息等10+类安全风险,构建5万+安全专 项样本库,包含正例合规回答、负例有害样本、标准拒答模板,覆盖高频风险提问与边缘对抗性prompt,形成完整的安全 训练与评测数据集。将安全约束融入偏好对齐流程,训练专用安全奖励模型,大幅提高安全维度权重,采用SFT安全微调 +RLHF安全强化+DPO安全精调三阶段方案,对模型进行安全对齐优化。通过定向训练强化模型拒答能力、合规输出能力与 风险识别能力,有效抑制有害内容生成,解决模型在对抗prompt下的安全漏洞。搭建自动化安全评测平台,使用对抗样 本、诱导性prompt、边界场景query对模型进行压力测试,累计发现并修复安全漏洞30+项。针对高风险场景优化拒答逻辑 与输出范式,在不影响正常回答的前提下,实现有害响应率降至0.8%以下,安全合规率达到99.2
教育经历
2020-09-01 - 2024-06-30广州理工学院计算机科学与技术本科已认证







