



个人介绍
毕业于西交利物浦大学信息与计算科学专业(GPA top 4%),目前在中厂实习,深耕计算机视觉(CV)与多模态智能感知领域,兼具算法研究与工程落地能力。从顶会论文复现到行业级数据集构建,从单目标追踪算法优化到全栈项目开发,擅长将学术研究转化为可落地的技术方案。
Kaggle 银牌 / 铜牌得主,曾带队斩获 “互联网 +” 省赛奖项,主导的水域自动驾驶感知项目成果被纳入顶会论文素材,技术能力覆盖算法研究、工程开发、数据处理全链路。
? 核心技能栈框架与语言:PyTorch(目标检测 / 追踪模型复现与优化)、C++/Java(算法工程化)、Python(OpenCV/Matplotlib 数据可视化)、SpringBoot(全栈开发)、OpenGL(3D 图形编程)算法与研究:单目标追踪(PTTR/Transformer)、目标检测(YOLOv5/YOLOX)、多模态融合(雷达 - 视觉数据处理)、点云可视化与处理工具与工程:Kitti/Meshlab/CloudCompare(点云处理)、PyTorch Lightning(模型训练加速)、数据集构建与标注(20 万 + 目标标注经验)? 标志性项目(附技术突破)知水良测无人船(WaterScenes)项目复现 YOLOX-M/YOLOv5-M 模型,基于自研 Radar-Camera Fusion Dataset 训练,将 YOLOX-M 的 mAP 提升至 85.1%(行业同场景领先)开发多模态数据查看器,实现雷达点云动态投影至图像平面,支撑顶会论文《WaterScenes》数据集可视化模块单目标追踪在自动驾驶中的应用复现 CVPR 顶会 PTTR 论文核心模块,重构特征提取网络,协助博士生定位 3 篇顶会论文的算法漏洞处理 Kitti 数据集,实现点云与标注框可视化,支撑自动驾驶感知算法优化行业首个水域 Camera-Radar 融合数据集构建主导 54,120 组多模态数据(RGB/4D 雷达 / GPS)标注,覆盖 7 类水面目标与复杂天气场景,成为水域自动驾驶领域标杆数据集? 个人项目(技术广度证明)全栈开发网上预定系统(SpringBoot+Java):实现用户预约、支付流程与后台管理,支持高并发场景3D 望海凉亭建模(OpenGL+C++):基于光照渲染与纹理映射,实现沉浸式 3D 场景交互最短路径可视化工具(Java 算法):集成 Dijkstra/A * 算法,通过动态图像展示路径规划过程? 合作邀约无论你需要CV 算法优化(目标检测 / 追踪)、多模态数据处理、全栈项目开发,我都能提供从技术方案设计到落地部署的全流程支持。
Kaggle 实战经验 + 顶会论文复现能力 + 行业级项目落地经历,让你的需求高效解决。点击 “立即预约”,用技术驱动项目突破!
工作经历
2025-01-01 -2025-07-28颅燊科技科研
在工作期间,我深度参与了样本标签分布极不平衡的医学影像二分类项目,主导算法方案设计与落地,核心工作包括: 1.数据预处理 pipeline 搭建 针对 DICOM 格式医学影像,设计并实现关键兴趣区域(ROI)自动提取模块,通过编程删除图像冗余空白区域,并按原始比例填充有效像素,显著提升后续模型对病灶特征的学习效率。 2.模型训练与迁移学习实施 负责将预处理后的图像标准化至适配尺寸,基于 ConvNeXtV2Tiny 的 ImageNet 预训练模型进行迁移学习,通过冻结底层权重、微调顶层参数的策略,快速提升模型在医学影像数据上的收敛速度与特征提取能力。 3.样本不平衡问题攻坚 针对数据集中正负样本比例失衡的核心痛点,提出 “欠采样 + 外部数据补充” 的组合方案: 采用 undersample 方法动态调整训练集中的样本比例,避免模型偏向多数类; 引入领域相关外部数据集扩充样本多样性,结合多组负样本比例参数训练出 5 个差异化泛化模型,通过集成学习进一步提升预测稳定性。 4.结果优化与验证 基于原始样本分布特性,设计动态阈值调整机制,结合 Kaggle 公榜评分标准与本地验证集
教育经历
2021-09-01 - 2025-09-01西交利物浦大学信息与计算科学本科
语言

1. 行业与业务场景 该竞赛聚焦于人工智能领域的大型语言模型(LLMs)优化,旨在解决如何使 LLMs 的响应更契合用户偏好这一关键问题。在当今数字化时代,AI 驱动的对话系统广泛应用于智能客服、虚拟助手、在线教育等多个行业,然而,由于用户需求的多样性和复杂性,现有的 LLMs 在理解和满足用户个性化偏好方面仍存在不足。 Chatbot Arena 收集的大量用户与 LLMs 交互数据为解决这一问题提供了契机。通过分析这些数据,参赛者能够深入了解用户在不同场景下对 LLMs 响应的喜好倾向,进而开发出更符合用户期望的模型。企业可以利用这些成果优化其智能客服系统,提升客户满意度;政府部门则可应用于智能政务服务,提高服务效率和质量。这不仅有助于推动 AI 技术在实际应用中的发展,还能增强用户对 AI 驱动对话系统的信任和接受度,促进相关行业的智能化转型。 2. 功能模块与用户价值 2.1 模型微调功能 核心功能:采用 QLoRA 技术对 Gemma-2-9b-it 量化 4 位模型进行微调,在比赛数据上优化模型参数。同时,寻找与比赛数据类型和分布一致的额外数据,将模型在除验证数据外的所有数据上进行混合微调。 用户价值:通过针对性的微调,使模型能够更好地学习用户偏好模式,从而在实际应用中生成更符合用户期望的响应。额外数据的引入扩大了模型的学习范围,增强了模型的泛化能力,提高了其在不同场景下满足用户需求的准确性。 2.2 关键参数调整功能 核心功能:对 Gemma-2-9b-it 模型的关键参数进行调整,包括选择 “q_proj”“k_proj”“v_proj”“o_proj”“gate_proj” 这五个类型的层进行微调;将训练长度调整为 3072,减少对原始数据的截断;将冻结层数调整为 0,使模型能够充分学习任务相关信息;提升 LoRA_R 到 64,并同时调整对应 LoRA_Alpha 和 Learning_Rate。 用户价值:精准的参数调整使模型结构更适应预测用户偏好的任务,优化后的训练长度和冻结层数设置有助于模型更好地捕捉数据特征,提高预测的准确性。调整 LoRA 相关参数则进一步优化了模型的学习效果,使模型在处理用户偏好预测时更加高效和准确,为用户提供更优质的服务体验。 2.3 推理优化功能 核心功能:在推理阶段使用测试时增强(TTA)技术,交换 Res_A 和 Res_B 让模型进行推理,然后平均集成结果作为模型的最终输出。 用户价值:TTA 技术通过多次推理并集成结果,降低了模型预测的不确定性,提高了预测的稳定性和可靠性。这意味着在实际应用中,模型能够更稳定地输出符合用户偏好的结果,增强了用户对 AI 对话系统的信任,提升了用户体验。 3. 技术选型与架构亮点 3.1 技术选型 模型选择:选用 Gemma-2-9b-it 模型作为基础模型,该模型在参数规模和性能上具有一定优势,为后续的微调提供了良好的基础。 微调技术:采用 QLoRA 微调技术,该技术通过 4 位量化压缩预训练模型,冻结 LM 参数,并添加少量可训练的低秩适配器,在大幅减少内存需求的同时,几乎不影响推理效果,使得模型在有限资源下也能进行高效微调。 数据利用:积极寻找额外数据,并将其与比赛数据结合进行混合微调,扩大了模型的训练数据范围,增强了模型的适应性和泛化能力。 3.2 架构亮点 精细的层选择微调:深入研究模型初始结构,选择特定的五个类型的层进行微调,这种精细化的操作能够更有针对性地优化模型在用户偏好预测任务上的性能,避免对无关层的无效调整,提高训练效率和效果。 优化训练设置:调整训练长度和冻结层数,充分考虑了模型对原始数据的学习需求以及任务的适应性,确保模型能够充分利用数据信息,提升预测准确性。同时,合理调整 LoRA 相关参数,进一步优化模型的学习过程,使模型在训练过程中能够更好地收敛。 推理增强策略:在推理阶段运用 TTA 技术,通过交换输入进行多次推理并平均结果,有效降低了模型预测的随机性,提高了推理结果的稳定性和可信度,为用户提供更可靠的预测结果。


1. 行业与业务场景 该项目属于计算机图形学中的 2D 虚拟创意设计领域,核心是利用 OpenGL 与 freeglut 库制作交互式生日贺卡,通过数字化手段呈现传统贺卡无法实现的动态效果与交互体验。其业务场景聚焦于生日祝福的个性化表达,解决了传统纸质贺卡静态单一、互动性弱的痛点,可应用于个人数字祝福、线上庆典装饰等场景。 这份贺卡融合了气球、星星、笑脸、飞机(带祝福文字)等元素,既有静态装饰,也有动态效果(如星星旋转、气球上升、飞机飞行),还支持用户通过鼠标和键盘参与互动(如点击生成星星、控制动画启停),让生日祝福从 “被动观看” 变为 “主动参与”,增强了情感传递的生动性。 2. 功能模块与用户价值 贺卡的功能围绕场景元素设计、动态效果与交互体验展开,各模块协同提升祝福的感染力。 在场景元素设计上,星星通过drawStar函数以极坐标参数化构建,利用三角函数计算外顶点与内顶点坐标,通过 10 个三角形片段组成完整星形,且随迭代交替颜色模拟闪烁效果,让星星既具几何美感又有动态变化,增强视觉吸引力。贺卡主体(drawcard函数)包含白色主框架、黄色文字板(用于展示生日祝福),顶部有粉色三角形装饰与火焰图案(drawFirePaint函数),火焰通过颜色随时间变化增强活力,文字采用阴影效果(plottext函数)提升立体感,让祝福信息更突出。 桌布设计基于六次贝塞尔曲线,通过两组控制点(ctrlpoints和ctrlpoints1)定义左右边缘,利用贝塞尔曲线公式生成平滑褶皱效果,模拟真实桌布的柔软质感,为贺卡奠定温馨的场景基调。气球(drawBalloon函数)通过圆形顶点计算与线条组合呈现,配合上升动画让画面更活泼;笑脸(drawface函数)以三角函数生成圆形轮廓,通过点集绘制眼睛,呈现欢快表情,传递愉悦氛围;飞机(drawplane函数)带 “生日快乐” 横幅,通过坐标变化实现飞行动画,强化祝福主题。 动画与交互是核心亮点。动画方面,星星通过定时器(RotateTimer和ScaleTimer)实现旋转与缩放直至消失,气球通过balloonoscillatetimer函数实现上升,飞机通过 x 坐标更新实现横穿画面,让贺卡 “动” 起来,摆脱静态单调。交互方面,鼠标左键点击生成随机颜色的星星,右键呼出操作菜单,键盘按键(如B启动所有动画、F控制飞机飞行、Q退出)实现便捷控制,让用户从 “观看者” 变为 “参与者”,增强代入感与趣味性。 3. 技术选型与架构亮点 该项目的技术选型以 OpenGL 为核心,结合 freeglut 库实现图形渲染与交互控制,重点解决 2D 图形的视觉效果与动态交互问题。为提升画面细腻度,采用 MSAA(多重采样抗锯齿)技术,消除曲线与圆形边缘的锯齿,让星星、笑脸等元素更平滑。 架构设计的亮点体现在模块化与参数化建模上。每个场景元素(如星星、气球、桌布)通过独立函数(drawStar、drawBalloon等)实现,函数内部封装了图形生成的完整逻辑,既便于单独调试,又利于后期扩展(如新增元素类型)。参数化建模是关键技术,例如星星通过极坐标参数(外半径r、内半径r1、角度增量)计算顶点,笑脸与气球利用三角函数(正弦、余弦)生成圆形轮廓,桌布基于贝塞尔曲线公式(通过控制点与参数t计算坐标)构建褶皱效果,这些设计用数学公式替代固定坐标,既保证了图形的精准性,又便于通过调整参数修改形状(如星星大小、气球半径)。 动画与交互的实现机制同样值得关注。动画通过定时器(如RotateTimer、balloonoscillatetimer)周期性更新对象参数(如星星旋转角度、气球 y 坐标、飞机 x 坐标),配合 OpenGL 的重绘机制实现连续动态;交互通过监听鼠标(点击生成星星、右键唤出菜单)与键盘事件(按键控制动画状态),将用户操作转化为参数变化(如生成星星时随机设置位置与颜色),实现 “操作 - 反馈” 闭环。此外,正交投影的应用确保了 2D 图形在不同视口尺寸下的比例一致性,配合-/+键调整视口大小,提升了适配性。


1. 行业与业务场景 该项目属于计算机图形学领域,聚焦于通过 OpenGL 技术构建沉浸式 3D 虚拟场景,核心是模拟 “白鹭花园” 这一包含亭台、海洋、古桥、森林、天空等元素的自然环境。其应用场景覆盖图形学教学(作为技术实践案例)、虚拟景观展示等,旨在解决传统 3D 场景中视觉粗糙(如边缘锯齿)、动态效果生硬、光照不自然等问题。通过抗锯齿处理、时间联动的光照变化、自然动画(如树木摇曳、海浪翻滚)等技术,该项目为用户提供了接近真实环境的沉浸感,让虚拟场景更具说服力和观赏性。 2. 功能模块与用户价值 该场景的核心功能围绕场景构建、动态效果与交互体验展开,各模块紧密配合以提升沉浸感。 在场景元素设计上,亭台采用层级建模方法,拆分为天花板、座椅、围栏等子组件,天花板为六边形结构,结合木质与石材纹理,且亭灯仅在夜间发光,既保证了结构的系统性,又通过动态灯光增强时间氛围感。古桥由长方体桥面、圆柱形支柱及木质护栏构成,护栏的对称布局与石板装饰提升了视觉协调性,让结构既稳固又美观。海洋通过纹理网格实现,颜色强度随距离变化模拟深度,同时借助纹理坐标的动态更新呈现海浪翻滚的效果,还原了水体的自然动感。天空与云朵则随时间(早、中、晚)改变纹理和颜色,例如傍晚天空呈紫红色,云朵颜色随光线调暗,配合漂浮动画(坐标持续更新),让场景的时间流逝感更真实。森林中的树木采用层级建模,树叶分上、中、下层且颜色随光照变化,同时通过角度振荡模拟风吹摇曳;路灯仅在夜间发光,进一步强化了场景的自然逻辑。 动画与交互模块是提升场景活力的关键。动画方面,树木通过角度变量的往复振荡模拟风吹效果,云朵通过坐标持续更新实现漂浮且超出边界后循环复位,海浪则借助纹理位置的动态调整呈现滚动感,这些细节让场景摆脱了静态的僵硬感。交互方面,用户可通过右键菜单切换时间、调整视角,也可通过键盘快捷键(如 “a/d” 水平旋转相机、“w/s” 调整垂直视角、“q” 退出)操作,既保证了操作的直观性,又赋予用户探索场景的主动权,增强了参与感。 光照与纹理技术为场景的真实感奠定了基础。光照系统分早、中、晚三种模式,分别以强光白、弱光黄、紫光模拟不同时段的自然光线,结合全局环境光、平行光(模拟太阳)、点光源(体现光线衰减)和聚光灯(模拟云层遮挡效果),让光影变化更贴合自然规律。纹理映射则根据物体形状适配不同方案,平面物体(如桥面)通过坐标绑定纹理,曲面物体(如圆柱、球体)通过参数调整避免纹理失真,同时利用纹理平铺技术让小分辨率纹理适配大尺寸物体(如草坪),使物体的材质感(如木质的粗糙、石材的坚硬)更突出。 3. 技术选型与架构亮点 该项目的技术选型围绕 OpenGL 生态展开,核心包括 OpenGL 基础库及 glut、glu 辅助库,提供建模、渲染、光照等核心功能。为优化视觉效果,采用多重采样抗锯齿(MSAA)解决曲线与圆形边缘的锯齿问题,提升画面细腻度。视图控制通过 gluLookAt 函数定位相机、gluPerspective 函数设置透视投影(90° 视场角、近远裁剪面分别为 100 和 6000 单位),模拟人眼视觉中 “近大远小” 的效果,增强场景深度感。 架构设计的亮点体现在模块化与动态适配上。复杂物体(如亭台)采用层级建模,将整体拆分为多个子组件,每个组件通过独立函数实现,既简化了设计流程,又便于后期维护和升级。动态效果通过空闲函数(myIdleFunc)驱动,例如树木摇曳借助角度变量的往复振荡模拟风力,云朵漂浮通过坐标增量更新实现循环运动,海浪翻滚则通过纹理位置调整呈现动态,这些设计以较低的计算成本实现了自然流畅的动画效果。 此外,光照与时间的联动机制是另一大亮点。系统通过时间变量自动切换光照参数,同步调整天空、云朵的颜色和纹理,让场景的光影、色调随时间自然过渡,强化了 “时间流逝” 的沉浸感。交互设计兼顾便捷性与灵活性,右键菜单与键盘快捷键结合,让用户既能直观操作,又能通过快捷键快速完成常用功能(如视角旋转、退出程序),提升了操作体验。纹理映射的适应性处理则确保了不同形状物体的纹理自然呈现,避免了拉伸或失真问题,进一步增强了场景的真实感。 总体而言,该项目通过合理的技术选型与架构设计,将计算机图形学的核心理论(如光照模型、纹理映射、动画原理)转化为可交互的虚拟场景,既实现了技术实践目标,又为类似 3D 景观项目提供了可复用的设计思路。
