云的代码之家
12小时前在线
全职 · 800/日  ·  17400/月
工作时间: 工作日21:00-01:00、周末11:00-18:00工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

使用APP扫码聊一聊

个人介绍

你好,我是一名专注于AI模型训练与应用开发
的工程师,目前在海外科技公司从事AI相关系统的研发工作。
 我擅长将AI模型集成到API接口、APP应用和自动化工具
中,具备从模型训练到产品上线的完整开发经验。曾参与开发AI客服系统、智能考勤识别平台、AI海报生成工具
等多个实际项目,熟悉图像处理、NLP、语音识别等多种AI应用场景。
主力开发语言为Python,熟练使用如PyTorch、FastAPI、Streamlit、RPA自动化工具(如Power Automate Desktop)等在AI项目中常用的技术栈。擅长快速理解需求,独立完成AI服务的设计、部署与优化。
如果您有AI相关的项目需求,欢迎点击“立即预约”或“发布需求”,我将非常乐意为您提供技术支持和解决方案!

工作经历

  • 2025-04-01 -至今pythonAI自动化工程师

    在一家中型技术公司担任AI开发工程师,主要从事AI模型应用落地相关的系统开发工作。负责将现有的计算机视觉和自然语言处理模型封装为API服务,提供给内部系统和外部客户使用。期间独立开发并上线多个基于FastAPI的AI推理接口,涵盖图像识别、文档处理、对话问答等场景。同时,参与构建了多个配套工具和前端应用,包括模型测试页面、数据标注小工具及简易可视化平台等。为提高业务效率,还基于Power Automate Desktop 和 Python 脚本设计并部署了多项自动化流程,应用于数据收集、文件处理、报告生成等工作。

教育经历

  • 2022-04-01 - 2024-03-31电气通信大学计算机科学与技术硕士

    多次发表国际论文,模型精度达SOTA

语言

普通话
日语
英语
0
1
2
3
4
5
0
1
2
3
4
5

技能

Node.js
websocket
openCV
postgres
Docker
Torch
0
1
2
3
4
5
0
1
2
3
4
5
作品
人-物体交互检测系统模型

项目背景与问题 当前基于Transformer的人物-物体交互(HOI)检测方法通常依赖DETR目标检测和多模态视觉语言模型(VLM)的先验知识,虽然精度高,但存在训练时间长、优化复杂等问题,特别是在同时预测物体和交互时,query表示模糊、动词和HOI标签之间存在语义差距。 我们的方法:SOV-STG-VLA 1. 本项目提出了一个新方法 SOV-STG-VLA,由三部分组成: 2. SOV解码器:将主语-宾语-动词解耦建模,独立处理目标检测和动词识别,使用创新的交互区域表示提升表达清晰度。 3. STG去噪策略:引入“特定目标引导”的去噪机制,利用真实标签信息优化query嵌入训练过程,提升训练效果与推理鲁棒性。 4. VLA视觉语言顾问:设计一个融合模块,引入VLM中的视觉知识,与交互区域信息融合,同时通过动词与HOI标签之间的“桥接模块”提升交互理解能力。 实验结果与贡献 本方法在准确率上达到了SOTA(当前最优),同时只用了原有方法六分之一的训练轮数即可收敛,显著提高了训练效率,为HOI任务提供了更高效、更易优化的新思路。

0
2025-04-19 23:39
更新于: 04-20 浏览: 69