



个人介绍
专业技能
深度学习框架:TensorFlow, PyTorch, Keras
编程语言:Python, C++, Java
自然语言处理技术:文本分类、情感分析、机器翻译
大规模数据处理:Spark, Hadoop
模型优化:分布式训练、模型剪枝、量化
项目经验
超大规模预训练模型研发
负责设计并实现了一款基于Transformer架构的超大规模预训练模型,模型参数量超过10亿。通过自定义分布式训练框架显著提升了训练效率,最终模型在多个基准测试中取得了SOTA性能。
智能客服系统开发
团队开发了一套基于深度学习的智能客服系统,实现了用户意图识别、对话管理等功能。系统上线后,客户满意度提高了20%,人工客服负担减轻了30%。
具备多年算法开发和优化经验的算法专家,擅长机器学习、深度学习和计算机语言模型。具备扎实的理论基础和丰富的实战经验,能够在高压环境下高效工作,善于团队协作和跨部门沟通。
工作经历
2025-03-05 -至今阿里云大模型
超大规模预训练模型研发 负责设计并实现了一款基于Transformer架构的超大规模预训练模型,模型参数量超过10亿。通过自定义分布式训练框架显著提升了训练效率,最终模型在多个基准测试中取得了SOTA性能。 智能客服系统开发 团队开发了一套基于深度学习的智能客服系统,实现了用户意图识别、对话管理等功能。系统上线后,客户满意度提高了20%,人工客服负担减轻了30%。 具备多年算法开发和优化经验的算法专家,擅长机器学习、深度学习和计算机语言模型。具备扎实的理论基础和丰富的实战经验,能够在高压环境下高效工作,善于团队协作和跨部门沟通。
教育经历
2020-03-10 - 2024-06-12四川大学计算机科学与技术本科