AI模型算力
全职 · 300/日  ·  6525/月
工作时间: 工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

专业技能


深度学习框架:TensorFlow, PyTorch, Keras

编程语言:Python, C++, Java

自然语言处理技术:文本分类、情感分析、机器翻译

大规模数据处理:Spark, Hadoop

模型优化:分布式训练、模型剪枝、量化

项目经验


超大规模预训练模型研发


负责设计并实现了一款基于Transformer架构的超大规模预训练模型,模型参数量超过10亿。通过自定义分布式训练框架显著提升了训练效率,最终模型在多个基准测试中取得了SOTA性能。

智能客服系统开发


团队开发了一套基于深度学习的智能客服系统,实现了用户意图识别、对话管理等功能。系统上线后,客户满意度提高了20%,人工客服负担减轻了30%。


具备多年算法开发和优化经验的算法专家,擅长机器学习、深度学习和计算机语言模型。具备扎实的理论基础和丰富的实战经验,能够在高压环境下高效工作,善于团队协作和跨部门沟通。

工作经历

  • 2025-03-05 -至今阿里云大模型

    超大规模预训练模型研发 负责设计并实现了一款基于Transformer架构的超大规模预训练模型,模型参数量超过10亿。通过自定义分布式训练框架显著提升了训练效率,最终模型在多个基准测试中取得了SOTA性能。 智能客服系统开发 团队开发了一套基于深度学习的智能客服系统,实现了用户意图识别、对话管理等功能。系统上线后,客户满意度提高了20%,人工客服负担减轻了30%。 具备多年算法开发和优化经验的算法专家,擅长机器学习、深度学习和计算机语言模型。具备扎实的理论基础和丰富的实战经验,能够在高压环境下高效工作,善于团队协作和跨部门沟通。

教育经历

  • 2020-03-10 - 2024-06-12四川大学计算机科学与技术本科

技能

HTML5
0
1
2
3
4
5
0
1
2
3
4
5
作品
超大规模预训练模型研发  负责设计并实现了一款基于Transformer架构的超大规模预训练模型,模

深度学习框架:TensorFlow, PyTorch, Keras 编程语言:Python, C++, Java 自然语言处理技术:文本分类、情感分析、机器翻译 大规模数据处理:Spark, Hadoop 模型优化:分布式训练、模型剪枝、量化

0
2024-11-07 18:27
更新于: 05-30 浏览: 6