proginn2124279955
1月前来过
全职 · 300/日  ·  6525/月
工作时间: 工作日20:00-01:00、周末09:00-01:00工作地点:
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

我是清华大学计算机系的一名在读本科生 目前熟练使用Torch和Fastapi,多次本地部署、微调大模型;热爱探索前沿领域(Mamba、SNN、CV等);有能力有时间学习新知识新框架,时间不紧急价格低的任务可以放心找我 如果我能帮上您的忙,请点击“立即预约”或“发布需求”!

工作经历

  • 2025-09-01 -至今自由开发者

    作为自由开发者,开发了一系列基于人工智能的应用,并探索了一写先进架构。例如双塔Mamba、动态SNN等技术

教育经历

  • 2025-09-01 - Tsinghua UniversityCS本科

    清华大学计算机系本科在读

语言

普通话母语水平
英语借工具书面交流
0
1
2
3
4
5
0
1
2
3
4
5

技能

Torch掌握
0
1
2
3
4
5
作品
双塔Mamba增强训练效果

对于Mamba传统架构在收敛性、稳定性以及灾难性遗忘问题,我设计了大塔正向+小塔逆向的模式,在计算量保持一致的情况下,在精心设计的几个任务上收敛速度、训练稳定性等多项指标上取得了显著的进步。 这对于很多序列建模、动态规划任务上有显著的意义。 今后还将继续探索在训练时加入辅助逆向塔让神经网络习得重要信息的保留1.

0
2025-09-07 17:45
更新于: 2025-09-01 浏览: 7