轻风1780全栈-程序员客栈

?专业技能Java开发基础： 熟悉Java核心语法，了解JVM内存模型（JMM）、GC算法（如G1、ZGC）及调优、多线程编程。
后端开发框架： 熟悉Spring、SpringBoot、SpringMVC、MyBatis等主流框架，理解其核心原理（如IOC/AOP、自动装配）。
数据库与缓存：熟悉MySQL，熟悉索引优化（B+树）、SQL性能调优及事务机制（隔离级别、MVCC）。
熟悉Redis，熟悉多种数据结构及应用场景，了解持久化、主从复制及集群模式。消息队列与中间件： 熟悉RabbitMQ处理异步通信、系统解耦及流量削峰，理解其核心机制保证消息可靠性。
系统与底层开发： 熟悉Linux系统及常用命令，具备Shell脚本编写能力。掌握C/C++，有Linux环境下的多进程/多线程编程经验，熟悉信号、管道、共享内存等进程间通信机制。
其他技能： 熟悉Python，有爬虫、数据分析及OpenCV基础图像处理项目经验。了解HTML、CSS、JavaScript基础。

?个人项目

一、InstantStock(瞬时行情) — 分布式高频数据采集与分析平台JAVA2025.12 - 至今

技术栈： Spring Boot, MyBatis, MySQL, Redis, Caffeine, RabbitMQ, XXL-JOB, EasyExcel, Swagger/Knife4j, HttpClient (RestTemplate)

项目描述： 该项目是一个基于 Spring Boot 的分布式多模块股票行情分析系统，旨在为用户提供国内 A 股大盘、个股及板块的实时交易数据分析。系统涵盖了数据自动化采集、多级缓存高性能查询、异步消息通知以及复杂业务统计报表等核心功能。

核心职责/技术亮点：

高并发数据采集： 利用 XXL-JOB 构建分布式任务调度平台，结合 RestTemplate 和自定义 多线程线程池（ThreadPoolTaskExecutor），实现了对新浪财经等外部接口的分钟级高并发数据爬取与解析。
多级缓存架构： 设计并实现了 Redis + Caffeine 二级缓存 方案。通过本地缓存减少 RPC 开销，并有效应对了开盘期间的高频访问压力。
异步解耦与通知： 引入 RabbitMQ 消息中间件，在数据采集完成后异步通知业务模块更新缓存，实现了采集任务与业务查询的彻底解耦。
复杂行情统计： 编写高性能 MyBatis SQL 逻辑，实现了沪深两市成交量实时对比、个股涨跌幅区间分布统计、以及基于个股分时与日 K 线的可视化数据接口。
高性能数据报表： 集成 EasyExcel 框架，实现了百万级股票涨幅榜数据的快速导出功能，支持响应式 Web 下载，优化了大数据量下的内存占用问题。
安全认证与工具集： 基于 Hutool 实现了图形验证码校验，采用 BCrypt 加密算法保障用户信息安全，并使用 雪花算法 生成分布式唯一 ID。

二、Taobao-SmartCTR：基于大数据架构的淘宝广告行为建模与预测系统Python2025.12 - 2026.01

技术栈： Spark (PySpark), Hadoop (HDFS), PySpark MLlib, Python, MySQL, Flask, ECharts

项目描述： 本项目针对淘宝 22GB（约数千万条记录）的海量广告点击数据集，搭建了从分布式存储、并行预处理到分布式机器学习建模及可视化展示的完整链路。系统通过 Hadoop 与 Spark 架构解决了单机处理超大规模数据的性能瓶颈，实现了对用户画像、商品特征与点击行为的深度挖掘，并构建了高产出的点击率（CTR）预估模型。

核心职责/技术亮点：

大数据分布式存储与计算优化： 针对 22GB 原始数据，利用 Hadoop (HDFS) 实现高可用存储，并通过 Spark 搭建分布式处理流程。采用 RDD/DataFrame 算子优化与分批载入内存策略，有效解决了海量数据清洗过程中的内存溢出（OOM）问题，大幅提升了预处理效率。分布式特征工程流（Pipeline）： 基于 pyspark.ml.feature 模块构建了自动化特征处理流水线。独立完成数千万级数据的特征提取、StringIndexer 类别索引、OneHotEncoder 独热编码及 VectorAssembler 特征组装，为模型提供了高性能的稀疏向量输入。高并发机器学习建模与评估： 利用 PySpark MLlib 构建分布式逻辑回归（Logistic Regression）模型，实现端到端的模型训练与测试。引入校准曲线（Calibration Curve）对预测概率进行偏差分析，并通过 BinaryClassificationEvaluator 评估 AUC 指标，确保模型在业务场景下的预测精度。数据驱动洞察与可视化看板： 结合 Flask 后端与 ECharts 前端框架，将处理后的海量分析结果（如用户偏好、价格敏感度、各时段 CTR 走势）转化为 6 大核心业务维度的交互式看板，辅助运营团队实现精准营销与投放策略优化。

三、LightWeb HTTP Server - 多线程Web服务器实现C/C++2025.05 - 2025.07

核心技术： C语言、Linux系统编程、POSIX线程、TCP/IP协议栈、HTTP协议架构设计： 采用主线程监听+工作线程处理的并发模型，通过分离线程属性优化资源管理
HTTP协议实现： 完整解析HTTP请求行、头部字段，支持Keep-Alive持久连接，实现RFC标准的状态码响应
网络编程： 基于TCP Socket实现，设置SO_REUSEADDR解决TIME_WAIT问题，实现非阻塞式请求接收
资源管理： 实现文件存在性检查、MIME类型自动识别（支持200+文件类型）、静态文件高效传输
并发控制： 使用pthread线程库，通过信号机制忽略干扰信号，保证服务稳定性
性能优化： 调整系统RLIMIT_NOFILE限制以支持高并发连接，优化内存分配减少碎片
模块化设计： 清晰划分为server、client、http、socket、resource、signals六大模块，代码可维护性强

其它：

C++贪吃蛇游戏：使用C++实现经典贪吃蛇游戏，包含完整游戏逻辑、碰撞检测和分数系统
OpenCV手势识别：基于计算机视觉技术实现15种手势识别，应用图像处理和特征提取技术

?获奖经历马蹄杯算法类竞赛 - 省赛二等奖一次，国赛二等奖一次蓝桥杯算法类竞赛 - 省赛二等奖两次中国高校计算机大赛-团体程序设计天梯赛 - 团队三等奖孙越崎三等奖牛客寒假训练营三等奖

2026-01-29 -2026-03-29河南创云产业园管理有限公司AI后端开发实习生
公司的主要业务方向（业务背景）公司深耕 AIoT（人工智能物联网）与智能家居/智能硬件领域。主要业务涉及研发具备前沿AI交互能力的智能硬件终端（如基于 ESP32 芯片的随身助理、智能中控面板或智能音箱等），并提供支撑这些硬件的高性能云端 AI 服务。公司致力于解决传统物联网语音设备“交互生硬、响应延迟高”的痛点，通过结合最新一代的大语言模型（LLM）与流式语音技术，为终端用户提供极低延迟、支持全双工“打断”的真人级别自然对话体验。工作职责与内容岗位角色推断：后端开发实习生 / Python开发工程师 / AIoT服务端研发核心职责概括：在实习期间，作为核心开发人员，独立负责了核心业务“小智语音助手中台”的架构设计与从0到1的落地研发。成功打通了硬件终端与云端AI的桥梁，构建了一套高并发、全异步、超低延迟的流式语音交互基座。全双工流式网络架构设计：基于 Python 3.11+ 和 FastAPI 框架，使用 WebSocket 技术搭建了云端与物联网硬件（ESP32等）之间的全双工长连接基座。

2023-09-01 - 2027-06-30河南理工大学大数据本科已认证

中文母语水平

C掌握

Python掌握

Java熟练

作品

小智语音助手中台 (Xiaozhi Voice Assistant Middleware)

本项目是一个专为高并发流式语音交互打造的后端服务，主要包含以下核心功能模块：全双工网络通信模块：基于FastAPIWebSocket建立实时长连接，支持音频二进制裸流和JSON指令的高效双向并发传输。流式语音识别(ASR)模块：深度集成阿里云Paraformer引擎，支持边听边转文字，大幅缩减识别延