个人介绍
陈志涵??求职意向:JAVA后端开发
工作经验:无
电话:*
出生年月:2005年5月
邮箱:2182641908@qq.com
现住址:河南焦作
教育背景:2027届 河南理工大学 本科 大数据
?专业技能Java开发基础: 熟悉Java核心语法,了解JVM内存模型(JMM)、GC算法(如G1、ZGC)及调优、多线程编程。后端开发框架: 熟悉Spring、SpringBoot、SpringMVC、MyBatis等主流框架,理解其核心原理(如IOC/AOP、自动装配)。
数据库与缓存:熟悉MySQL, 熟悉索引优化(B+树)、SQL性能调优及事务机制(隔离级别、MVCC)。
熟悉Redis, 熟悉多种数据结构及应用场景,了解持久化、主从复制及集群模式。消息队列与中间件: 熟悉RabbitMQ处理异步通信、系统解耦及流量削峰,理解其核心机制保证消息可靠性。
系统与底层开发: 熟悉Linux系统及常用命令,具备Shell脚本编写能力。掌握C/C++, 有Linux环境下的多进程/多线程编程经验,熟悉信号、管道、共享内存等进程间通信机制。
其他技能: 熟悉Python, 有爬虫、数据分析及OpenCV基础图像处理项目经验。了解HTML、CSS、JavaScript基础。
?个人项目
一、InstantStock(瞬时行情) — 分布式高频数据采集与分析平台JAVA2025.12 - 至今
技术栈: Spring Boot, MyBatis, MySQL, Redis, Caffeine, RabbitMQ, XXL-JOB, EasyExcel, Swagger/Knife4j, HttpClient (RestTemplate)项目描述: 该项目是一个基于 Spring Boot 的分布式多模块股票行情分析系统,旨在为用户提供国内 A 股大盘、个股及板块的实时交易数据分析。系统涵盖了数据自动化采集、多级缓存高性能查询、异步消息通知以及复杂业务统计报表等核心功能。
核心职责/技术亮点:
高并发数据采集: 利用 XXL-JOB 构建分布式任务调度平台,结合 RestTemplate 和自定义 多线程线程池(ThreadPoolTaskExecutor),实现了对新浪财经等外部接口的分钟级高并发数据爬取与解析。多级缓存架构: 设计并实现了 Redis + Caffeine 二级缓存 方案。通过本地缓存减少 RPC 开销,并有效应对了开盘期间的高频访问压力。
异步解耦与通知: 引入 RabbitMQ 消息中间件,在数据采集完成后异步通知业务模块更新缓存,实现了采集任务与业务查询的彻底解耦。
复杂行情统计: 编写高性能 MyBatis SQL 逻辑,实现了沪深两市成交量实时对比、个股涨跌幅区间分布统计、以及基于个股分时与日 K 线的可视化数据接口。
高性能数据报表: 集成 EasyExcel 框架,实现了百万级股票涨幅榜数据的快速导出功能,支持响应式 Web 下载,优化了大数据量下的内存占用问题。
安全认证与工具集: 基于 Hutool 实现了图形验证码校验,采用 BCrypt 加密算法保障用户信息安全,并使用 雪花算法 生成分布式唯一 ID。
二、Taobao-SmartCTR:基于大数据架构的淘宝广告行为建模与预测系统Python2025.12 - 2026.01
技术栈: Spark (PySpark), Hadoop (HDFS), PySpark MLlib, Python, MySQL, Flask, ECharts项目描述: 本项目针对淘宝 22GB(约数千万条记录)的海量广告点击数据集,搭建了从分布式存储、并行预处理到分布式机器学习建模及可视化展示的完整链路。系统通过 Hadoop 与 Spark 架构解决了单机处理超大规模数据的性能瓶颈,实现了对用户画像、商品特征与点击行为的深度挖掘,并构建了高产出的点击率(CTR)预估模型。
核心职责/技术亮点:
大数据分布式存储与计算优化: 针对 22GB 原始数据,利用 Hadoop (HDFS) 实现高可用存储,并通过 Spark 搭建分布式处理流程。采用 RDD/DataFrame 算子优化与分批载入内存策略,有效解决了海量数据清洗过程中的内存溢出(OOM)问题,大幅提升了预处理效率。分布式特征工程流(Pipeline): 基于 pyspark.ml.feature 模块构建了自动化特征处理流水线。独立完成数千万级数据的特征提取、StringIndexer 类别索引、OneHotEncoder 独热编码及 VectorAssembler 特征组装,为模型提供了高性能的稀疏向量输入。高并发机器学习建模与评估: 利用 PySpark MLlib 构建分布式逻辑回归(Logistic Regression)模型,实现端到端的模型训练与测试。引入校准曲线(Calibration Curve)对预测概率进行偏差分析,并通过 BinaryClassificationEvaluator 评估 AUC 指标,确保模型在业务场景下的预测精度。数据驱动洞察与可视化看板: 结合 Flask 后端与 ECharts 前端框架,将处理后的海量分析结果(如用户偏好、价格敏感度、各时段 CTR 走势)转化为 6 大核心业务维度的交互式看板,辅助运营团队实现精准营销与投放策略优化。
三、LightWeb HTTP Server - 多线程Web服务器实现C/C++2025.05 - 2025.07
核心技术: C语言、Linux系统编程、POSIX线程、TCP/IP协议栈、HTTP协议架构设计: 采用主线程监听+工作线程处理的并发模型,通过分离线程属性优化资源管理HTTP协议实现: 完整解析HTTP请求行、头部字段,支持Keep-Alive持久连接,实现RFC标准的状态码响应
网络编程: 基于TCP Socket实现,设置SO_REUSEADDR解决TIME_WAIT问题,实现非阻塞式请求接收
资源管理: 实现文件存在性检查、MIME类型自动识别(支持200+文件类型)、静态文件高效传输
并发控制: 使用pthread线程库,通过信号机制忽略干扰信号,保证服务稳定性
性能优化: 调整系统RLIMIT_NOFILE限制以支持高并发连接,优化内存分配减少碎片
模块化设计: 清晰划分为server、client、http、socket、resource、signals六大模块,代码可维护性强
其它:
C++贪吃蛇游戏:使用C++实现经典贪吃蛇游戏,包含完整游戏逻辑、碰撞检测和分数系统OpenCV手势识别:基于计算机视觉技术实现15种手势识别,应用图像处理和特征提取技术
?获奖经历马蹄杯 算法类 竞赛 - 省赛二等奖一次, 国赛二等奖一次蓝桥杯 算法类 竞赛 - 省赛二等奖两次中国高校计算机大赛-团体程序设计天梯赛 - 团队三等奖孙越崎三等奖牛客寒假训练营三等奖工作经历
2026-01-29 -2026-03-29河南创云产业园管理有限公司AI后端开发实习生
公司的主要业务方向(业务背景) 公司深耕 AIoT(人工智能物联网)与智能家居/智能硬件 领域。主要业务涉及研发具备前沿AI交互能力的智能硬件终端(如基于 ESP32 芯片的随身助理、智能中控面板或智能音箱等),并提供支撑这些硬件的高性能云端 AI 服务。 公司致力于解决传统物联网语音设备“交互生硬、响应延迟高”的痛点,通过结合最新一代的大语言模型(LLM)与流式语音技术,为终端用户提供极低延迟、支持全双工“打断”的真人级别自然对话体验。 工作职责与内容 岗位角色推断:后端开发实习生 / Python开发工程师 / AIoT服务端研发 核心职责概括: 在实习期间,作为核心开发人员,独立负责了核心业务“小智语音助手中台”的架构设计与从0到1的落地研发。成功打通了硬件终端与云端AI的桥梁,构建了一套高并发、全异步、超低延迟的流式语音交互基座。 全双工流式网络架构设计: 基于 Python 3.11+ 和 FastAPI 框架,使用 WebSocket 技术搭建了云端与物联网硬件(ESP32等)之间的全双工长连接基座。
教育经历
2023-09-01 - 2027-06-30河南理工大学大数据本科
语言

本项目是一个专为高并发流式语音交互打造的后端服务,主要包含以下核心功能模块:全双工网络通信模块:基于FastAPIWebSocket建立实时长连接,支持音频二进制裸流和JSON指令的高效双向并发传输。流式语音识别(ASR)模块:深度集成阿里云Paraformer引擎,支持边听边转文字,大幅缩减识别延







