基于CLARA聚类的期货量化引擎产品系统Vibe Coding

我要开发同款
proginn07545479962026年06月26日
6阅读

技术信息

语言技术
Torch
系统类型
Windows
行业分类
人工智能

作品详情

行业场景

本系统主要面向国内商品期货的量化投研与自动交易场景,适用于高频数据(分钟级K线)下的信号生成、风险度量与多品种联合预测。具体业务背景包括:

多品种、多周期数据融合:期货市场包含数十个活跃品种(如FG、RB、SF、SM等),各品种交易时间、流动性、波动特征各异,需要统一的数据对齐与预处理框架。

形态学驱动的交易逻辑:经典技术分析中的“头肩顶”“红三兵”等形态,本质上是时间序列的局部相似性问题。本项目通过滑动窗口DTW聚类,将30分钟窗口内的多维K线数据(价格、成交量、技术指标)自动归类为若干典型形态,替代人工看图的主观判断。

多品种关系建模:不同品种之间存在联动或套利关系(如螺纹钢RB与铁矿石FG),通过“关系聚类”思想,将A-B联合预测A的模型迁移到C-D联合预测C的场景,提升小品种的预测鲁棒性。

精细化风险控制:交易信号(做多/做空倾向)与风险信号(上行/下行波动率)联合输出,为仓位管理和止损决策提供量化依据。

功能介绍

项目包含八大核心模块:①数据预处理与对齐——多源CSV加载、交易时段分钟级对齐、缺失值填充与Flag标记;②技术指标计算——批量生成MA、EMA、RSI、RSV;③信号生成——基于指数衰减加权的未来收益综合信号S及上行风险R_up、下行风险R_down;④形态学聚类(CLARA+DTW)——滑动窗口提取、多维DTW距离计算、K-Medoids聚类;⑤聚类标签回标——将窗口类别回标至原始数据,生成One‑Hot特征;⑥MLP预测模型——融合聚类标签与归一化数值特征,预测S/R_up/R_down;⑦超参数优化——遗传算法自动搜索学习率、网络结构、Dropout、Batch Size等;⑧TabPFN基线对比——作为小样本回归基准。系统以形态自动量化为主线,将K线图形识别转化为曲线聚类,使模型自主学习历史重复模式,输出可解释的交易方向与风险度量,支撑自动化决策。

项目实现

“我”负责整体架构设计、全链路流程编排、核心算法实现(DTW加速、CLARA框架、遗传算法对接)、特征工程方案制定(各列归一化策略)、多品种并行适配以及模型评估对比。技术栈:Python、PyTorch、dtaidistance、scikit‑learn‑extra、PyGAD、Pandas/NumPy、multiprocessing、Numba。架构亮点:分层特征工程(绝对值感知+形态学识别)、CLARA+DTW大规模聚类(抽样+并行降低复杂度)、遗传算法闭环优化超参数、支持双品种联合建模。难点解决:DTW效率通过C加速+批处理+多进程;跨文件边界泄漏用is_first_row标志过滤窗口;多品种对齐采用交易时间并集基准;聚类数K由Gap Statistic自动确定。系统已实现从原始数据到预测信号的全自动流水线,并支持多品种扩展。

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论