基于paimon+Flink+StarRocks的实时湖仓开源项目

我要开发同款
fyy2026年02月10日
9阅读

技术信息

语言技术
JavaMySQLApacheLinux
系统类型
Linux
行业分类
电商人工智能
开源地址
https://github.com/fengyu-eng/paimon-datalake
授权协议
Apache许可

功能介绍

项目背景: 本项目旨在构建一个高效、可扩展的电商实时数据湖仓,通过对海量电商业务数据的采集、清
洗、转换和存储,为企业提供准确、全面的数据支持,助力业务决策与分析。
项目职责与成果:
• 数仓建模:
– ODS 层: 采用 Flink CDC 搭建数据采集传输架构,支持 MySQL、Kafka 多源数据接入,将原始数据同
步至 Paimon 表,数据文件落地到 HDFS,数据端到端更新延迟控制在 5 秒内,数据完整性达 99.99%
– DIM 层: 运用维度建模理论设计构建核心维度表(用户、商品等),基于 Paimon 构建拉链表处理缓
慢变化维,维度数据更新时效

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论