Hadoop

项目名称:项目三:基于头条巨量引擎,百度营销和阿里汇川爬虫软件架构:python3,cv2(open-cv),muggle-ocr,pyppeteer项目描述:主要运用多进程和多协程通过opencv和muggle-ocr绕过滑动验证码以及复杂图片的验证,实现自动化入库投放渠道信息,通过spark和p
580Python云计算
软件架构:python3,scala,spark,flink,实时数仓,离线数仓项目描述:主要通过spark构建离线数仓和flink构建实时数仓来实现风险监控、风险预警和风险数仓,通过监控指标和归因指标以及数仓建模实现自动预警,高效反馈关键考核指标的变化因素,支持风险团队的快速分析,高效定位问题,以
660Python云计算
大数据平台产品系统
项目名称:项目一:开发大数据平台,基于大数据平台做用户画像软件架构:flink,hadoop,spark,presto,java,python3,mapreduce,shell,kafka,sklearn,doplinscheduler项目描述:每天从百度上百亿数据刻画用户画像来提高用户续费率。责任
540Python云计算
基于多模态大模型(ImageBind)的推荐系统,主要解决传统协同过滤算法的冷启动问题和信息茧房现象。系统通过深度语义理解内容特征,能够实现跨模态推荐,并提供更加多样化的推荐结果。系统主要分为离线处理层、数据存储层和在线服务层三个部分,采用召回-排序的两阶段推荐架构。在召回阶段使用多种策略并行检索候
1860Python人工智能
1、数据源接入模块:承担数据的传输与清洗的角色。2、数仓模块:数据建模,通过将原始数据进行多层处理变换,使最新数据拆分到维度层中存储,历史数据抽象到其余层级进行加工,最终达到分析统计以及展示目的。3、规则组装模块:生成存储标签系统的规则语句。4、标签模块:根据标签规则库中定义的标签规则对人事数据进行
700Java工业互联网
当前共5个项目more
×
寻找源码
源码描述
联系方式
提交