主要使用的技术是Hive,对于大量的离线数据进行清洗,过滤最后入库操作。 常用的是分区分桶表,数据存储在HDFS上,通过写HQL语句来完成数据的ETL过程。
评论
您好 👋
我们能提供什么帮助?
向我们发送消息
常见问题、使用帮助、人工咨询等
使用微信扫一扫
评论