..
一.需求介绍 前些天碰见个需求,摘取其中一小部分,有用户表,医院表,地区表,以医院和日期(天)的维度下,获取总数。 在数据仓库没有搭建好的情况下,从mysql库ode(源数据),处理完成导入到另一个库中,下面看图示意。 用户与医院是一对多的关系,这个是2B项目,医院分割用户,医院与地区是多对一的关系。在源数据库处理完数据结果保存到上述表中。二.技术介绍 ...
文章目录一.安装二.理论基础三.实战2.1 hbase2.2 sql2.3 机器学习2.4 Graphx2.5 报错四.源码一.安装Spark介绍系列02–安装集群:https://limeng.blog.csdn.net/article/details/82803783hive on spark安装:https://limeng.blog.csdn.net/article/details/71023759二.理论基础Dataflow Model总结:https://limeng.blog
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号