p01项目简介

尚硅谷数据仓库 尚硅谷数仓项目资料_数据

p02 项目需求分析

尚硅谷数据仓库 尚硅谷数仓项目资料_java_02

p03 阿里云技术框架

尚硅谷数据仓库 尚硅谷数仓项目资料_java_03

p04 技术选型

尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_04

P05系统架构设计

尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_05

p06 业务流程

尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_06

p07 电商表结构

尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_07

p08 rds购买

尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_08

p09 rds配置及连接

设置白名单

尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_09


尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_10


尚硅谷数据仓库 尚硅谷数仓项目资料_java_11

申请外网地址

尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_12


尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_13

创建账号

尚硅谷数据仓库 尚硅谷数仓项目资料_数据_14


尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_15

p10 创建业务数据库及表

尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_16


执行sql脚本

尚硅谷数据仓库 尚硅谷数仓项目资料_数据_17


尚硅谷数据仓库 尚硅谷数仓项目资料_数据_18

p11 创建DataHub及Project

尚硅谷数据仓库 尚硅谷数仓项目资料_java_19


尚硅谷数据仓库 尚硅谷数仓项目资料_java_20


尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_21


尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_22

创建dataHub

尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_23


尚硅谷数据仓库 尚硅谷数仓项目资料_数据_24


尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_25


尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_26


可以创建topic,这里不用创建,我们直接使用DTS同步数据,会自动创建topic

尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_27

p12 同步事实表到datahub

尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_28


尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_29


尚硅谷数据仓库 尚硅谷数仓项目资料_数据_30


尚硅谷数据仓库 尚硅谷数仓项目资料_java_31


尚硅谷数据仓库 尚硅谷数仓项目资料_java_32


尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_33


尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_34


进入,得先配置同步链路

尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_35


同步设置

尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_36


下一步

尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_37


尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_38


尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_39


尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_40


尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_41


RDS中准备数据,datahub中也会有数据了

尚硅谷数据仓库 尚硅谷数仓项目资料_数据_42

p13 同步维表到mysql

尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_43


创建维表库

尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_44

尚硅谷数据仓库 尚硅谷数仓项目资料_java_45


继续使用DTS同步

尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_46


从rds同步到另一个rds

尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_47


开通之后有2个实例了

尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_48


同步链路设置,这里是测试所以是同一台实例服务器,实际工作为2台

尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_49


尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_50


等待变为同步中,就可以了

尚硅谷数据仓库 尚硅谷数仓项目资料_java_51


视图,减少后续级联

尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_52


尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_53


创建了2个视图 省份地区视图 商品分类视图

尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_54

p14 实时数仓分层

尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_55


尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_56

p15 创建集群和创建项目

尚硅谷数据仓库 尚硅谷数仓项目资料_数据_57


尚硅谷数据仓库 尚硅谷数仓项目资料_java_58


尚硅谷数据仓库 尚硅谷数仓项目资料_java_59


尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_60


尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_61


尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_62


尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_63


尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_64


尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_65


创建项目

尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_66


尚硅谷数据仓库 尚硅谷数仓项目资料_数据_67


尚硅谷数据仓库 尚硅谷数仓项目资料_java_68

p16 创建工作空间及业务开发平台

创建工作空间dataworks

尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_69


尚硅谷数据仓库 尚硅谷数仓项目资料_数据_70


尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_71


尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_72


尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_73


尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_74


尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_75


尚硅谷数据仓库 尚硅谷数仓项目资料_数据_76

p17 建立任务及flinkSQL开发手册

尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_77


尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_78


尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_79


可以使用组件拖拽,但是我们不使用这种方式,我们使用sql模式

尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_80


尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_81


帮助文档

数据源表是ods层,数据结果表是dwd层

尚硅谷数据仓库 尚硅谷数仓项目资料_业务流程_82


尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_83

尚硅谷数据仓库 尚硅谷数仓项目资料_java_84

p18 ODS到DWD层的业务流程

注意 1:由于数据都是 DTS 推送过来的,推送过来的字段都在原来的表字段前面加上
了一个 dts_前缀。
注意 2:dts_utc_timestamp、dts_operation_flag、dts_after_flag 是 DataHub 框架提供的字
段。dts_operation_flag=‘U’表示修改、 ‘I’表示插入、‘D’表示删除,dts_after_flag=‘Y’
注意 3:dts_order_status=1 表示下单,dts_order_status=2 表示已支付

order_info 数据源表
order_detail 数据源表

尚硅谷数据仓库 尚硅谷数仓项目资料_数据源_85


dwd_paid_order_detail 数据结果表

尚硅谷数据仓库 尚硅谷数仓项目资料_尚硅谷数据仓库_86