Kylin使用

①新建一个Project

②在工程中,连接Hive,选择感兴趣的表和库

③从感兴趣的表和库,进行 建模(星型模型,雪花模型)

④从建的模型中定义Cube

⑤将定义的Cube执行运算(build)

⑥Cube计算完毕,使用SQL进行查询

1. 创建工程

1)点击下图中的"+"。

kylin系统Python kylin使用_Hive

2)填写项目名称和描述信息,并点击Submit按钮提交。

kylin系统Python kylin使用_Hive_02

2. 获取数据源

1)点击DataSource

kylin系统Python kylin使用_kylin_03

2)点击下图按钮导入Hive表

kylin系统Python kylin使用_kylin系统Python_04

3)选择所需数据表,并点击Sync按钮

kylin系统Python kylin使用_字段_05

3. 创建model

1)点击Models,点击"+New"按钮,点击"★New Model"按钮。

kylin系统Python kylin使用_字段_06

2)填写Model信息,点击Next

kylin系统Python kylin使用_Hive_07

3)指定事实表

kylin系统Python kylin使用_Hive_08

4)选择维度表,并指定事实表和维度表的关联条件,点击Ok

kylin系统Python kylin使用_Hive_09

维度表添加完毕之后,点击Next

kylin系统Python kylin使用_kylin_10

5)指定维度字段,并点击Next

kylin系统Python kylin使用_大数据_11

6)指定度量字段,并点击Next

kylin系统Python kylin使用_大数据_12

7)指定事实表分区字段(仅支持时间分区),点击Save按钮,model创建完毕

kylin系统Python kylin使用_kylin_13

4. 构建cube

1)点击new, 并点击new cube

kylin系统Python kylin使用_大数据_14

2)填写cube信息,选择cube所依赖的model,并点击next

kylin系统Python kylin使用_Hive_15

3)选择所需的维度,如下图所示

kylin系统Python kylin使用_kylin_16

4)选择所需度量值,如下图所示

kylin系统Python kylin使用_字段_17

4)cube自动合并设置,cube需按照日期分区字段每天进行构建,每次构建的结果会保存在Hbase中的一张表内,为提高查询效率,需将每日的cube进行合并,此处可设置合并周期。

kylin系统Python kylin使用_kylin系统Python_18

5)Kylin高级配置(优化相关,暂时跳过)

kylin系统Python kylin使用_kylin系统Python_19

6)Kylin相关属性配置覆盖

kylin系统Python kylin使用_kylin系统Python_20

7)Cube信息总览,点击Save,Cube创建完成

kylin系统Python kylin使用_字段_21

8)构建Cube(计算),点击对应Cube的action按钮,选择build

kylin系统Python kylin使用_字段_22

9)选择要构建的时间区间,点击Submit

kylin系统Python kylin使用_Hive_23

10)点击Monitor查看构建进度

kylin系统Python kylin使用_kylin系统Python_24