Kylin使用
①新建一个Project
②在工程中,连接Hive,选择感兴趣的表和库
③从感兴趣的表和库,进行 建模(星型模型,雪花模型)
④从建的模型中定义Cube
⑤将定义的Cube执行运算(build)
⑥Cube计算完毕,使用SQL进行查询
1. 创建工程
1)点击下图中的"+"。
2)填写项目名称和描述信息,并点击Submit按钮提交。
2. 获取数据源
1)点击DataSource
2)点击下图按钮导入Hive表
3)选择所需数据表,并点击Sync按钮
3. 创建model
1)点击Models,点击"+New"按钮,点击"★New Model"按钮。
2)填写Model信息,点击Next
3)指定事实表
4)选择维度表,并指定事实表和维度表的关联条件,点击Ok
维度表添加完毕之后,点击Next
5)指定维度字段,并点击Next
6)指定度量字段,并点击Next
7)指定事实表分区字段(仅支持时间分区),点击Save按钮,model创建完毕
4. 构建cube
1)点击new, 并点击new cube
2)填写cube信息,选择cube所依赖的model,并点击next
3)选择所需的维度,如下图所示
4)选择所需度量值,如下图所示
4)cube自动合并设置,cube需按照日期分区字段每天进行构建,每次构建的结果会保存在Hbase中的一张表内,为提高查询效率,需将每日的cube进行合并,此处可设置合并周期。
5)Kylin高级配置(优化相关,暂时跳过)
6)Kylin相关属性配置覆盖
7)Cube信息总览,点击Save,Cube创建完成
8)构建Cube(计算),点击对应Cube的action按钮,选择build
9)选择要构建的时间区间,点击Submit
10)点击Monitor查看构建进度