数仓采集通道的设计写在前面方案一:方案二:方案三:最终方案写在前面离线和实时数仓共用一套数据采集通道系统数据采集存储到HDFS上完全分布式(三台节点)方案一:(node01)Flume(TailDir Source) + Kafka Channel + HDFS Sink + Kafka --> Kafka(node02)架构图:Kafka Channel有一个参数:parseAsFlum
jps查看进程出现「xxxx -- process information unavailable」0. 写在前面1. 报错2. 参考0. 写在前面实验背景:离线数仓使用Kerberos安全环境下Linux:CentOS7.5Azkaban:Azkaban3.84.4Hadoop:Hadoop3.1.3Hive:Hive3.1.2Kylin:Kylin3.0.2ZooKee
离线数仓之Kerberos基本使用及问题记录0. 写在前面1. Kerberos基本使用0. 启动Kerberos相关服务1. 安全模式下启动Hadoop集群2. 安装Kerberos客户端访问HDFS页面0. Windows下安装MIT Kerberos Ticket Manager1. 使用「MIT Kerberos Ticket Manager」
关于Presto对lzo压缩的表查询使用记录0.写在前面1.正文0.提前说明1.查询ads层表2.查询dwd|dws|dwt层表3.查询ods层表0.写在前面实验背景:离线数仓项目Presto版本:0.196Hive版本:3.1.2Hadoop版本:3.1.31.正文0.提前说明纯lzo压缩:ods层parquet列式存储加lzo压缩:dwd,dws,d
Kylin启动失败||启动成功但Web界面显示4040.写在前面1.原因一:环境变量配置问题2.原因二:Kylin兼容性问题没有得到解决3.原因三:hive-site.xml配置文件的问题0.写在前面实验背景:离线数仓项目Kylin版本:Kylin3.0.2Hadooop版本:Hadoop-3.1.3Zookeeper版本:zookeeper-3.5.7Hive版本
Superset执行「superset db upgrade」命令的报错记录零、写在前面一、「superset db upgrade」报错记录0. 按照尚硅谷视频操作,执行到「superset db upgrade」出现以下错误二、报错2解决方案「Python3.7和3.9均有这个error」报错2报错原因解决方法三、报错3解决方案报错3
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号