CDH介绍


文章目录

  • CDH介绍
  • 1、需求
  • 2、Apache Hadoop 不足之处
  • 3、Hadoop 发行版
  • 4、CDH
  • 5、CDH下载地址
  • 6、Cloudera Manager简介


1、需求

需要搭建1000台服务器的集群,最少要花费多长时间来搭建好Hadoop集群,包括Hive、Hbase、Flume、Kafka、Spark等等
只给你一天时间,完成以上工作?
对于以上集群进行hadoop版本升级,你会选择什么升级方案,最少花费多长时间?
新版本的Hadoop,与Hive、Hbase、Flume、Kafka、Spark等等兼容?

2、Apache Hadoop 不足之处

版本管理混乱
部署过程繁琐、升级过程复杂
兼容性差
安全性低

在商业应用中,对于企业成百上千的机器集群进行安装hadoop一系列组件费时费力,而且hadoop各个开源组件版本混乱,管理升级也比较困难,对于企业日常的管理维护带来极大不方便,现在商用的比较流行国外的是CDH(Cloudera’s Distribution Including Apache Hadoop),国内是星环、华为等公司,他们改造封装了HADOOP生态组件来出售。

3、Hadoop 发行版

Apache Hadoop
Cloudera’ s Distribution Including Apache Hadoop(CDH)
Hortonworks data Platform(HDP)
MapR
EMR

4、CDH

Cloudera’s Distribution,including Apache Hadoop
是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建
提供了Hadoop的核心
可扩展存储
分布式计算
基于Web的用户界面

cdh hdp 架构 cdh包含哪些组件_Hadoop


1)CDH的优点

版本划分清晰

版本更新速度比较快

支持Kerberos安全认证

文档清晰

支持多种安装方式

2)CDH安装方式
Cloudera Manager
Yum
Rpm
Tarball

5、CDH下载地址

CDH5.10
http://archive.cloudera.com/cdh5/parcels/5.10.0/

Cloudera Manager5.10.0
https://www.cloudera.com/downloads/manager/5-10-0.html

6、Cloudera Manager简介

Cloudera Manager(简称CM)是Cloudera公司开发的一款大数据集群安装部署利器,这款利器具有集群自动化安装、中心化管理、集群监控、报警等功能,使得安装集群从几天的时间缩短在几小时以内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。
架构

cdh hdp 架构 cdh包含哪些组件_cdh hdp 架构_02

Server
管理控制台服务器和应用程序逻辑
负责软件安装、配置
启动和停止服务
管理服务运行的集群
Agent
安装在每台主机上
负责启动和停止进程,配置,监控主机
Management Service
由一组角色组成的服务,执行各种监控、报警和报告功能
Database
Cloudera Repository
Clients
Admin Console
API
作用:
管理:对集群进行管理,如添加、删除节点等操作。
监控:监控集群的健康情况,对设置的各种指标和系统运行情况进行全面监控。
诊断:对集群出现的问题进行诊断,对出现的问题给出
集成:对hadoop的多组件进行整合