文章目录

  • 0. Ganglia简介
  • 1. Ganglia安装环境准备
  • 1.1 Ganglia依赖包
  • 1.2 Ganglia安装包
  • 2. Ganglia搭建
  • 3. 修改配置文件
  • 4. 报错信息解决
  • 4.1 /usr/sbin/gmond: error while loading shared libraries: libapr-1.so.0: cannot open shared object file:...directory


0. Ganglia简介

  • Ganglia是UC Berkeley发起的一个开源集群监视项目,设计用于测量数以千计的节点。Ganglia主要是用来监控系统性能,如:cpu 、mem、硬盘利用率, I/O负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用。
  • Ganglia由gmond、gmetad和gweb三部分组成。
  • gmond(Ganglia Monitoring Daemon)是一种轻量级服务,安装在每台需要收集指标数据的节点主机上。gmond在每台主机上完成实际意义上的指标数据收集工作,并通过侦听/通告协议和集群内其他节点共享数据。使用gmond,你可以很容易收集很多系统指标数据,如CPU、内存、磁盘、网络和活跃进程的数据等。gmond相当于一个代理(agent)服务进程,它收集到很多监控的元数据信息后,等待gmetad周期性地轮询这些信息。gmond进程运行时给系统带来的负载是非常小的,从而不会影响用户应用程序性能。
  • gmetad(Ganglia Meta Daemon)是一种从其他gmetad或gmond源收集指标数据,并将其以RRD格式存储至磁盘的服务。gmetad为从主机组收集的特定指标信息提供了简单的查询机制,并支持分级授权,使得创建联合监测域成为可能。gmetad可以看成是Ganglia集群的Master,它采用poll的方式,主动与集群中各个gmond进程交互,周期性地轮询每个gmond进程收集到的元数据,然后存储到RRD数据库中,为Web展示监控数据做准备。
  • gweb(Ganglia Web)gweb是一种利用浏览器显示gmetad所存储数据的PHP前端。在Web界面中以图表方式展现集群的运行状态下收集的多种不同指标数据。用来展示的数据,实际上是经过RRDTool这个工具处理过的。

1. Ganglia安装环境准备

1.1 Ganglia依赖包

libconfuse-2.7-7.el7.x86_64.rpm
libmemcached-1.0.16-5.el7.x86_64.rpm
php-bcmath-5.4.16-46.el7.x86_64.rpm
php-common-5.4.16-46.el7.x86_64.rpm
php-gd-5.4.16-46.el7.x86_64.rpm
php-process-5.4.16-46.el7.x86_64.rpm
php-ZendFramework-1.12.20-1.el7.noarch.rpm
php-cli-5.4.16-46.el7.x86_64.rpm
php-5.4.16-46.el7.x86_64.rpm --nodeps --force
rrdtool-1.4.8-9.el7.x86_64.rpm
rrdtool-devel-1.4.8-9.el7.x86_64.rpm
t1lib-5.1.2-14.el7.x86_64.rpm

1.2 Ganglia安装包

ganglia-3.7.2-2.el7.x86_64.rpm
ganglia-gmetad-3.7.2-2.el7.x86_64.rpm
ganglia-gmond-3.7.2-2.el7.x86_64.rpm
ganglia-gmond-python-3.7.2-2.el7.x86_64.rpm
ganglia-web-3.7.1-2.el7.x86_64.rpm

2. Ganglia搭建

# 在集群所有节点搭建Ganglia依赖环境  --nodeps 安装时不检查依赖关系 --force 强制安装
[root@manager tgm]# rpm -ivh libconfuse-2.7-7.el7.x86_64.rpm
[root@manager tgm]# rpm -ivh libmemcached-1.0.16-5.el7.x86_64.rpm
[root@manager tgm]# rpm -ivh php-bcmath-5.4.16-46.el7.x86_64.rpm --nodeps --force
[root@manager tgm]# rpm -ivh php-common-5.4.16-46.el7.x86_64.rpm --nodeps --force
[root@manager tgm]# rpm -ivh php-gd-5.4.16-46.el7.x86_64.rpm --nodeps --force
[root@manager tgm]# rpm -ivh php-process-5.4.16-46.el7.x86_64.rpm --nodeps --force
[root@manager tgm]# rpm -ivh php-ZendFramework-1.12.20-1.el7.noarch.rpm --nodeps --force
[root@manager tgm]# rpm -ivh php-5.4.16-46.el7.x86_64.rpm --nodeps --force
[root@manager tgm]# rpm -ivh php-cli-5.4.16-46.el7.x86_64.rpm
[root@manager tgm]# rpm -ivh rrdtool-1.4.8-9.el7.x86_64.rpm --nodeps --force
[root@manager tgm]# rpm -ivh rrdtool-devel-1.4.8-9.el7.x86_64.rpm --nodeps --force
[root@manager tgm]# rpm -ivh t1lib-5.1.2-14.el7.x86_64.rpm

# 在所有节点安装Ganglia
[root@manager tgm]# rpm -ivh ganglia-3.7.2-2.el7.x86_64.rpm
[root@manager tgm]# rpm -ivh ganglia-gmond-3.7.2-2.el7.x86_64.rpm
[root@manager tgm]# rpm -ivh ganglia-gmond-python-3.7.2-2.el7.x86_64.rpm

# 只需要在主节点上安装
[root@manager tgm]# rpm -ivh ganglia-gmetad-3.7.2-2.el7.x86_64.rpm
[root@manager tgm]# yum install -y ganglia-web-3.7.1-2.el7.x86_64.rpm

# 有关Ganglia的相关配置文件
Ganglia配置文件目录:/etc/ganglia
rrd数据库存放目录:/var/lib/ganglia/rrds
httpd主站点目录:/var/www/html
ganglia-web安装目录:/usr/share/ganglia
ganglia-web配置目录:/etc/httpd/conf.d/ganglia.conf

3. 修改配置文件

# 将ganglia-web安装目录链接到httpd主站点目录
[root@manager tgm]# ln -s /usr/share/ganglia/ /var/www/html/

# 将ganglia站点目录访问权限改为apache:apache
[root@manager tgm]# cd /var/www/html/
[root@manager html]# useradd apache
[root@manager html]# chown -R apache:apache /var/www/html/ganglia
[root@manager html]# chown -R apache:apache /var/lib/ganglia
[root@manager html]# chmod -R 755 /var/www/html/ganglia

# 将rrd数据库存放目录访问权限改为nobody:nobody
[root@manager html]# chown -R nobody:nobody /var/lib/ganglia/rrds

# 修改ganglia-web的访问权限:
[root@manager html]# vim /etc/httpd/conf.d/ganglia.conf
Alias /ganglia /usr/share/ganglia
<Location /ganglia>
  Require all granted		# 只需修改这一个地方即可
  # Require ip 10.1.2.3
  # Require host example.org
</Location>

# 修改dwoo下面的权限
[root@manager html]# chmod 777 /var/lib/ganglia/dwoo/cache
[root@manager html]# chmod 777 /var/lib/ganglia/dwoo/compiled

# 修改ganglia配置文件:/etc/ganglia/gmetad.conf
[root@manager html]# vim /etc/ganglia/gmetad.conf		# 注意,所有集群节点都需要加上
data_source "hadoop cluster"  manager.bigdata:8649 master1.bigdata:8649 master2.bigdata:8649 worker1.bigdata:8649 worker2.bigdata:8649 worker3.bigdata:8649 worker4.bigdata:8649 worker5.bigdata:8649 worker6.bigdata:8649
setuid_username nobody

# 修改ganglia配置文件:/etc/ganglia/gmond.conf
[root@manager html]# vim /etc/ganglia/gmond.conf
cluster {
  name = "hadoop cluster"		# 这个名字要和服务器端定义的data_source后面的名字一样
  .......
}
udp_send_channel {
  # 注释多播模式
  # mcast_join = 239.2.11.71
  # port = 8649
  # ttl = 1
  # 添加单播模式
  host = 192.168.120.61
  port = 8649
}
udp_recv_channel {			# 仅保留port,其余注释
  port = 8649
}
tcp_accept_channel {		# 仅保留port,其余注释
  port = 8649
}

# Hadoop cluster被监测节点的配置
# 配置/etc/ganglia/gmond.conf
cluster {
  name = "hadoop cluster"  # 这个名字要和服务器端定义的data_source后面的名字一样
  ...
}
udp_send_channel {
 # 单播模式
 host = 192.168.120.61
 port = 8649
}
udp_recv_channel {
  port = 8649
}
tcp_accept_channel {
  port = 8649
}

# Ganglia启动
# 中心节点的启动,start httpd, gmetad, gmond

systemctl start httpd
systemctl start gmetad
systemctl start gmond

systemctl enable httpd
systemctl enable gmetad
systemctl enable gmond

# 被监测节点的启动,支持动态添加被监控节点
# start gmond
systemctl start gmond
systemctl enable gmond

离线安装TDengine监控 设备离线监控_ganglia

4. 报错信息解决

4.1 /usr/sbin/gmond: error while loading shared libraries: libapr-1.so.0: cannot open shared object file:…directory

离线安装TDengine监控 设备离线监控_离线安装TDengine监控_02

  • 解决办法:yum install apr -y
  • 错误参考:error while loading shared libraries: libpangocairo-1.0.so.0: cannot open shared