《Openstack ceilometer监控项扩展》( http://eccp.csdb.cn/blog/?p=352 )主要介绍了对虚拟机监控项扩展, 比较简单。如何在ceilometer框架基础上,增加对宿主机、服务等的监控?本文以宿主机监控为例,详细介绍扩展方法。

首先,总体介绍Ceilometer采集监控数据到持久化存储的流程,在compute节点上通过pollster的轮询机制获取宿主机的各监控数据,通过publisher调用rpc将监控数据发送到消息队列,collector端根据约定的topic接收相应管道发送的数据,并调用storage接口 进行持久化存储,具体流程如下图所示。

其次,在该框架下如何扩展新的监控模块,顺其自然的想法即依次修改以上模块,其重点是配置文件的设置,需要定义发送端和接收端的topic、secrete和method才能将数据顺利发送到collector端进行存储。以下详细介绍各模块的修改方法。

一、compute数据采集pollster模块

该模块主要负责数据的采集,采集宿主机CPU、内存、网络等信息,封装成自定义数据格式后通过publisher发送到消息队列,该部分与ceilometer监控项扩展相似。
1、在ceilometer/ceilometer/compute/plugin.py中定义宿主机获取数据的基类。

class ServerPollster(plugin.PollsterBase):
    @abc.abstractmethod
    def get_samples(self, manager, cache, instances):

2、在ceilometer/ceilometer/compute下新建server_pollsters包,在该包下新建server_cpu.py、server_mem.py等。继承ServerPollster类实现get_samples方法,将获取的数据封装成定义的数据格式返回即可,可参考虚拟机采集数据架构。
3、同监控项的扩展,在ceilometer/setup.cfg中增加监控项pollster的配置,最后所有修改完成后,重新安装ceilometer。

二、发送数据publisher模块

1、修改ceilometer/pipeline.yaml配置文件,配置发送和接收数据的方式。

-
  name: server_pipeline
  interval: 60
  counters:
    - "server.cpu"
    - "server.mem"
  transformers:
  publishers:
    - rpc://?target=record_server_data&meter_type=server

其中,name为pipeline的名字;interval为轮询的时间间隔;counters为该pipeline的pollster名字;transformers若发送的数据在进行publisher之前需要进一步处理,可设置transformers进行转换;publishers指定发送数据到collector的方式,target指定collector端的接收方,根据meter_type获取rpc的topic、secret和method。
同时,需要设置ceilometer/ceilometer.conf文件,设置server的topic、secret、method信息,具体配置如下:

[publisher_rpc]
server_topic=server
server_secret=True
server_method=record_server_data

2、由于增加了新的topic发送通道,所以需要对ceilometer/ceilometer/publisher/rpc.py做相应的修改。首先,需要修改初始化函数,读取pipeline和ceilometer配置文件信息。其次,修改publish_counters函数,由于pipeline文件会对所有的counters每隔10分钟轮询一次,ceilometer默认采用topic为metering,其数据封装格式相同。但由于新增不同监控模块的数据封装格式不同,所以需要分开处理,10分钟轮询时只对counter类型为sample的数据进行publish。具体如下:

if self.meter_type == 'metering':
  meters = [
      meter_message_from_counter_beta(
        counter,
        self.topic_secret[self.meter_type],
        source)
        for counter in counters if type(counter) == sample.Sample
      ]
else:
  meters = [
      meter_message_from_counter_beta(
        counter,
        self.topic_secret[self.meter_type],
        source)
        for counter in counters
      ]
topic = self.meter_type

三、接收数据collector模块

1、ceilometer/ceilometer/collector/service.py文件initialize_service_hook中定义worker用于接收rpc发送过来的数据,具体配置如下:

for k, v in cfg.CONF.publisher_rpc.iteritems():
  if k.endswith('topic'):
    self.conn.create_worker(
      v,
      rpc_dispatcher.RpcDispatcher([self]),
      'ceilometer.collector.' + v,
    )

2、定义相应的target用于接收采集的数据,如下所示:

def record_server_data(self, context, data):
    for dispatcher in self.dispatchers:
        dispatcher.record_data(context, data, 'server')

其中,最后一个参数指定本次发送过来的topic类型,在调用dispatch.record_data方法时,用于调用相应的存储数据的方法,进而使得数据持久化到不同的数据库表中。
3、dispatch也是在原基础上做了相应的调整,该调整根据当前数据接收的topic,调用不同的方法,进行数据库的存储,具体如下:

def record_data(self, context, data, meter_type):
  if not isinstance(data, list):
    data = [data]
  for meter in data:
    if self.secret_method[meter_type] and
      publisher_rpc.verify_signature(meter,
        self.secret_method[meter_type][0]):
      try:
        if meter.get('timestamp'):
          meter['timestamp'] =
            self.time_to_date(meter['timestamp'])
          method = getattr(self.storage_conn.__class__,
            self.secret_method[meter_type][1])
          method(self.storage_conn, meter)
      except Exception as err:
        LOG.error('Failed to record metering data: %s', err)
        LOG.exception(err)
      else:
        LOG.warning(
          'message signature invalid, discarding message: %r',
          meter)

四、持久化存储模块

1、由于新增宿主机数据模块的监测,需增一张数据库表,所以storage模块也需做相应的修改。首先,需要修改ceilometer/ceilometer/storage/base.py文件,增加接口:

@abc.abstractmethod
    def record_server_data(self, data):

2、在ceilometer/ceilometer/storage/impl_mongodb.py的Connection类中实现在接口。
3、设计对应的数据库表结构,在ceilometer/ceilometer/storage/sqlalchemy/models.py中设置model对应的Server类。
4、在ceilometer/ceilometer/storage/sqlalchemy/migrate_repo/versions/001_add_meter_table.py中定义对应的表。

以上配置完成后,source隔离环境重新安装ceilometer,重启服务,即可在mongodb数据库中查看到新增server表,表中存储对应counter的数据。