filebeat 多行匹配 java日志 filebeat 多个日志

转载

mob64ca1414c613 2024-03-04 15:34:00

文章标签 java 数据库 golang 时间戳 Bootstrap 文章分类 Java 后端开发

多行配置示例

本节中的示例包括以下内容：

将Java堆栈跟踪日志组合成一个事件
将C风格的日志组合成一个事件
结合时间戳处理多行事件

Java堆栈跟踪

Java示例一：

Java堆栈跟踪由多行组成，每一行在初始行之后以空格开头，如本例中所述:

Exception in thread "main" java.lang.NullPointerException
        at com.example.myproject.Book.getTitle(Book.java:16)
        at com.example.myproject.Author.getBookTitles(Author.java:25)
        at com.example.myproject.Bootstrap.main(Bootstrap.java:14)

要将这些行整合到Filebeat中的单个事件中，请使用以下多行配置：

multiline.pattern: '^[[:space:]]'
multiline.negate: false
multiline.match: after

此配置将以空格开头的所有行合并到上一行。

Java示例二：

下面是一个Java堆栈跟踪日志，稍微复杂的例子：

Exception in thread "main" java.lang.IllegalStateException: A book has a null property
       at com.example.myproject.Author.getBookIds(Author.java:38)
       at com.example.myproject.Bootstrap.main(Bootstrap.java:14)
Caused by: java.lang.NullPointerException
       at com.example.myproject.Book.getId(Book.java:22)
       at com.example.myproject.Author.getBookIds(Author.java:35)
       ... 1 more

要将这些行整合到Filebeat中的单个事件中，请使用以下多行配置：

multiline.pattern: '^[[:space:]]+(at|\.{3})\b|^Caused by:'
multiline.negate: false
multiline.match: after

此配置解释如下：

将以空格开头的所有行合并到上一行
并把以Caused by开头的也追加到上一行

C风格的日志

一些编程语言在一行末尾使用反斜杠(\)字符，表示该行仍在继续，如本例中所示:

printf ("%10.10ld  \t %10.10ld \t %s\
  %f", w, x, y, z );

要将这些行整合到Filebeat中的单个事件中，请使用以下多行配置：

multiline.pattern: '\\$'
multiline.negate: false
multiline.match: before

此配置将以\字符结尾的任何行与后面的行合并。

时间戳
来自Elasticsearch等服务的活动日志通常以时间戳开始，然后是关于特定活动的信息，如下例所示：

[2015-08-24 11:49:14,389][INFO ][env                      ] [Letha] using [1] data paths, mounts [[/
(/dev/disk1)]], net usable_space [34.5gb], net total_space [118.9gb], types [hfs]

要将这些行整合到Filebeat中的单个事件中，请使用以下多行配置：

multiline.pattern: '^\[[0-9]{4}-[0-9]{2}-[0-9]{2}'
multiline.negate: true
multiline.match: after

此配置使用negate: true和match: after设置来指定任何不符合指定模式的行都属于上一行。

应用程序事件

有时您的应用程序日志包含以自定义标记开始和结束的事件，如以下示例：

[2015-08-24 11:49:14,389] Start new event
[2015-08-24 11:49:14,395] Content of processing something
[2015-08-24 11:49:14,399] End event

要在Filebeat中将其整合为单个事件，请使用以下多行配置：

multiline.pattern: 'Start new event'
multiline.negate: true
multiline.match: after
multiline.flush_pattern: 'End event'

此配置把指定字符串开头，指定字符串结尾的多行合并为一个事件。

日志如下，预计可得5条数据

test-a.log 开始测试，这也是个事件
Exception in thread "main" java.lang.NullPointerException 空指针test1start
        at com.example.myproject.Book.getTitle(Book.java:16)
        at com.example.myproject.Author.getBookTitles(Author.java:25)
        at com.example.myproject.Bootstrap.main(Bootstrap.java:14)
		空指针test1end
Exception in thread "main" java.lang.NullPointerException 空指针test2start
        at com.example.myproject.Book.getTitle(Book.java:16)
        at com.example.myproject.Author.getBookTitles(Author.java:25)
        at com.example.myproject.Bootstrap.main(Bootstrap.java:14)
		空指针test2end
Exception in thread "main" java.lang.NullPointerException 空指针test3start
        at com.example.myproject.Book.getTitle(Book.java:16)
        at com.example.myproject.Author.getBookTitles(Author.java:25)
        at com.example.myproject.Bootstrap.main(Bootstrap.java:14)
		空指针test3end
test-a.log 结束测试，这也是个事件

Kibana查看结果

filebeat 多行匹配 java日志 filebeat 多个日志_数据库

filebeat 多行匹配 java日志 filebeat 多个日志_时间戳_02

获取了5条数据，空格的追加到上一个事件，实践成功。

实践Java示例二：这个有点坎坷，合并的一塌糊涂，大家做测试的时候最好用真实日志做正则验证，此处不赘述了。

实践时间戳：

日志如下，预计可得3条数据

时间戳开始，这个不会被抓取
[2015-08-24 11:49:14,389][INFO ][env                      ] [Letha] using [1] data paths, mounts [[/ 时间戳A-1
(/dev/disk1)]], net usable_space [34.5gb], net total_space [118.9gb], types [hfs] 时间戳A-2
[2016-08-24 11:49:14,389][INFO ][env                      ] [Letha] using [1] data paths, mounts [[/ 时间戳B-1
(/dev/disk1)]], net usable_space [34.5gb], net total_space [118.9gb], types [hfs] 时间戳B-2
[2017-08-24 11:49:14,389][INFO ][env                      ] [Letha] using [1] data paths, mounts [[/ 时间戳C-1
(/dev/disk1)]], net usable_space [34.5gb], net total_space [118.9gb], types [hfs] 时间戳C-2
时间戳结束，这个不会被抓取

Kibana查看结果

filebeat 多行匹配 java日志 filebeat 多个日志_golang_03

filebeat 多行匹配 java日志 filebeat 多个日志_数据库_04

虽然也得到了3条数据，但合并的有些尴尬，看来需要抽空在补一篇正则规则了。

综上，合并没什么问题，重点在正则，做合并的时候先做做测试，看是否符合自己的预期。

真实数据测试时可以先做下数据筛选

#exclude_lines: ['^DBG']
#include_lines: ['^ERR', '^WARN']

拓展知识

filebeat和logstash的合并方式几乎无区别

input {
    file {
        path => "/var/*.log"
        codec => multiline {
            pattern => "^\[\d{2}-"
            negate => true
            what => "previous"
        }
    }
}
what确定合并属于上一个事件还是下一个事件，可以为next和previous
而filebeat对应的是multiline.match: after和before

这是一个传承的关系：

因为logstash是jvm跑的，资源消耗比较大，所以后来作者又用golang写了一个功能较少但是资源消耗也小的轻量级的logstash-forwarder。不过作者只是一个人，加入elastic以后，因为elastic本身还收购了另一个开源项目packetbeat，而这个项目专门就是用golang的，有整个团队，所以elastic干脆把logstash-forwarder的开发工作也合并到同一个golang团队来搞，于是新的项目就叫filebeat了。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。