最近是被这个snmp的trap给坑了,其实回想起来主要是对这个不了解。特别是对snmp协议研究不够深入,

真的不想看这些协议东西,只想大概知道。结果在开发snmp trap时候被坑了,下面列下自己踩到的坑:

1、snmp的trap的中文问题

本来在自己的机器上运行挺好,但是测试说发现乱码,内心直呼不可能吧,结果还真是,原来的代码如下:



if (val_type.equals("OCTET STRING")){
    //字符串类型转码,防止里面有中文内容
   strValue = new String(((OctetString)recVB.getVariable()).getValue(), charsetCode);
} else {
    strValue = new String (recVB.getVariable().toString());
}



 charsetCode 为配置的消息编码类型, 这里说明下java的String都是Unicode编码的,

说明下:

如果想获得这个字符串的byte[] 可以通过类似:String.getBytes("UTF-8")来获得。

如果这样String.getBytes(); 就会依赖于JVM的字符集编码,WINDOWS下一般为GBK。

(要想改变JVM缺省字符集编码, 启动JVM时用选项-Dfile.encodeing=UTF-8)

 

注意千万不要在程序里面设置没有用的如下设置:

System.getProperties().setProperty("file.encoding", "GBK");

这样来解决默认编码的问题是不可行的!!!不可行的!!!不可行的!!!

  

getBytes() ---->StringCoding.encode()-->  String csn = Charset.defaultCharset().name();



/**
     * Returns the default charset of this Java virtual machine.
     *
     * <p> The default charset is determined during virtual-machine startup and
     * typically depends upon the locale and charset of the underlying
     * operating system.
     *
     * @return  A charset object for the default charset
     *
     * @since 1.5
     */
    public static Charset defaultCharset() {
        if (defaultCharset == null) {
            synchronized (Charset.class) {
                String csn = AccessController.doPrivileged(
                    new GetPropertyAction("file.encoding"));
                Charset cs = lookup(csn);
                if (cs != null)
                    defaultCharset = cs;
                else
                    defaultCharset = forName("UTF-8");
            }
        }
        return defaultCharset;
    }



看到了吧,这个是个静态的方法,只要第一次运行defaultCharset 这个不为空了之后,后面就和file.encoding无关了,所以你基本上你无法保证

你在第一次调用之前设置,比如java其他类库会不会已经调用了getBytes(),只要一旦调用编码就固定了。

这个问题导致我在客户端测试的时候,配置的编码和实际发送的编码不一致,后来自己知道可以通过-Dfile.encodeing=UTF-8选项运行了。

有个简单的办法,可以把getBytes的内容打印出来就可以大概知道汉字是什么编码的:

 System.out.println("bytes:"+Arrays.toString(strTmp.getBytes()));

GBK都是2个字节的,而UTF-8一般是2个或三个字节表示一个汉字。

 

2、配置文件里面项目大小写

     flume的配置文件,在读取的时候是区分大小写的,所以这个不要写错了,或者在程序中忽视,自己竟然被坑到了,下次对配置还是忽略大小写的好。

3、Trap 的V3 版本会丢弃包问题

   开发同事在测试中,说V3的Trap消息运行一会会丢包,严格来说不是丢包,是说运行一段时间后,V1、V2版本的消息正常接收,SNMP Trap的V3

版本的消息无法接收到,真坑,看了下Snmp4J,找不到在哪里把日志启动起来,╮(╯▽╰)╭,在初始化的地方用:

org.snmp4j.log.LogFactory.setLogFactory(new ConsoleLogFactory()); 来进行初始化下,结果在不接受V3的Trap包的时候,会打印出来:

 1.3.6.1.6.3.15.1.1.2.0=0这条莫名其妙的记录,有记录就好,然后我顺着这条线索查下去,了解的SNMP的时间窗口,这个对应的含义是:

IdNotInTimeWindow 后来继续查SNMP4J的源码,发现在USM中有这样一段相关代码:



if (securityLevel >= 2) {
                if (statusInfo != null) {
                    int authParamsPos = usmSecurityParameters.getAuthParametersPosition()
                            + usmSecurityParameters.getSecurityParametersPosition();

                    boolean authentic = auth.isAuthentic(user.getAuthenticationKey(), message, 0, message.length,
                            new ByteArrayWindow(message, authParamsPos, 12));

                    if (!(authentic)) {
                        if (logger.isDebugEnabled()) {
                            logger.debug("RFC3414 §3.2.6 Wrong digest -> authentication failure: "
                                    + usmSecurityParameters.getAuthenticationParameters().toHexString());
                        }

                        CounterEvent event = new CounterEvent(this, SnmpConstants.usmStatsWrongDigests);

                        fireIncrementCounter(event);
                        statusInfo.setSecurityLevel(new Integer32(1));
                        statusInfo.setErrorIndication(new VariableBinding(event.getOid(), event.getCurrentValue()));

                        return 1408;
                    }
                    usmSecurityStateReference.setAuthenticationKey(user.getAuthenticationKey());
                    usmSecurityStateReference.setPrivacyKey(user.getPrivacyKey());
                    usmSecurityStateReference.setAuthenticationProtocol(auth);
                    usmSecurityStateReference.setPrivacyProtocol(priv);

                    int status = this.timeTable.checkTime(
                            new UsmTimeEntry(securityEngineID, usmSecurityParameters.getAuthoritativeEngineBoots(),
                                    usmSecurityParameters.getAuthoritativeEngineTime()));

                    switch (status) {
                    case 1411:
                        logger.debug("RFC3414 §3.2.7.a Not in time window; engineID='" + securityEngineID
                                + "', engineBoots=" + usmSecurityParameters.getAuthoritativeEngineBoots()
                                + ", engineTime=" + usmSecurityParameters.getAuthoritativeEngineTime());

                        CounterEvent event = new CounterEvent(this, SnmpConstants.usmStatsNotInTimeWindows);

                        fireIncrementCounter(event);
                        statusInfo.setSecurityLevel(new Integer32(2));
                        statusInfo.setErrorIndication(new VariableBinding(event.getOid(), event.getCurrentValue()));

                        return status;
                    case 1410:
                        if (logger.isDebugEnabled()) {
                            logger.debug("RFC3414 §3.2.7.b - Unkown engine ID: " + securityEngineID);
                        }

                        CounterEvent event = new CounterEvent(this, SnmpConstants.usmStatsNotInTimeWindows);

                        fireIncrementCounter(event);
                        statusInfo.setSecurityLevel(new Integer32(2));
                        statusInfo.setErrorIndication(new VariableBinding(event.getOid(), event.getCurrentValue()));

                        return status;
                    }

                }



 

重点在于:  int status = this.timeTable.checkTime(                         

  new UsmTimeEntry(securityEngineID, usmSecurityParameters.getAuthoritativeEngineBoots(),  usmSecurityParameters.getAuthoritativeEngineTime())); 

通过这句话检查是否在时间窗口内,如果不在时间窗口内直接就抛出去。

这句话又调用了其他的方法,来让我们看下:在UsmTimeTable.java里面



public synchronized int checkTime(UsmTimeEntry entry) {
        int now = (int) (System.currentTimeMillis() / 1000L);
        if (this.localTime.getEngineID().equals(entry.getEngineID())) {
            if ((this.localTime.getEngineBoots() == 2147483647)
                    || (this.localTime.getEngineBoots() != entry.getEngineBoots())
                    || (Math.abs(now + this.localTime.getTimeDiff() - entry.getLatestReceivedTime()) > 150)) {
                if (logger.isDebugEnabled()) {
                    logger.debug(
                            "CheckTime: received message outside time window (authorative):"
                                    + ((this.localTime.getEngineBoots() != entry.getEngineBoots())
                                            ? "engineBoots differ"
                                            : new StringBuffer().append("")
                                                    .append(Math.abs(now + this.localTime.getTimeDiff()
                                                            - entry.getLatestReceivedTime()))
                                                    .append(" > 150").toString()));
                }

                return 1411;
            }

            if (logger.isDebugEnabled()) {
                logger.debug("CheckTime: time ok (authorative)");
            }
            return 0;
        }



这个函数就是检查时间窗函数,注意了,getEngineBoots获取的是引擎运行次数,在第一次收到消息后,每秒增加一次,getEngineID标示引擎ID,好像一个用户一个引擎。

然后判断下这个时间:getLastestReceivedTime()注意这个时间是Snmp的Report消息的时候汇报时间,如果从开始收到第一条消息到150s内还没有汇报,则认为是不在时间窗口的丢弃掉。

尝试通过:  snmpListener.getUSM().getTimeTable().getEntry(new OctetString(securityName)).setLatestReceivedTime(((int) (System.currentTimeMillis() / 1000L))); 这个方法来设置下,结果还一样,可能还有更好办法。

 

不过既然是协议的要求,这种防止攻击的机制,那么就暂时保留吧。