背景

最近新增了需求,就是对比本地下载的apk文件的md5值跟服务器上文件的md5值是否一致,不一致的话上报统计,统计这种情况的发生情况。

代码中以前的同事已经写过获取本地文件md5值的方法了,也一直在用,我也没多想,就直接拿来用了,没想到却是出了问题,囧。

错误描述

有问题的方法在算大部分的文件的md5值都是没有问题的,只有当文件的md5值是0开头的时候会出问题,之前的方法会把开头的0去掉,就导致本来没有问题的文件,我这边比较的md5值也不一致。

有问题的代码

我先贴上有问题的代码给大家看下:

public static String getFileMD5(File file) {
    if (!file.isFile()) {
        return null;
    }
    MessageDigest digest = null;
    FileInputStream in = null;
    byte buffer[] = new byte[1024];
    int len;
    try {
        digest = MessageDigest.getInstance("MD5");
        in = new FileInputStream(file);
        while ((len = in.read(buffer, 0, 1024)) != -1) {
            digest.update(buffer, 0, len);
        }
        in.close();
    } catch (Exception e) {
        e.printStackTrace();
        return null;
    }
    BigInteger bigInt = new BigInteger(1, digest.digest());
    return bigInt.toString(16);
}

代码很简单,try中的部分生成文件的md5摘要的方法没有问题,问题就出在最后两行上,将生成的md5摘要转换成16进制字符串。

在stackoverflow上搜了下,貌似是因为在toString的时候,如果这个数字是0开头的,会自动去掉这些0,因此就造成了这个问题。

改进的代码

知道了问题所在,改起来就方便多了,既然前面生成文件的md5摘要没有问题,那就只用改后面生成16进制字符串的代码就可以了。

贴上修改之后的代码:

public static String getFileMD5(File file) {
    if (!file.isFile()) {
        return null;
    }
    MessageDigest digest = null;
    FileInputStream in = null;
    byte buffer[] = new byte[1024];
    int len;
    try {
        digest = MessageDigest.getInstance("MD5");
        in = new FileInputStream(file);
        while ((len = in.read(buffer, 0, 1024)) != -1) {
            digest.update(buffer, 0, len);
        }
        in.close();
    } catch (Exception e) {
        e.printStackTrace();
        return null;
    }
    return bytesToHexString(digest.digest());
}

public static String bytesToHexString(byte[] src) {
    StringBuilder stringBuilder = new StringBuilder("");
    if (src == null || src.length <= 0) {
        return null;
    }
    for (int i = 0; i < src.length; i++) {
        int v = src[i] & 0xFF;
        String hv = Integer.toHexString(v);
        if (hv.length() < 2) {
            stringBuilder.append(0);
        }
        stringBuilder.append(hv);
    }
    return stringBuilder.toString();
}

这里引用网上其他人的说法简单解释下:

Java中byte用二进制表示占用8位,而我们知道16进制的每个字符需要用4位二进制位来表示(2^3 + 2^2 + 2^1 + 2^0 = 15),所以我们就可以把每个byte转换成两个相应的16进制字符,即把byte的高4位和低4位分别转换成相应的16进制字符H和L,并组合起来得到byte转换到16进制字符串的结果new String(H) + new String(L)。

这样改了之后就完美解决了。

备注: 关于代码中第29行 int v = src[i] & 0xFF; 如有疑问,可以查看:java中byte转换int时为何与0xff进行与运算