图:打开调换字节顺序的word文件的情况
for (int i = 1; i < fileLength; i++)
{
source[i] = (byte)(~source[i]);
}
return source;
我问过不少朋友,有些使用过这种办法,因为一般来说一种文件后缀对应一种编译或者查看的工具,例如.mdb通过Access可以查看和修改,.txt可以通过记事本查看和修改,如果我们把一个txt文件的后缀改成.mdb,那么双击后系统会用Access打开文件,结果自然是乱码,如果我们不理会文件后缀,仍然以记事本打开则仍然可以正常查看和编辑。也就是我们更改文件后缀达到误导系统用错误的方式打开的目的。也有些朋友甚至干脆不用文件后缀,这样就让操作系统无所适从了。这种方法的优点是知道文件的实际格式后可以对文件进行查看和修改,缺点是常用的文件后缀不多,遇上有心人可以尝试通过更改文件后缀的办法来获取文件内容的办法,这种几率还是比较大的。
这种办法是我今天要重点介绍的一种办法。几年前我参与过一个OA系统的开发,里面有一个环节就是如何保证以Word形式保存的合同、审批申请不会被篡改。我当时的做法就是Word文件分段存储,也就是将整个文件头20个byte存放到数据库,剩余字节仍然以Word文档的方式存储到硬盘上,这样别人通过正常办法打开Word文件时看到的乱码,一旦需要调看文件时,再通过程序将头20字节和本地存储的文件的内容合并成一个完整的Word文档。后来我嫌利用数据库存储麻烦,将这种办法改进了一下,将文件的前n个字节与后n个字节位置对换,这样不更改文件后缀,仍然可以实现对文件内容进行查看和修改。这种办法的缺点是对于文本型的文件,如果不进行字节调换,则没有调换的部分依然不是乱码。
程序中关键代码如下:
byte[] total = new byte[fileLength];//存储文件内容的字节数组
stream.Read(total, 0,fileLength);
stream.Close();
byte tempByte;//用于交换文件字节的数据
//下面的循环实现文件的首字节与文件的尾字节对换
//文件的第二字节与文件倒数第二字节对换
//假设文件的字节长度为length,那么对换字节的索引n,m满足:n+m=length-1
//也就是n=length-m-1
for (int i = 0; i < byteLength; i++)
{
tempByte = total[i];
total[i] = total[fileLength - 1 - i];
total[fileLength - 1 - i] = tempByte;
}
return total;//返回调整次序后的文件字节内容