今天做文件下载功能模块,发现几个问题。
1. 如果指定的文件名里包含了空格,FireFox就会截取空格前的部分作为默认文件名,IE就会在空格位置通过+号填补
2. 中文字符乱码,准确的是非 ASCII 字符乱码,当原文件的文件名中含有非 ASCII 字符时,将引发客户端获取到的文件名错乱
3. 一些特殊字符不能被正常输出(当然这里我并不是那些不常见的符号)比如“.”在IE下就会变为“[1].”
对于这三个问题,网上解决方案已经很多了,但没有一个完整的可以解决这些问题
要不就是解决了空格问题,但如果有中文了,就出现了乱码。要不就是解决了中文了,空格就变成“+”了等等………
有人说解决第一个问题解决方法很简单:用双引号把文件名括起来:
Response.AppendHeader("Content-Disposition", "attachment; filename=\"" + fileName + "\"");
Response.ContentType = "application/octet-stream";
这样做还是会有问题的,在IE中,如果文件名包含两个'.'的话,它会在第一个点前自动加个"[1]",于是你原来的文件名" Microsoft.App.zip"就变成了" Microsoft[1].App.zip "
出现这个问题的原因是微软IE中的BUG(微软的说明 )
对于这个BUG,可以通过下面的方法解决
1 if (Request.Browser.Browser.Contains("IE"))
2 {
3 string ext = fileName.Substring(fileName.LastIndexOf('.'));
4 string name = fileName.Remove(fileName.Length - ext.Length);
5 name = name.Replace(".", "%2e");
6 fileName = name + ext;
7 }
8 Response.AppendHeader("Content-Disposition", "attachment; filename=\"" + fileName + "\"");
9 Response.ContentType = "application/octet-stream";
但这样解决的前提是文件名称中不能有中文,还是很有局限性啊。
到这是估计有人想说了,为何不用URL编码文件名称(HttpUtility.UrlEncode(fileName , System.Text.Encoding.UTF8)))。这个我最早的时候就试过了,通过编码后,空格全部成了+号了,当然这样做也就是解决了中文乱码问题,结果显示的还是很不满意
最后通过google,终于找到老外的一编文章:Display a non-US-ASCII filename in File Download dialog box
以下是他的代码
1 string encodefileName=ToHexString(fileName); //使用自定义的 Response.AppendHeader("content-disposition", "attachment;filename=" + encodefileName);
2 /// <summary>
3 /// 为字符串中的非英文字符编码Encodes non-US-ASCII characters in a string.
4 /// </summary>
5 /// <param name="s"></param>
6 /// <returns></returns>
7 public static string ToHexString(string s)
8 {
9 char[] chars = s.ToCharArray();
10 StringBuilder builder = new StringBuilder();
11 for (int index = 0; index < chars.Length; index++)
12 {
13 bool needToEncode = NeedToEncode(chars[index]);
14 if (needToEncode)
15 {
16 string encodedString = ToHexString(chars[index]);
17 builder.Append(encodedString);
18 }
19 else
20 {
21 builder.Append(chars[index]);
22 }
23 }
24 return builder.ToString();
25 }
26 /// <summary>
27 ///指定一个字符是否应该被编码 Determines if the character needs to be encoded.
28 /// </summary>
29 /// <param name="chr"></param>
30 /// <returns></returns>
31 private static bool NeedToEncode(char chr)
32 {
33 string reservedChars = "$-_.+!*'(),@=&";
34 if (chr > 127)
35 return true;
36 if (char.IsLetterOrDigit(chr) || reservedChars.IndexOf(chr) >= 0)
37 return false;
38 return true;
39 }
40 /// <summary>
41 /// 为非英文字符串编码Encodes a non-US-ASCII character.
42 /// </summary>
43 /// <param name="chr"></param>
44 /// <returns></returns>
45 private static string ToHexString(char chr)
46 {
47 UTF8Encoding utf8 = new UTF8Encoding();
48 byte[] encodedBytes = utf8.GetBytes(chr.ToString());
49 StringBuilder builder = new StringBuilder();
50 for (int index = 0; index < encodedBytes.Length; index++)
51 {
52 builder.AppendFormat("%{0}", Convert.ToString(encodedBytes[index], 16));
53 }
54 return builder.ToString();
55 }
通过他这段代码,我们可以解决掉两个问题,一个是中文乱码问题,还有一个是文件名中出现空格的问题,但第三个问题还在困扰着我们,这该怎么办了。难道真的没有完美的解决办法吗?
答案是否定的,我们通过以上代码的总结,会发现,将其稍微结合一下,这三个问题就都迎刃而解了。
以下是我给出的解决方案:
1 string encodefileName=ToHexString(fileName); //使用自定义的
2 if (Request.Browser.Browser.Contains("IE"))
3 {
4 string ext = encodefileName.Substring(encodefileName.LastIndexOf('.'));//得到扩展名
5 string name = encodefileName.Remove(encodefileName.Length - ext.Length);//得到文件名称
6 name = name.Replace(".", "%2e"); //关键代码
7 fileName = name + ext;
8 }
9 else
10 {
11 filename = encodefileName;
12 }
13 Response.AppendHeader("content-disposition", "attachment;filename=" + fileName );
通过这样处理以后,不管是什么样的文件名称都可以解决掉乱码问题。该方式以通过测试,类似于“中国.黑客 Doc.v1.0.zip”这类文件名,IE,Chrome测试无压力,其它还未测试。如果有兴趣大家可以在各种浏览器上测试一下。还请大家多提意见!