今天做文件下载功能模块,发现几个问题。
1. 如果指定的文件名里包含了空格,FireFox就会截取空格前的部分作为默认文件名,IE就会在空格位置通过+号填补
2. 中文字符乱码,准确的是非 ASCII 字符乱码,当原文件的文件名中含有非 ASCII 字符时,将引发客户端获取到的文件名错乱
3. 一些特殊字符不能被正常输出(当然这里我并不是那些不常见的符号)比如“.”在IE下就会变为“[1].”
对于这三个问题,网上解决方案已经很多了,但没有一个完整的可以解决这些问题
要不就是解决了空格问题,但如果有中文了,就出现了乱码。要不就是解决了中文了,空格就变成“+”了等等………
有人说解决第一个问题解决方法很简单:用双引号把文件名括起来:
Response.AppendHeader("Content-Disposition", "attachment; filename=\"" + fileName + "\"");
Response.ContentType = "application/octet-stream";
这样做还是会有问题的,在IE中,如果文件名包含两个'.'的话,它会在第一个点前自动加个"[1]",于是你原来的文件名" Microsoft.App.zip"就变成了" Microsoft[1].App.zip "
出现这个问题的原因是微软IE中的BUG(微软的说明 )
对于这个BUG,可以通过下面的方法解决
1 if (Request.Browser.Browser.Contains("IE"))
2 {
3 string ext = fileName.Substring(fileName.LastIndexOf('.'));
4 string name = fileName.Remove(fileName.Length - ext.Length);
5 name = name.Replace(".", "%2e");
6 fileName = name + ext;
7 }
8 Response.AppendHeader("Content-Disposition", "attachment; filename=\"" + fileName + "\"");
9 Response.ContentType = "application/octet-stream";
但这样解决的前提是文件名称中不能有中文,还是很有局限性啊。
到这是估计有人想说了,为何不用URL编码文件名称(HttpUtility.UrlEncode(fileName , System.Text.Encoding.UTF8)))。这个我最早的时候就试过了,通过编码后,空格全部成了+号了,当然这样做也就是解决了中文乱码问题,结果显示的还是很不满意
最后通过google,终于找到老外的一编文章:Display a non-US-ASCII filename in File Download dialog box
以下是他的代码
按 Ctrl+C 复制代码
string encodefileName=ToHexString(fileName); //使用自定义的 Response.AppendHeader("content-disposition", "attachment;filename=" + encodefileName);
/// <summary>
/// 为字符串中的非英文字符编码Encodes non-US-ASCII characters in a string.
/// </summary>
/// <param name="s"></param>
/// <returns></returns>
public static string ToHexString(string s)
{
char[] chars = s.ToCharArray();
StringBuilder builder = new StringBuilder();
for (int index = 0; index < chars.Length; index++)
{
bool needToEncode = NeedToEncode(chars[index]);
if (needToEncode)
{
string encodedString = ToHexString(chars[index]);
builder.Append(encodedString);
}
else
{
builder.Append(chars[index]);
}
}
return builder.ToString();
}
/// <summary>
///指定一个字符是否应该被编码 Determines if the character needs to be encoded.
/// </summary>
/// <param name="chr"></param>
/// <returns></returns>
private static bool NeedToEncode(char chr)
{
string reservedChars = "$-_.+!*'(),@=&";
if (chr > 127)
return true;
if (char.IsLetterOrDigit(chr) || reservedChars.IndexOf(chr) >= 0)
return false;
return true;
}
/// <summary>
/// 为非英文字符串编码Encodes a non-US-ASCII character.
/// </summary>
/// <param name="chr"></param>
/// <returns></returns>
private static string ToHexString(char chr)
{
UTF8Encoding utf8 = new UTF8Encoding();
byte[] encodedBytes = utf8.GetBytes(chr.ToString());
StringBuilder builder = new StringBuilder();
for (int index = 0; index < encodedBytes.Length; index++)
{
builder.AppendFormat("%{0}", Convert.ToString(encodedBytes[index], 16));
}
return builder.ToString();
}
按 Ctrl+C 复制代码
通过他这段代码,我们可以解决掉两个问题,一个是中文乱码问题,还有一个是文件名中出现空格的问题,但第三个问题还在困扰着我们,这该怎么办了。难道真的没有完美的解决办法吗?
答案是否定的,我们通过以上代码的总结,会发现,将其稍微结合一下,这三个问题就都迎刃而解了。
以下是我给出的解决方案:
1 string encodefileName=ToHexString(fileName); //使用自定义的
2 if (Request.Browser.Browser.Contains("IE"))
3 {
4 string ext = encodefileName.Substring(encodefileName.LastIndexOf('.'));//得到扩展名
5 string name = encodefileName.Remove(encodefileName.Length - ext.Length);//得到文件名称
6 name = name.Replace(".", "%2e"); //关键代码
7 fileName = name + ext;
8 }
9 else
10 {
11 filename = encodefileName;
12 }
13 Response.AppendHeader("content-disposition", "attachment;filename=" + fileName );
通过这样处理以后,不管是什么样的文件名称都可以解决掉乱码问题。该方式以通过测试,类似于“中国.黑客 Doc.v1.0.zip”这类文件名,IE,Chrome测试无压力,其它还未测试。如果有兴趣大家可以在各种浏览器上测试一下。还请大家多提意见