文本的排版依据语言的不同会有一些格式上的要求,比如简体中文中类似逗号、分号等标点符号不会出现在一行的开头,对于英文来讲就是一个完整单词不会 在两行显示,浏览器会依据类似这样的原则来显示文本。但是由于网页有宽度限制的,连续的超长的字母、数字或标点符号超出其所在区域宽度的限制而导致影响页 面视觉,如例1所示。这个问题在显示用户输入信息时尤为突出,这里就是要说如何解决这个问题。

CSS3草案中,对文本的处理新增了两个新属性word-wrapword-break来解决这个问题:

  1. {word-wrap:break-word;} :依照亚洲语言和非亚洲语言的文本规则,允许在字内换行,且允许非亚洲语言文本行的任意字内断开
  2. {word-break:break-all;} : 内容将在边界内换行,如需要则词内换行(word-break)也行发生


下面是常见浏览器的支持情况:

IE6/7[1]

Firefox2/3[2]

Opera3+

Safari9.5+/Chrome

{word-wrap:break-word;}

td元素需设置其宽度

例4例5

不支持

不支持

不支持td元素

例4例5

{word-break:break-all;}

不支持连续的符号

例3

不支持

不支持

支持

  • [1] 在MSDN的CSS Compatibility and Internet Explorer中可以看出,IE8会像IE6和IE7一样支持word-wrap和word-break这两个属性,但我在IE8beta2上测试来看却不支持这两项,由于IE8还处于beta阶段,且我相信IE8最终会支持的,所以在页头声明<meta content="IE=7" http-equiv="X-UA-Compatible" />使IE8按照IE7来解释页面是一个不错的办法。
  • [2] Firefox3.1将会支持word-wrap属性

由于{word-break:break-all;}导致英文和数字可读性严重下降且无法使连续符号换行,所以{word-wrap:break-word;}是一个相对较好的选择。

但面对浏览器的如此糟糕支持,所以不能不借助JavaScript来解决这个问题,即当浏览器不支持CSS解决方案时,在连续字符串的适当位置插入&#8203;字符(当然还可以用<wbr />和&shy;,这三个字符在浏览器中的支持情况请看ppk的《The wbr tag》),这些字符写在浏览器中不会显示,却使长字符串换行。具体实现代码如下:

function fnBreakWordAll(o){
var o = o || {},
  iWord = o.word || 13,
  iRe = o.re || '[a-zA-Z0-9]',
  bAll = o.all || false,
  sClassName = o.className || 'word-break-all',
  aEls = o.els || (function(){
    var aEls = [],
      aAllEls = document.getElementsByTagName('*'),
      re = new RegExp('(?:^|\\s+)' + sClassName + '(?:\\s+|$)');
    for(var i =0,iLen = aAllEls.length; i < iLen ; ++i){
      if(re.test(aAllEls[i].className)){
        aEls[aEls.length] = aAllEls[i];
      }
    }
    return aEls;
  })() || [],
  fnBreakWord = function(oEl){
// 基于http://www.hedgerwow.com/360/dhtml/css-word-break.html修改
    if(!oEl || oEl.nodeType !== 1){
      return false;
    }else if(oEl.currentStyle && typeof oEl.currentStyle.wordWrap==='string'){
      breakWord = function(oEl){
        oEl.runtimeStyle.wordWrap = 'break-word';
        return true;
      }
      return breakWord(oEl);
    }else if(document.createTreeWalker){
      var trim = function  (str) {
        str = str.replace(/^\s\s*/, '');
        var ws = /\s/,
        i = str.length;
        while (ws.test(str.charAt(--i)));
        return str.slice(0, i + 1);
      }
      breakWord = function(oEl){
        var dWalker=document.createTreeWalker(oEl,NodeFilter.SHOW_TEXT,null,false);
        var node,s,c = String.fromCharCode('8203'),
//re = /([a-zA-Z0-9]{0,13})/;
          re = new RegExp('('+ iRe +'{0,' + iWord + '})');
        while (dWalker.nextNode()){
          node = dWalker.currentNode;
          s = trim(node.nodeValue).split(re).join(c);
          node.nodeValue = s;
        }
        return true;
      }
      return breakWord(oEl);
    }
  };
for(var i=0,n=aEls.length; i<n; ++i){
  var sUa = navigator.userAgent,
    sTn = aEls[i].tagName.toLowerCase() ;
  if((/Opera/).test(sUa) || (/Firefox/).test(sUa) || ((/KHTML/).test(sUa) &&
  (sTn === 'td' || sTn === 'th')) || bAll){
    fnBreakWord(aEls[i]);
  }
}
}

具体应用请看演示实例

fnWordBreakAll函数提供一些定制参数,使用方法和参数含义如下:

fnWordBreakAll({word:15,re:'[\\w]',all:true});

参数


说明

word

正整数,默认是13

在这个字数内的单词不会被插入\u8203,印象中超过13个字母的单词不多,这可以保证绝大部分单词不会被打碎

re

正则表达式,默认[a-zA-Z0-9]

单词的正则表达式,用以确定一个单词是哪些字符组成,注意\的转义

all

布尔值,默认false

确定是否在所有的浏览器中执行,默认在Opera和Firefox,以及当class应用在th或td的Safari上执行,这个主要用在.word-break-all没有定义时,会对IE加上样式

className

合法class名,默认word-break-all

执行函数的元素对应属性名

这个函数的核心部分修改自Hedger Wang 整理了一个JavaScript解决方案《Cross Browser Word Breaker》,其利用document.createTreeWalker和 split方法给非IE浏览器的每个字符间加入了&#8203;,它用在纯中文文本基本上没有什么问题,但是如果你仔细观察他给出的例子就会发现 文本中有英文或数字时,虽然解决了换行问题,但是使文本难以阅读,且增大了字符间的间距,所以我在此基础上做了上面的改进。