阅文时长 | | 2.83分钟 | 字数统计 | | 1345.2字符 |
『排坑·ASCII码为160的空格(nbsp)』 | |||
编写人 | | SCscHero | 编写时间 | | Wednesday, September 9, 2020 |
文章类型 | | 系列 | 完成度 | | 待完善 |
座右铭 | 每一个伟大的事业,都有一个微不足道的开始。Hello World! |
本文目录
- 一、问题切入 完成度:100%
- a) 尝试
- b) 解决
- 二、形同而ASCII不同 完成度:100%
- a) 获取ASCII码
- b) 认识不间断空格
- c) 在不同的设备以及系统上输入nbsp
- 三、总结 完成度:100%
一、问题切入 完成度:100%
a) 尝试
今日在使用JS的split()方法的时候,使用空格作为分隔符,截取一段带有空格的文字,截取失败。调试过程中,没有发现问题,但确实是"失败"了。
后来经过百度,JS的split()截取空格的坑,一无所获(搜到的文章同样的一篇,可气,写一篇文章发那么多地方…)。后来尝试了一些格式化的方法,替换方法还是行不通。最终,打印了一下这个对象,有了眉目。我的这段字符的空格是HTML5代码的" "的这种空格,似乎和其他空格有所不同。
b) 解决
于是将这个空格复制出来,再用split()方法截取,结果截取成功。证明:这两个空格确实是不同的
二、形同而ASCII不同 完成度:100%
a) 获取ASCII码
我们都知道,每个字符都有自己唯一的ASCII码,这两个空格也不例外。下面来看JS的字符与ASCII码互转的方法:
看下两种空格的ASCII码分别是多少。
结论:不间断空格(No-break thin space,nbsp)是160,普通空格是32。
b) 认识不间断空格
无法自动换行
编辑器一般会把自动换行放在空格字符处。但是,有些文本内容在排版时不适合被放在连续的一行行尾与下一行行首。例如:“100 km”,就不应该在其中间的那个空格处换行。所以编辑器应该在"100"与"km"之间放置一个"不换行空格",使得"100 km"是不可断开换行的,如果它不适合在行尾的剩余排版空间,就整体排版到下一行行首。
–选自《维基百科-机翻》
无法合并空白字符
在SGML、HTML、TEX与LATEX,把连续的空白字符(如空格符、换行符、tab符等)视作一个空格字符。这使得作者可以自由排版其源码而不影响其最终产生的效果。相反,不换行空格在上述语言环境下,不与其它相邻的空白字符合并,这使得作者可用不换行空格安排格式化排版文本的额外的视觉空间效果。例如在HTML,我们经常使用 来控制排版,也是利用了它不合并、以及不换行的特点。
c) 在不同的设备以及系统上输入nbsp
三、总结 完成度:100%
另外,在许多语言都有的Trim()方法,即去除首尾空格功能。这个方法某些语言只能去除ASCII码为32的普通空格,需要处理的话,最好将空格统一为一种。博主的思路是使用Replace()方法将ASCII码为160的空格全局替换掉,当然也可以另寻良策。博主测试过JS是可以去除的。回头测试一下C#。
所以说,肉眼看不出差距的空格,实际并不是一种字符。以后再使用空格的使用要小心了。有可能"此空格非彼空格"。