我们使用 printf 打印时基本都会用到 \n 和 \r 之类控制字符,比如:
printf("hello world!\r\n");
那你知道这些 \n 和 \r 的区别吗?
一、关于 \n 和 \r
在 ASCII 码中,我们会看到有一类不可显示的字符,叫控制字符,其中就包含\r 和 \n 等控制字符。
img
\n : 换行符(newline),另起一行,对应 ASCII 值 10(缩写:LF)。
\r : 回车符(return),回到一行的开头,对应 ASCII 值 13(缩写:CR)。
回车和换行来源:
在计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意儿,每秒钟可以打 10 个字符。但是它有一个问题,就是打完一行换行的时候,要用去 0.2 秒,正好可以打两个字符。要是在这 0.2 秒里面,又有新的字符传过来,那么这个字符将丢失。
于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做"回车",告诉打字机把打印头定位在左边界;另一个叫做"换行",告诉打字机把纸向下移一行。
这就是"换行"和"回车"的来历,从它们的英语名字上也可以看出一二。
二、\n 和 \r 差异
后来,计算机发明了,这两个概念也就被搬到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧。
'\r'是回车,'\n'是换行,前者使光标到行首,后者使光标下移一格。通常用的 Enter 是两个加起来。
有的编辑器只认\r\n,有的编辑器则两个都认。所以要想通用的话,最好用\r\n 换行。
- 在微软的 MS-DOS 和 Windows 中,使用“回车 CR('\r')”和“换行 LF('\n')”两个字符作为换行符;
- Windows 系统里面,每行结尾是 回车+换行(CR+LF),即“\r\n”;
- Unix 系统里,每行结尾只有 换行 CR,即“\n”;
- Mac 系统里,每行结尾是 回车 CR 即'\r';
- 所以我们平时编写文件的回车符应该确切来说叫做回车换行符;
三、影响
一个直接后果是,Unix/Mac 系统下的文件在 Windows 里打开的话,所有文字会变成一行;而 Windows 里的文件在 Unix/Mac 下打开的话,在每行的结尾可能会多出一个^M 符号。
Linux 保存的文件在 windows 上用记事本看的话会出现黑点。这个应该很多人都看到过,比如,Keil 代码中直接显示换行符:
img
互相转换
在 linux 下,命令 unix2dos 是把 linux 文件格式转换成 windows 文件格式,命令 dos2unix 是把 windows 格式转换成 linux 文件格式。
在不同平台间使用 FTP 软件传送文件时, 在 ascii 文本模式传输模式下, 一些 FTP 客户端程序会自动对换行格式进行转换. 经过这种传输的文件字节数可能会发生变化。
如果你不想 ftp 修改原文件, 可以使用 bin 模式(二进制模式)传输文本。一个程序在 windows 上运行就生成 CR/LF 换行格式的文本文件,而在 Linux 上运行就生成 LF 格式换行的文本文件。
-- End --