wc:文本数据统计
语法:
wc [OPTION]... [FILE]...
wc [OPTION]... --files0-from=F
说明:
计数单词总数、行总数、字节总数和字符总数
可以对文件或STDIN中的数据运行
选项:
-l: 只计数行数
-w:只计数单词总数
-c: 只计数字节总数
-m:只计数字符总数
示例:
[root@localhost testdir]# wc test
3 3 18 test3
行数 字数 字符数 文件名
[root@localhost testdir]# wc -l test
3 test
[root@localhost testdir]# wc -w test
3 test
[root@localhost testdir]# wc -m test
18 test
[root@localhost testdir]# wc -c test
18 test
sort:文本排序
语法:
sort [OPTION]... [FILE]...
sort [OPTION]... --files0-from=F
说明:
将文件进行排序,并将排序结果标准输出。sort命令既可以从特定的文件,也可以从stdin中获取输入。
选项:
-b:忽略每行前面开始出的空格字符;
-c:检查文件是否已经按照顺序排序;
-d:排序时,处理英文字母、数字及空格字符外,忽略其他的字符;
-f:排序时,将小写字母视为大写字母;
-i:排序时,除了040至176之间的ASCII字符外,忽略其他的字符;
-m:将几个排序号的文件进行合并;
-M:将前面3个字母依照月份的缩写进行排序;
-n:依照数值的大小排序;
-r:以相反的顺序来排序;
-o 输出文件:将排序后的结果存入制定的文件;
-t分隔字符:指定排序时所用的栏位分隔字符;
+<起始栏位>-<结束栏位>:以指定的栏位来排序,范围由起始栏位到结束栏位的前一栏位。
-u 选项(独特, unique)删除输出中的重复行
-k X 选项按照使用c字符分隔的X列来整理能够使用多次
示例:
[root@localhost testdir]# cat test
12345
abcde
abcde
78901
6478
abcde
eftkw
eftkw
[root@localhost testdir]# sort test
12345
6478
78901
abcde
abcde
abcde
eftkw
eftkw
[root@localhost testdir]# sort -r test
eftkw
eftkw
abcde
abcde
abcde
78901
6478
12345
[root@localhost testdir]# sort -u test
12345
6478
78901
abcde
eftkw
[root@localhost testdir]# sort -k2 test
12345
6478
78901
abcde
abcde
abcde
eftkw
eftkw
uniq:统计文件中连续重复的行
语法:
uniq [OPTION]... [INPUT [OUTPUT]]
说明:
uniq命令用于报告或忽略文件中的重复行,一般与sort命令结合使用。
输出文件:指定要去除重复行后的内容要写入的输出文件。如果不指定此选项,则将内容显示到标准输出设备(显示终端)。
选项:
-c: 显示每行重复出现的次数;
-d: 仅显示重复过的行;
-u: 仅显示不曾重复的行;
-f<栏位>或--skip-fields=<栏位>:忽略比较指定的栏位
-s<字符位置>或--skip-chars=<字符位置>:忽略比较指定的字符;
-w<字符位置>或--check-chars=<字符位置>:指定要比较的字符。
示例:
[root@localhost testdir]# cat test
12345
abcde
abcde
78901
6478
abcde
eftkw
eftkw
[root@localhost testdir]# sort test | uniq -c
1 12345
1 6478
1 78901
3 abcde
2 eftkw