Problem Description
统计给定文本文件中汉字的个数。
Input
输入文件首先包含一个整数n,表示测试实例的个数,然后是n段文本。
Output
对于每一段文本,输出其中的汉字的个数,每个测试实例的输出占一行。
[Hint:]从汉字机内码的特点考虑~
Sample Input
2 WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa! 马上就要期末考试了Are you ready?
Sample Output
14 9
Author
lcy
代码:
思路:
汉字内码(机内码)
(1)概念:在计算机内部表示汉字的代码。
(2)特点:汉字内码采用两个字节,一个汉字占两个ASCII字符;汉字内码最高位为1,ASCII码最高位为0
(3)汉字内码与区位码的关系:
汉字内码高位字节=(区号)16+(A0)16
汉字内码低位字节=(位号)16+(A0)16
例3:汉字“啊”的区位码为1601,则其汉字内码为(B0A1)16。
所以,每个汉字都是小于0的。非汉字都是大于0的。而每个汉字占用两个字节,最后cont要除以二。