最近对opengl输出文字比较感兴趣,把这几天疑惑的东西写下来,因为自己也是刚接触只是了解了皮毛。所以内容有些局限,不过希望对像我这种初学的人提供点信息。
在windows下wglUseFontBitmaps与wglUseFontOutlines提供opengl输出文字的字符资源,二者均通过构建一系列显示列表,然后用glCallLists执行这些显示列表就可以输出我们想要的字符。wglUseFontBitmaps产生bitmap,wglUseFontOutlines产生字形轮廓的浮点表示,所以可用来显示立体字符,网上有不少例程,我在学习过程中有两点疑惑:1,参数中first如何与字符对应;2,listBase的作用;
经过查找基本确定
1,双字节内码DBCS(双字节字符集) 支持很多不同的语言字母,如汉语、日语和朝鲜语等。 DBCS 使用数字 0–128 表示 ASCII 字符集。其它大于 128 的数字作为前导字节字符,它并不是真正的字符,只是简单的表明下一个字符属于非拉丁字符集。在 DBCS 中,ASCII 字符的长度是一个字节,而汉语、朝鲜语和其它东亚字符的长度是 2 个字节。汉字内码的偏移量为256。故用下列语句实现字符的对应关系:
DWORD dwChar=m_strText[i];
if(IsDBCSLeadByte(m_strText[i])){
//汉字内码的偏移量为256
i+=2;
}
else{
dwChar=m_strText[i];
i++;
}
其中m_strText是要输出的字符串,IsDBCSLeadByte(m_strText[i])判断m_strText[i]是不是前导字节。
2:参数ListBase的作用是和参数count一起确定生成列表的名称,供glCallLists调用;
字符基础(ASCII,DBCS,Unicode)
所有的 string 类都是以C-style字符串为基础的。C-style字符串是字符数组。所以我们先介绍字符类型。这里有3种编码模式对应3种字符类型。第一种编码类型是单子节字符集(single-byte character set orSBCS)。在这种编码模式下,所有的字符都只用一个字节表示。ASCII是SBCS。一个字节表示的0用来标志SBCS字符串的结束。
第二种编码模式是多字节字符集(multi-byte character set orMBCS)。一个MBCS编码包含一些一个字节长的字符,而另一些字符大于一个字节的长度。用在Windows里的MBCS包含两种字符类型,单字节字符(single-byte characters)和双字节字符(double-byte characters)。由于Windows里使用的多字节字符绝大部分是两个字节长,所以MBCS常被用DBCS代替。
在DBCS编码模式中,一些特定的值被保留用来表明他们是双字节字符的一部分。例如,在Shift-JIS编码中(一个常用的日文编码模式),0x81-0x9f之间和0xe0-oxfc之间的值表示 "这是一个双字节字符,下一个子节是这个字符的一部分。"这样的值被称作"leading bytes ",他们都大于0x7f。跟随在一个leading byte子节后面的字节被称作 "trail byte"。在DBCS中,trail byte可以是任意非0值。像SBCS一样,DBCS字符串的结束标志也是一个单字节表示的0。
第三种编码模式是Unicode。Unicode是一种所有的字符都使用两个字节编码的编码模式。Unicode字符有时也被称作宽字符,因为它比单子节字符宽(使用了更多的存储空间)。注意,Unicode不能被看作MBCS。MBCS的独特之处在于它的字符使用不同长度的字节编码。Unicode字符串使用两个字节表示的0作为它的结束标志。
单字节字符包含拉丁文字母表,accented characters及ASCII标准和DOS操作系统定义的图形字符。双字节字符被用来表示东亚及中东的语言。Unicode被用在COM及Windows NT操作系统内部。
你一定已经很熟悉单字节字符。当你使用char时,你处理的是单字节字符。双字节字符也用char类型来进行操作(这是我们将会看到的关于双子节字符的很多奇怪的地方之一)。Unicode字符用wchar_t来表示。Unicode字符和字符串常量用前缀L来表示。