OpenGL 绘图的机制是:先用 OpenGL 的绘图上下文 Rendering Context (简称为 RC )把图画好,再把所绘结果通过 SwapBuffer() 函数传给 Window 的绘图上下文 Device Context (简记为 DC)。要注意的是,程序运行过程中,可以有多个 DC,但只能有一个 RC。因此当一个 DC 画完图后,要立即释放 RC,以便其它的 DC 也使用。
glFlush:将GL命令队列中的命令发送给显卡并清空命令队列,发送完立即返回;glFlush()就是强制刷新,OpenGL是使用一条渲染管线线性处理命令的,一般情况下,我们提交给OpenGL的指令并不是马上送到驱动程序里执行的,而是放到一个缓冲区里面,等这个缓冲区满了再一次过发到驱动程序里执行;很多时候只有几条指令是填充不满那个缓冲区的,就是说这些指令根本没有被发送到驱动里,所以我们要调glFlush来强制把这些指令送到驱动里进行处理。
glFinish:将GL命令队列中的命令发送给显卡并清空命令队列,显卡完成这些命令(也就是画完了)后返回。
因此,在绘图命令比较冗长的情况下,可以分段调用 glFlush 以清空命令队列并让显卡开始先执行这些命令,最后调用glFinish来同步。举个例子:我的渲染器一共有9种shader,渲染时从shader0一直渲染到shader8,以前是在所有shader渲染完成后才调用glFinish(注意:这里如果把glFinish换成glFlush,那么调用wglSwapBuffer的时候在不同的平台上会产生不同的结果,具体结果我也不清楚,个人感觉好像没什么问题,但是游戏的时钟系统会被扰乱——最明显的就是帧速算错),那么CPU就要等GPU绘图,浪费了大把大把的时间;现在改成每个shader完成后调用一次glFlush,强制GPU开始执行命令队列中的GL命令,最后调用glFinish等待GPU完成当前帧渲染,然后调用wglSwapBuffer调换前后缓存。
这里就会发现这样一件事情:无论如何,都要等glFinish返回了,如果GPU绘制需要比较多的时间,那么CPU在这里等待的时间就比较可观了,如何提高CPU效率呢?个人认为有两个办法:
1、使用多线程。将更新和渲染作为线程A,辅助性计算如AI策略、地图生成作为线程B。那么当线程A因为glFinish阻塞时,线程B便可以利用CPU进行计算。
2、使用CPU时间预算方法。即先给出一帧所需要的时间预算,在调用glFinish之前判断是否还有多的时间预算,若有多,则先作辅助计算,完成或超过预算时间后才调用glFinish(若此时GPU已经完成命令,就不需要等待了)。