【ZeloEngine】OpenGL升级Vulkan

android opengl yuv 转换 opengl改成vulkan_Layout

Vulkan的资料有很多,这里以GDC2016中nvidia的slide作为讨论的基础

Vulkan: the essentials

Vulkan - 高性能渲染 - 知乎 // 结果发现是文刀秋二做的talk,这就是大佬把

还有一本基础书《Learning Vulkan》

这本书和大部分Packt的书一样有一个问题,有很多流水账一样的线性流程代码

android opengl yuv 转换 opengl改成vulkan_开发语言_02

下文中Vulkan简称vk

Scope

最终目标:多线程渲染框架

笔者水平有限,无法一步完成多线程渲染框架,拆解一下,大致分几步:

  1. GL升级Vulkan,跑通原来的Demo
  2. 多线程调研:Asio/TaskFlow
  3. 多线程引擎架构

是什么?不是什么?

vk是图形接口,笔者学习vk主要是理解CPU和GPU协同完成绘制的软件过程

vk不是GPU硬件,也不是图形学,但是有一定辅助理解作用

vk在渲染架构的位置

理想的分层架构如下,实际上由于缺乏经验,笔者无法很好地分离出RHI层,vk call到处飞

android opengl yuv 转换 opengl改成vulkan_多线程_03

Why not DX12?

换开发框架,数学库,坐标系手性,shader,总之风险比Vulkan大

1. 初始化时序依赖

这里出现新的case了,下面两句不依赖window,尽早初始化

volk就是loader,调了才能调vk call,否则代码段错误

volk < create-window < vk-call

此外,还有一个依赖,所有显卡操作需要走命令队列,因此要先创建命令队列:

command pool < command buffer < vk-command-call

glslang_initialize_process();
volkInitialize();

2. 多图形接口宏管理

GL,Vulkan,两个宏,用ifdef到处打洞,打补丁,window这种强平台相关其实还不如每个写一个版本

一种比较干净的写法就是派生WindowGL,WindowVulkan类,顶层包一下宏,避免ifdef到处飞

由于SDL的Vulkan扩展总共就5个接口,这里就不派生了,统一放在一个Window类

3. SDL

市面上大部分例程都是glfw的,但是Zelo用的是SDL

SDL封装了窗口 / 平台相关的API,折腾了一会

// 1. native way
// Creat empty Window
CreateWindowEx(...);		/*Windows*/

// Query WSI extensions,store as function pointers. For example:
// vkCreateSwapchainKHR, vkCreateSwapchainKHR .....

// Create abstract surface object
VkWin32SurfaceCreateInfoKHR createInfo = {};
vkCreateWin32SurfaceKHR(instance, &createInfo, NULL, &surface);
// 2. SDL way
SDL_CreateWindow(..., SDL_WINDOW_VULKAN);

SDL_Vulkan_CreateSurface(m_window, instance, surface);

4. 同步

比较复杂,即使单线程渲染,仍然要手工做CPU和GPU的同步,前面提到了一些,由于不熟悉,不多讨论

Zelo这里简化了,没处理 TODO

同步都暂时不考虑,第二个pass再说

SetImageLayoutvkCreateImageView之间加了一个barrier,表明这两步有时序依赖

// Retrieve the Swapchain images
foreach swapchainImages{
	// Set the implementation compatible layout
	SetImageLayout();

	// Insert pipeline barrier
	VkImageMemoryBarrier imgMemoryBarrier = { ... };
	/* => */ vkCmdPipelineBarrier(cmd,srcStages,destStages,0,0,NULL,0,NULL,1,&imgMemoryBarrier);

	// Create the image view for the image object 
	SwapChainBuffer scBuffer = {...};
	VkImageViewCreateInfo colorImageView = {};
	colorImageView.image = sc_buffer.image;
	vkCreateImageView(device, &colorImageView, NULL, &scBuffer.view);

	// Save the image view for application use
	buffers.push_back(scBuffer);
}

惯用法

1. 查询列表 / 枚举(enumerate)

查询一个列表结果,调用两次,第一次传入NULL,返回列表长度,第二次传入列表,填充并返回列表

// Enumerate Instance Layer properties
// Get number of instance layers
uint32_t instanceLayerCount;
	
// Use second parameter as NULL to return the layer count
vkEnumerateInstanceLayerProperties(&instanceLayerCount, NULL); 

VkLayerProperties *layerProperty = NULL;
vkEnumerateInstanceLayerProperties(&instanceLayerCount, layerProperty);
// Enumerate physical devices
VkPhysicalDevice				gpu;		// Physical device
uint32_t						gpuCount;	// Pysical device count
std::vector<VkPhysicalDevice>	gpuList;	// List of physical devices
// Get number of GPU count
vkEnumeratePhysicalDevices(instance, &gpuCount, NULL);

// Get GPU information
vkEnumeratePhysicalDevices(instance, &gpuCount, gpuList);

概念清单

清晰的概念是思考的基石

Understanding Vulkan® Objects - GPUOpen

vk的概念很多,是一个重点

  • Instance:全局单例
  • Device:设备,指显卡GPU
  • Layer:可以理解为钩子
  • Extension:扩展功能,可以理解为DLC
  • Queue:指令队列
  • SwapChain:一个可以透明的概念
  • DesciptorSet:Shader资源槽位

电脑可以有多个显卡,一般我们选择最好的那一个

android opengl yuv 转换 opengl改成vulkan_javascript_04

现代GPU其实是“多功能”的,一个功能模块对应一个Queue,比如我们渲染就使用Graphics Queue,通用计算就用Compute Queue,Queue下称q

QueueFamily属于硬件范围概念,略

android opengl yuv 转换 opengl改成vulkan_javascript_05

SwapChain,一般double buffer够用了,其实就是两张图片,一张显示在屏幕上,一张在后台程序绘制,轮替显示

这个图片的特殊在于,不需要我们维护内存,因为独一份

android opengl yuv 转换 opengl改成vulkan_多线程_06

理解管线

一个不太恰当的管线比喻

来看regex的例子

compield-pattern = re.compile("([A-Z])\w+")
result1 = re.match(compiled-pattern, "My Str1")
result2 = re.match(compiled-pattern, "My Str2")

## i.e.
match_word = functools.partial(re.compile, compiled-pattern)
result = match_word("My Str")

这里有几个关键的类比:

  1. 预编译的管线,来提升性能
  2. 画面 = Σ管线(资源),其中管线是复用的,一帧画面有若干drawcall,一个drawcall绘制一批资源到画布上,最终求和得到整个画面

初始化流程

没什么技巧,找个现成的对照着拼出流程,好的例程对步骤的切分比较清晰

厘清概念,了解清楚每一步在干什么,创建出来的东西是什么,干什么用的

流程

1. Enumerate Instance Layer properties 
2. Instance Creation 
3. Enumerate physical devices 
4. Create Device 
5. Presentation Initialization 
6. Creating Swapchain 
7. Creating Depth buffer 
8. Building shader module 
9. Creating descriptor layout and pipeline layout 
10. Render Pass 
11. Creating Frame buffers 
12. Populate Geometry storing vertex into GPU memory 
13. Vertex binding 
14. Defining states 
15. Creating Graphics Pipeline 
16. Acquiring drawing image 
17. Preparing render pass control structure 
18. Render pass execute 
19. Queue Submission 
20. Present the draw result on the display window
1. 枚举Instance Layer属性
2. 实例创建
3. 枚举物理设备
4. 创建设备
5. 演示初始化
6. 创建交换链
7. 创建深度缓冲区
8. 构建着色器模块
9. 创建描述符布局和管道布局
10. 渲染通行证
11. 创建帧缓冲区
12. 将存储顶点的几何填充到 GPU 内存中
13. 顶点绑定
14. 定义状态
15. 创建图形管道
16. 获取绘图图像
17. 准备渲染通道控制结构
18. 渲染通道执行
19. 队列提交
20. 在显示窗口中呈现绘制结果

流程图例

构造全局单例,启用layer和extension

枚举并创建设备,电脑可以有多个显卡,一般我们选择最好的那一个

现实里可以摸到的称为物理设备,有了物理设备,在程序中创建对应的逻辑设备,进行编程控制

设备scope,也有扩展可以勾选,与全局单例进行对比

android opengl yuv 转换 opengl改成vulkan_开发语言_07

显示相关,实时渲染需要一个显示器显示每帧渲染的画面

首先创建一个native窗口,然后再创建一个Surface,Surface是对窗口的抽象

android opengl yuv 转换 opengl改成vulkan_Layout_08

资源

资源是对显存的抽象

vk堆上分的大类有两个,Image和Buffer

android opengl yuv 转换 opengl改成vulkan_开发语言_09

Shader & Shader资源绑定

Shader编译与构造ShaderModule这一步相对独立,比较简单,略

比较麻烦的是Shader资源绑定

一个不太恰当的比喻,一个Shader相当于下图中的一个计算节点,它有一些输入和输出

一般是输入一些资源,输出一些颜色 / 向量 计算结果

android opengl yuv 转换 opengl改成vulkan_ecmascript_10

我们怎么用C++代码把资源连接到Shader的槽位上呢?

其实就是槽位需要一个标识,可以是Shader变量名,也可以是一个唯一的索引(0,1,2,etc)

vk里的一个槽位就是一个Descriptor

一个Shader有一组槽位,也就是一个Descriptor Set

一组槽位还有一个Layout,/

一个Pipeline(顶层概念)有多套Shader和Descriptor Set,称为Pipeline Layout

emm,vk的概念真的很复杂:

DescriptorSetLayoutBinding < DescriptorSetLayout < PipelineLayout

android opengl yuv 转换 opengl改成vulkan_多线程_11

Layout相关的编程一般都比较麻烦,还有一处就是顶点Layout,本质上需要描述一个Schema,把C++类型和Shader类型对应起来,还要考虑对齐

RenderPass

还有个SubPass,这块没搞懂

代码结构上,SubPass < RenderPass < FrameBuffer

SwapChain有两张图片,每张都要创建一个FrameBuffer

Mesh & Vertex

顶点数据对应buffer,顶点格式描述对应VkVertexInputBindingDescription,前面提到过,略

Pipeline & PSO

Pipeline是顶层概念,之前提到的所有vk对象都会被Pipeline引用

DrawCall

16. 获取绘图图像
17. 准备渲染通道控制结构
18. 渲染通道执行
19. 队列提交
20. 在显示窗口中呈现绘制结果

伪代码

accuqire-swapchain-image

for render-pass in render-pass-list do
	begin-render-pass
	bind-pipeline
	record-drawcall
end

submit-drawcall
wait-for-swapchain

------ Misc ------

RHI

  1. CommandBuffer
  2. Memory
  3. Image
  4. SwapChain
  5. Buffer
  6. RenderPass
  7. FrameBuffer
  8. Shader
  9. Descriptor
  10. Pipeline
  11. PSO

调试

  1. debug layer,好东西,多看log熟悉即可
  2. nsight