Direct3D 12工作原理概述这只是Direct3d 12的概述。以后的教程将更深入。
Pipeline State Objects (PSO)(MSDN Pipeline States)
管道状态对象由ID3D12PipelineState接口表示,并由设备接口通过CreateGraphicsPipelineState()方法创建。若要设置管道状态对象,可以调用命令列表的SetPipelineState() 方法。
该接口是使Direct3D 12表现出色的一部分。在初始化期间,您将创建许多此类管道状态对象,然后使用命令列表进行设置会占用很少的CPU开销,因为管道状态对象在设置时已经创建,并且将其设置在GPU上就像传递指针一样简单。 您可以创建多个没有数量限制。
创建管道状态对象时,必须填写D3D12_GRAPHICS_PIPELINE_STATE_DESC结构。设置管道状态对象时,此结构将确定管道的状态。
可以在“管道状态对象”中设置大多数管道状态,但是有一些不能在“管道状态对象”中设置,而是由“命令列表”设置。
可以在管道状态对象中设置的状态
- 用于顶点,像素,域,外壳和几何着色器的着色器字节码(D3D12_SHADER_BYTECODE)
- 流输出缓冲区(D3D12_STREAM_OUTPUT_DESC)
- 混合状态(D3D12_BLEND_DESC)
- 光栅化器状态(D3D12_RASTERIZER_DESC)
- 深度/模板状态(D3D12_DEPTH_STENCIL_DESC)
- 输入布局(D3D12_INPUT_LAYOUT_DESC)
- 基本拓扑(D3D12_PRIMITIVE_TOPOLOGY_TYPE)
- 渲染目标的数量(本教程中,我们有2个用于双缓冲,但是您可以使用3个用于三重缓冲。)
- 渲染目标视图格式(DXGI_FORMAT)
- 深度模板视图格式(DXGI_FORMAT)
- 采样描述(DXGI_SAMPLE_DESC)
在命令列表里面设置的状态
- 资源绑定(包括顶点缓冲区(vertex buffers), 索引缓冲区(index buffers), 流输出目标(stream output targets), 渲染目标(render targets), 描述符堆(descriptor heaps)和图形根参数)
- 视口(Viewports)
- 裁剪矩形(Scissor Rectangles)
- 混合因子(Blend factor)
- 深度/模板参考值(Depth/Stencil reference value)
- 基本拓扑顺序和邻接类型(Primitive topology order and adjacency type)
管道状态对象设置的管道状态不会被命令列表继承(当命令队列一次执行多个命令列表时,管道状态对象从上一个命令列表设置的管道状态不会被下一个命令继承队列中的列表)或Bundles (Bundles 不会继承由调用命令列表中的管道状态对象设置的管道状态)。在“命令列表”或“Bundles ”创建时设置“命令列表”和“Bundles ”的初始图形管线状态。
未由“管道状态对象”设置的管道状态也不会被“命令列表”继承。另一方面,Bundles 继承未使用“管道状态对象”设置的所有图形管道状态。当Bundle通过方法调用更改管道状态时,在Bundle完成执行后,该状态将继续返回到“命令列表”。
管道状态对象未为命令列表和Bundles 设置的默认图形管道状态为:
- 通过D3D_PRIMITIVE_TOPOLOGY_UNDEFINED设置图元拓扑
- 视口设置为零
- 裁剪矩形设置为零
- 混合因子设置为零
- 深度/模板参考值设置为零
- 断言被禁用(Predication is disabled)
您可以通过调用ClearState 方法将“命令列表”的管道状态设置回默认值。 如果在Bundle上调用此方法,则对命令列表“ close()”函数的调用将返回E_FAIL。
由命令列表设置的资源绑定由命令列表执行的Bundles 继承。 当Bundles 完成执行时,Bundles 设置的资源绑定也将为调用命令列表保持设置。
The Device
该设备由ID3D12Device 接口表示。 该设备是一个虚拟适配器,可用于创建命令列表,管道状态对象,根签名,命令分配器,命令队列,fence,资源,描述符和描述符堆。 计算机可能具有多个GPU,因此我们可以使用DXGI工厂来枚举设备,并找到功能级别为11(与Direct3d 12兼容)的第一台设备,而不是软件设备。 Direct3D的最大功能之一是与多线程应用程序更加兼容。 在本教程中,我们将只创建一个设备,这是我们发现的第一个与Direct3d 12兼容的设备,但实际上我们可以找到所有兼容的设备并全部使用它们。 找到要使用的适配器索引后,就可以通过调用D3D12CreateDevice().创建设备。
Command Lists (CL)(MSDN Command Lists and Bundles)
命令列表由ID3D12CommandList接口表示,并由设备接口通过CreateCommandList()方法创建。我们使用命令列表来分配要在GPU上执行的命令。 命令可能包括设置管道状态,设置资源,转换资源状态(资源屏障),设置顶点/索引缓冲区,绘制,清除渲染目标,设置渲染目标视图,执行包(命令组)等。
命令列表与命令分配器相关联,该命令分配器将命令存储在GPU上。
首次创建命令列表时,我们需要使用D3D12_COMMAND_LIST_TYPE 标志指定该命令列表的类型,并提供与该列表关联的命令分配器。 有四种类型的命令列表: 直接,捆绑,计算和复制。 我们在本教程中讨论直接命令和捆绑包命令列表。
直接命令列表是GPU可以执行的命令列表。直接命令列表需要与直接命令分配器关联(使用D3D12_COMMAND_LIST_TYPE_DIRECT标志创建的命令分配器)。要将命令列表设置为记录状态,我们调用命令列表的Reset()]方法,提供命令分配器和管道状态对象。将NULL作为管道状态对象的参数传递是有效的,并且将设置默认管道状态。
当我们完成命令列表的填充时,我们必须调用close()方法以将命令列表设置为非记录状态。调用close之后,我们可以使用Command Queue执行命令列表。
一旦执行了命令列表,即使GPU还没有完成,我们也可以将其重置(一旦调用execute,则由Command Allocator存储在GPU上运行的命令)。这样,我们就可以重用分配给命令列表的内存(在CPU端,而不是在GPU端,由Command Allocator将命令存储在内存中)。我们将在本教程中进行此操作,在多线程部分中,我将对此进行更好的解释。
捆绑(Bundles)(MSDN Command Lists and Bundles)
捆绑包由ID3D12CommandList接口表示,与直接命令列表相同,唯一的区别是在创建捆绑包时(通过调用CreateCommandList()方法),可以使用D3D12_COMMAND_LIST_TYPE_BUNDLE标志而不是D3D12_COMMAND_LIST_TYPE_DIRECT标志来创建捆绑包。
捆绑包是一组经常重复使用的命令。它们很有用,因为与命令组有关的大多数CPU工作都是在捆绑创建时完成的。在大多数情况下,捆绑包与命令列表相同,只是捆绑包只能由直接命令列表执行,而直接命令列表只能由命令队列执行。可以重复使用命令列表,但是在再次调用该命令列表上的execute之前,GPU必须先完成该命令列表的执行。在实践中,几乎不可能重复使用命令列表,因为场景会在帧与帧之间变化,这意味着命令列表将在帧与帧之间变化。Nvidia上有一篇关于Direct3D最佳实践(DX12做和不做)的不错的文章,并传达他们的建议,一个捆绑软件最多只能包含约12条命令,否则,如果添加太多命令,该捆绑软件的可重用性会受到打击,这意味着您将无法经常重复使用它。最好创建许多可以经常重用的小捆绑包,而不是创建几个您不能经常重用的大捆绑包,因为捆绑包的全部是可重用的命令组。
捆绑包不能直接从命令队列中执行。您可以通过从直接命令列表中调用ExecuteBundle()在命令列表上执行捆绑软件。
捆绑包不继承调用直接命令列表设置的管道状态。
命令队列(CQ)(MSDN Command Queues)
命令队列由ID3D12CommandQueue接口表示,并使用设备接口的CreateCommandQueue()方法创建。 我们使用命令队列来提交要由GPU执行的命令列表。 命令队列还用于更新资源图块映射。
命令分配器(CA)(MSDN Command Allocators)
命令分配器由ID3D12CommandAllocator 接口表示,并使用设备接口的CreateCommandAllocator () 方法创建。
命令分配器表示用于存储命令列表和捆绑包中的命令的GPU内存。
一旦命令列表执行完毕,您可以在命令分配器上调用reset()释放内存。尽管可以在执行命令队列调用后立即在命令列表上调用reset(),但在调用reset()之前,与命令分配器关联的命令列表必须完全完成在GPU上的执行,否则调用将失败。这是因为GPU可能正在执行命令分配器所代表的内存中存储的命令。这是我们的应用程序必须使用Fences同步CPU和GPU的地方。在对命令分配器调用reset()之前,必须检查围栏以确保与命令分配器关联的命令列表已完成执行。
任何时候与命令分配器关联的命令列表都只能处于记录状态。这意味着对于每个填充命令列表的线程,您将需要至少一个命令分配器和至少一个命令列表。
资源(MSDN Resource Binding)
资源包含用于构建场景的数据。 它们是存储几何,纹理和着色器数据的内存块,图形管道可以在其中访问它们。 资源类型是资源包含的数据类型。
资源类型
- Texture1D
- Texture1DArray
- Texture2D
- Texture2DArray
- Texture2DMS
- Texture2DMSArray
- Texture3D
- Buffers (ID3D12Resource )
资源引用/视图
- Constant buffer view (CBV)
- Unordered access view (UAV)
- Shader resource view (SRV)
- Samplers
- Render Target View (RTV)
- Depth Stencil View (DSV)
- Index Buffer View (IBV)
- Vertex Buffer View (VBV)
- Stream Output View (SOV)
描述符(资源视图)(MSDN Descriptors)
描述符是一种结构,它告诉着色器在哪里可以找到资源以及如何解释资源中的数据。在D3D11中查看资源视图时,您可以在D3D12中查看描述符。您可能会为同一资源创建多个描述符,因为管道的不同阶段可能会不同地使用它。例如,我们创建一个Texture2D资源。我们创建一个“渲染目标视图”(RTV),以便可以将该资源用作管道的输出缓冲区(将该资源作为RTV绑定到“输出合并”(OM)阶段)。我们还可以为同一资源创建一个无序访问视图(UAV),我们可以将其用作着色器资源并使用其纹理化几何体(例如,如果场景中某处有安全摄像机,则可以执行此操作。摄像机看到的资源(RTV)上的场景,然后我们将该资源(UAV)渲染到安全室中的电视上。
描述符只能放在描述符堆中。没有其他方法可以将描述符存储在内存中(某些根描述符(只能是CBV的根描述符)以及原始或结构的UAV或SRV缓冲区除外。诸如Texture2D SRV之类的复杂类型不能用作根描述符)。
描述符表(DT)(MSDN Descriptor Tables)
描述符表是描述符堆中的描述符数组。 所有描述符表都是描述符堆的偏移量和长度。
着色器可以通过根签名的描述符表按索引访问描述符堆中的描述符。 因此,要访问着色器中的描述符,您将索引到根签名描述符表中。
CBV,UAV,SRV和Samplers 存储在描述符堆中,并且可由着色器的描述符引用。
RTV,DSV,IBV,VBV和SOV并非通过描述符表进行引用,而是直接绑定到管道。 MSDN文档在这部分内容上有些令人困惑,因此说实话,我对此并不完全确定,但是MSDN说这些没有存储在描述符堆中,但是对于RTV而言,并不是完全正确的, DSV和SOV,因为您需要为其创建堆和描述符。 据我了解,没有其他方法可以创建它们。
描述符堆(DH)(MSDN Descriptor Heaps)
描述符堆由接口ID3D12DescriptorHeap表示,并使用方法ID3D12Device :: CreateDescriptorHeap()创建。描述符堆是描述符的列表。它们是存储描述符的一块内存。
采样器不能与资源进入相同的描述符堆。描述符堆也可以是“着色器可见”或“非着色器可见”。着色器可见描述符堆是包含着色器可以访问的描述符的堆。这些类型的堆可能包括CBV,UAV,SRV和Sampler描述符。非着色器可见描述符堆是着色器无法引用的堆。这些类型的堆包括RTV,DSV,IBV,VBV和SOV资源类型。法线贴图可能具有三个描述符堆,一个用于采样器,一个用于着色器可见资源,一个用于非着色器可见资源。本教程将只有一个描述符堆,该堆存储渲染目标视图的描述符。下一个教程将有两个,一个用于渲染目标视图,一个用于顶点缓冲区视图(我们将在下一个教程中绘制一个三角形)。
在任何给定时间,只能将一个着色器可见堆和一个采样器堆绑定到管道。您希望描述符堆在最长时间内具有正确的描述符(根据MSDN,“理想情况下是整个渲染帧或更多”)。描述符堆必须有足够的空间来为每个所需状态集动态定义描述符表。为此,您可以在管道状态改变时重用描述符空间(例如,正在渲染一棵树,描述符堆中有一个描述符,当您绘制树的底部时,该描述符指向树皮的UAV。树,当您需要绘制树的叶子时,管道会发生变化,因此您可以通过将树皮纹理的UAV替换为叶子纹理的UAV来重用树皮纹理的UAV。
D3D12允许您在命令列表中多次更改描述符堆。这非常有用,因为较旧的低功耗GPU仅具有65k的描述符堆存储空间。更改描述符堆会导致GPU“刷新”当前的描述符堆,这是一项昂贵的操作,因此您希望尽可能少地执行此操作,并且在GPU不需要大量工作的情况下(例如在开始时)命令列表。
Bundles 仅允许调用SetDescriptorHeaps一次,并且此命令设置的描述符堆必须与调用Bundles 的命令列表已设置的描述符堆完全匹配。
有两种管理描述符堆的方法,这里有两种(在MSDN文档中提到了这些方法):
基本方法(效率不高,但很容易实现)
第一种方法(也是最基本的方法)就在绘制调用之前,将绘制所需的所有描述符添加到描述符堆中,然后在根签名中设置一个描述符表以指向新的描述符。这种方法很好,因为不需要跟踪描述符堆中的所有描述符。但是,由于我们将对绘制调用的所有描述符都添加到了堆中,因此在堆中将有很多重复的描述符,这使得该方法非常无用,尤其是在渲染相似的对象或场景时。我们必须在描述符堆中的可用空间中添加新的描述符,而不是覆盖先前绘制中描述符堆中已经存在的描述符的原因是,因为GPU实际上可以同时执行多个绘制调用,这意味着描述符已经当我们开始为当前绘制覆盖它们时,描述符堆中的可能会被使用。
使用此方法,由于以下一个或两个原因,您可能需要一个额外的描述符堆:场景又大又复杂,描述符空间用完了,或者可能存在同步问题,因此您有一个描述符堆, GPU读取,然后在GPU执行命令列表时填充另一个CPU,然后在每一帧交换这两个堆。
第二种方法(效率更高,实施起来更困难)
另一种方法是跟踪描述符堆中每个描述符的索引。这种方法非常有效,因为您可以为相似的对象和场景重用描述符。这种方法是有效的,因为在描述符堆中几乎没有或没有重复的描述符。这种方法的缺点是实施起来有点复杂。如果您的场景足够小,并且没有在整个场景中更改的资源,则实际上可以创建一个巨型描述符表,并在场景结束时刷新该对象,然后需要重新加载新资源。如果在整个场景中唯一改变的是根常量和根描述符,那么这将起作用。描述符表(在根签名中定义)在整个场景中保持不变。
进行一些优化的其他几种方法是在描述符堆中有两个描述符表。一个描述符表的资源在整个场景中不会改变,而另一个描述符表的资源则经常变化。
您将要做的另一件事是确保根常量和根描述符包含最频繁更改的常量和描述符。
根签名(RS)(MSDN Root Signatures)
根签名定义了着色器访问的数据(资源)。根签名就像一个函数的参数列表,其中函数是着色器,而参数列表是着色器访问的数据类型。根签名包含根常量,根描述符和描述符表。根参数是根签名中的一项,可以是根常量,根描述符或描述符表。应用程序可以更改的根参数的实际数据称为“根参数”。
根签名的最大大小始终为64个DWORDS。
根常量
根常量是内联32位值(它们占用1 DWORD)。这些值直接存储在根签名中。由于根签名的内存是有限的,因此您只想在此处存储着色器访问最常更改的常量值。这些值显示为着色器的恒定缓冲区。从着色器访问这些变量没有成本(无需重定向),因此访问它们非常快。根描述符
根描述符是着色器最常访问的内联描述符。这些是64位虚拟地址(2个DWORD)。这些描述符仅限于CBV,原始或结构化SRV和UAV。不能使用诸如Texture2D SRV之类的复杂类型。从着色器引用根描述符时,需要进行一次重定向。关于根描述符的另一件事要注意的是,它们只是指向资源的指针,它们不包含数据的大小,这意味着从根描述符访问资源时不能进行越界检查,这与存储在根描述符中的描述符不同。描述符堆,它确实包括大小,并且可以在其中进行边界检查。描述符表
上面讨论过,描述符表是描述符堆的偏移量和长度。描述符表只有32位(1个DWORD)。描述符表中有多少个描述符没有限制(间接允许最大描述符堆大小的描述符数目除外)。从描述符表访问资源时,会有两个间接开销。第一个间接方法是从描述符表指针到存储在堆中的描述符,然后从描述符堆到实际资源。资源屏障(MSDN Resource Barriers)
资源屏障用于更改资源或子资源的状态或使用情况。 Direct3D 12引入了资源屏障作为其多线程友好API的一部分。资源屏障用于帮助在多个线程之间同步资源的使用。
资源屏障分为三种:过渡屏障(Transition Barrier), 别名屏障(Aliasing Barrier), 和无序访问视图(UAV)屏障( Unordered Access View (UAV) Barrier)。
过渡屏障
当您要将资源或子资源的状态从一种状态转换到另一种状态时,可以使用过渡屏障。何时更改资源状态的一个示例是在翻转交换链之前将资源从渲染目标状态更改为当前状态。别名屏障
别名障碍与平铺资源一起使用。这些障碍用于更改具有映射到同一个图块池(来自msdn)的两个不同资源的用法。目前,我还没有对切片资源的透彻了解,因此在这里我将不做解释。无序访问视图(UAV)屏障
UAV屏障用于确保在调用此屏障之前完成所有读/写操作。这样一来,例如,如果正在写入UAV,则有一个绘图调用,在执行绘图调用之前完成对UAV的写入。无需在仅从UAV读取的两个抽签或调度调用之间创建UAV屏障。如果同一UAV由两个不同的绘制或调度调用写入,也不需要,只要应用程序确定一个在另一个开始之前就已经完全完成即可。如果要绘制纹理,则可以在UAV上使用UAV屏障,然后使用该纹理在模型上绘制。在将UAV用作模型上的纹理之前,UAV屏障将确保绘制到UAV的调用已完成。围栏和围栏事件
DirectX 12的一部分“和metal相似”,这是事实,我们可以将命令队列发送到GPU以开始执行,然后可以立即在CPU上再次开始工作。为了确保我们不修改或删除GPU当前正在使用的内容,我们使用围栏。 Fences和Fence Events将让我们知道GPU在执行命令队列时的位置。在此应用中,我们要做的是告诉GPU执行命令队列,更新游戏逻辑,检查/等待GPU完成执行命令队列,通过将更多命令查询到命令列表中来更新管道,然后再次执行执行命令队列。通过首先用命令填充命令列表,执行命令队列,发信号通知命令列表以将围栅值设置为指定值,然后检查围栅值是否是我们告诉命令列表将其设置为的值,该方法起作用。如果是这样,我们知道命令列表已完成其命令列表,并且可以重置命令列表和队列,然后重新填充命令列表。如果围栅值仍然不是我们所指示的值,则创建围栅事件,然后等待GPU发出该事件的信号。围栏由ID3D12Fence接口表示,而围栏事件是句柄HANDLE。设备使用方法ID3D12Device :: CreateFence()创建围栅,并使用CreateEvent()方法创建围栅事件。
参考链接:
- https://docs.microsoft.com/en-us/windows/win32/direct3d12/directx-12-programming-guide
- http://www.d3dcoder.net/
- https://www.braynzarsoft.net/viewtutorial/q16390-04-directx-12-braynzar-soft-tutorials
- https://developer.nvidia.com/dx12-dos-and-donts
- https://www.3dgep.com/learning-directx-12-1/
- https://gpuopen.com/learn/lets-learn-directx12/
- https://alain.xyz/blog/raw-directx12
- https://www.rastertek.com/tutdx12.html
- https://digitalerr0r.net/2015/08/19/quickstart-directx-12-programming/
- https://walbourn.github.io/getting-started-with-direct3d-12/
- https://docs.aws.amazon.com/lumberyard/latest/userguide/graphics-rendering-directx.html
- http://diligentgraphics.com/diligent-engine/samples/
- https://www.programmersought.com/article/2904113865/
- https://www.tutorialspoint.com/directx/directx_first_hlsl.htm
- http://rbwhitaker.wikidot.com/hlsl-tutorials
- https://digitalerr0r.net/2015/08/19/quickstart-directx-12-programming/
- https://www.ronja-tutorials.com/post/002-hlsl/
Direct3D 12工作原理概述
原创
©著作权归作者所有:来自51CTO博客作者嘿克不黑的原创作品,请联系作者获取转载授权,否则将追究法律责任
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章
-
Direct3D Frustum裁剪原理
本文原创版权归 百度 laizhishen 所有,如有转载,请按如下方式显式标明3d206d209cca9c54ac34de4
direct3d float c 优化 面试 -
Direct3D顶点结构使用总结
D3D里面最基本的就是顶点了,虽说一直在用,可是却也是自己比较用LPDIRECT3DVERTEXBUFFER9 来声明顶点缓冲区,它其实就是IDirect3DVe
direct3d float matrix struct blend -
direct3d
DirectX for .Net procedure 1, install DXSDK https://www.microsoft.com/en-us/download/details.aspx?id=6812 2, goto MS tutorial https://msdn.microsoft.c
microsoft .net desktop v9 前端 数据 数据库 编程语言 -
Direct3D 使用质地
关于使用质地1 创建纹理2 纹理寻址模式3 纹理过滤1 创建纹理 D3DXCreat
d3 寻址 寻址方式 3d 多级