当前位置:   article > 正文

Unity URP中根据深度重建世界坐标_unity 通过深度重建世界坐标

unity 通过深度重建世界坐标

通过深度值重建世界坐标,可以做出很多有意思的后处理效果,先实现下度值重建世界坐标这个功能。

一.验证重建效果

首先,得先找到一种证明反推回世界空间位置正确的方法。在相机前摆放几个物体,尽量使之在世界坐标下的位置小于1,方便判定颜色,然后将几个物体的shader换成如下的一个打印世界空间位置的shader:

  1. //打印在世界空间位置
  2. Shader "Universal Render Pipeline/Dejavu/ReconstructPositionWithDepth/WorldPosPrint"
  3. {
  4. SubShader
  5. {
  6. Tags { "RenderPipeline" = "UniversalPipeline" "RenderType" = "Opaque" }
  7. LOD 300
  8. ZWrite[_ZWrite]
  9. Cull Off ZWrite On
  10. Pass
  11. {
  12. Name "ForwardLit"
  13. Tags{"LightMode" = "UniversalForward"}
  14. HLSLINCLUDE
  15. #include "Packages/com.unity.render-pipelines.universal/ShaderLibrary/Core.hlsl"
  16. ENDHLSL
  17. HLSLPROGRAM
  18. #pragma vertex vert
  19. #pragma fragment frag
  20. struct appdata
  21. {
  22. float4 vertex : POSITION;
  23. float2 uv : TEXCOORD0;
  24. };
  25. struct v2f
  26. {
  27. float3 worldPos : TEXCOORD0;
  28. float4 vertex : SV_POSITION;
  29. };
  30. v2f vert(appdata v)
  31. {
  32. v2f o;
  33. UNITY_SETUP_INSTANCE_ID(v);
  34. UNITY_INITIALIZE_VERTEX_OUTPUT_STEREO(o);
  35. o.vertex = TransformObjectToHClip(v.vertex);
  36. o.worldPos = mul(unity_ObjectToWorld, v.vertex);
  37. return o;
  38. }
  39. float4 frag(v2f i) : SV_Target
  40. {
  41. return float4(i.worldPos, 1.0);
  42. }
  43. ENDHLSL
  44. }
  45. Pass
  46. {
  47. Name "DepthOnly"
  48. Tags{"LightMode" = "DepthOnly"}
  49. ZWrite On
  50. ColorMask 0
  51. Cull[_Cull]
  52. HLSLPROGRAM
  53. #pragma exclude_renderers gles gles3 glcore
  54. #pragma target 4.5
  55. #pragma vertex DepthOnlyVertex
  56. #pragma fragment DepthOnlyFragment
  57. // -------------------------------------
  58. // Material Keywords
  59. #pragma shader_feature_local_fragment _ALPHATEST_ON
  60. #pragma shader_feature_local_fragment _SMOOTHNESS_TEXTURE_ALBEDO_CHANNEL_A
  61. //--------------------------------------
  62. // GPU Instancing
  63. #pragma multi_compile_instancing
  64. #pragma multi_compile _ DOTS_INSTANCING_ON
  65. #include "Packages/com.unity.render-pipelines.universal/Shaders/LitInput.hlsl"
  66. #include "Packages/com.unity.render-pipelines.universal/Shaders/DepthOnlyPass.hlsl"
  67. ENDHLSL
  68. }
  69. }
  70. }

 得到的效果如下图所示,颜色代表了世界坐标位置。要注意的是URP中想要渲染Depth,需要Tags{"LightMode" = "DepthOnly"}这个Pass

 在之后的重建世界坐标位置的后处理Shader开启后,如果摄像机显示的没有变化,则证明重建成功

二.逆矩阵方式重建

 世界坐标的重建有两种方法,最直观的一种就是通过VP逆矩阵,在fragment ShadeClip空间中的位置转换为世界坐标。该方法的核心步骤为:

1.通过uv和深度图中采样的深度信息,构建NDC中坐标位置,从而构建Clip空间中位置

2.NDC坐标乘以逆矩阵即可得到世界坐标。

fragment中的代码为:

  1. //fragment shader
  2. float4 frag(v2f i) : SV_Target
  3. {
  4. float sceneRawDepth = SAMPLE_DEPTH_TEXTURE(_CameraDepthTexture, sampler_CameraDepthTexture, i.uv);
  5. float4 ndc = float4(i.uv.x * 2 - 1, i.uv.y * 2 - 1, sceneRawDepth, 1);
  6. #if UNITY_UV_STARTS_AT_TOP
  7. ndc.y *= -1;
  8. #endif
  9. float4 worldPos = mul(UNITY_MATRIX_I_VP, ndc);
  10. worldPos /= worldPos.w;
  11. return worldPos;
  12. }

看起来比较简单,但是其中有一个/w的操作,如果按照正常思维来算,应该是先乘以w,然后进行逆变换,最后再把world中的w抛弃,即是最终的世界坐标,不过实际上投影变换是一个损失维度的变换,我们并不知道应该乘以哪个w,所以实际上上面的计算,并非按照理想的情况进行的计算,而是根据计算推导而来。具体推导:How to go from device coordinates back to worldspace in OpenGL (with explanation)

已知条件(M为VP矩阵,M^-1即为其逆矩阵,Clip为裁剪空间,ndc为标准设备空间,world为世界空间):

ndc = Clip.xyzw / Clip.w = Clip / Clip.w

world = M^-1 * Clip

二者结合得:

world = M ^-1 * ndc * Clip.w

我们已知M和ndc,然而还是不知道Clip.w,但是有一个特殊情况,是world的w坐标,经过变换后应该是1,即

1 = world.w = (M^-1 * ndc).w * Clip.w

进而得到Clip.w = 1 / (M^ -1 * ndc).w

带入上面等式得到:

world = (M ^ -1 * ndc) / (M ^ -1 * ndc).w

优化

上边的shader代码中,自己通过uv和深度构建了ndc坐标,但是实际上Unity URP提供了ComputeWorldSpacePosition函数可以直接调用(函数位置在core rp中的Common.hlsl):

  1. float3 ComputeWorldSpacePosition(float2 positionNDC, float deviceDepth, float4x4 invViewProjMatrix)
  2. {
  3. float4 positionCS = ComputeClipSpacePosition(positionNDC, deviceDepth);
  4. float4 hpositionWS = mul(invViewProjMatrix, positionCS);
  5. return hpositionWS.xyz / hpositionWS.w;
  6. }

其中的omputeClipSpacePosition函数也在core rp中的Common.hlsl中:

  1. float4 ComputeClipSpacePosition(float2 positionNDC, float deviceDepth)
  2. {
  3. float4 positionCS = float4(positionNDC * 2.0 - 1.0, deviceDepth, 1.0);
  4. #if UNITY_UV_STARTS_AT_TOP
  5. // Our world space, view space, screen space and NDC space are Y-up.
  6. // Our clip space is flipped upside-down due to poor legacy Unity design.
  7. // The flip is baked into the projection matrix, so we only have to flip
  8. // manually when going from CS to NDC and back.
  9. positionCS.y = -positionCS.y;
  10. #endif
  11. return positionCS;
  12. }

最终,我们的Shader只需要:

  1. //fragment shader
  2. float4 frag(v2f i) : SV_Target
  3. {
  4. float sceneRawDepth = SAMPLE_DEPTH_TEXTURE(_CameraDepthTexture, sampler_CameraDepthTexture, i.uv);
  5. float3 worldPos = ComputeWorldSpacePosition(i.uv, sceneRawDepth, UNITY_MATRIX_I_VP);
  6. return float4(worldPos, 1);
  7. }

代码立刻显得很清爽,ComputeWorldSpacePosition实际内容和自己上边写的shader是一致的

Bonus

以上的方法中,用到了UNITY_MATRIX_I_VP这个矩阵,在一些博主写的文章中,用的方式是从C#端将camera的VP逆矩阵传入shader中:

var vpMatrix = Camera.main.projectionMatrix * Camera.main.worldToCameraMatrix;

之后传入vpMatrix.inverse

在shader中使用该矩阵进行重建时,如果代码还按照上边的shader中写,是无法正确还原的。

纠其原因,是因为Camera.main.projectionMatrix * Camera.main.worldToCameraMatrix的逆矩阵并不和UNITY_MATRIX_I_VP一致,UNITY_MATRIX_I_VP是和平台无关的,而Camera相关的矩阵,是和Opengl还是directx等相关的,在opengl的模式下,重建还原代码如下,注意的是sceneRawDepth也进行了*2-1的操作,这是因为opengl的z范围是-1到1。

  1. //fragment shader
  2. float4 frag(v2f i) : SV_Target
  3. {
  4. float sceneRawDepth = SAMPLE_DEPTH_TEXTURE(_CameraDepthTexture, sampler_CameraDepthTexture, i.uv);
  5. #if defined(UNITY_REVERSED_Z)
  6. sceneRawDepth = 1 - sceneRawDepth;
  7. #endif
  8. float4 ndc = float4(i.uv.x * 2 - 1, i.uv.y * 2 - 1, sceneRawDepth * 2 - 1, 1);
  9. float4 worldPos = mul(_InverseVPMatrix, ndc);
  10. worldPos /= worldPos.w;
  11. return worldPos;
  12. }

小结

1.这种方式重建世界坐标,性能比较差,一般来说,我们都是逐顶点地进行矩阵运算,毕竟定点数一般还是比较少的,但是全屏幕逐像素进行矩阵运算,这个计算量就不是一般的大了,性能堪忧。

2.能用Unity提供的API就用其提供的,Unity封装和处理了很多跨平台的情况,比如Z的范围,左手右手坐标系等,自己撸极容易出错。

三.射线方式重建

原理

这种方式的重建,可以参考Secrets of CryENGINE 3 Graphics Technology这个CryTech 2011年的PPT。借用一张图:

 然后偶再画个平面的图:

上图中,A为相机位置,G为空间中我们要重建的一点,那么该点的世界坐标为A(worldPos) + 向量AG,我们要做的就是求得向量AG即可。根据三角形相似的原理,三角形AGH相似于三角形AFC,则得到AH / AC = AG / AF。由于三角形相似就是比例关系,所以我们可以把AH / AC看做01区间的比值,那么AC就相当于远裁剪面距离,即为1,AH就是我们深度图采样后变换到01区间的深度值,即Linear01Depth的结果d。那么,AG = AF * d。所以下一步就是求AF,即求出相机到屏幕空间每个像素点对应的射线方向。

如何获得AF呢,在后处理Shader中,实际上就是绘制了一个Quad,对应整个屏幕。这个Quad的四个边界点刚好对应屏幕的四个边界点,uv是(0,1)区间的,刚好对应屏幕空间,我们通过*2 - 1将其转化到(-1,1)区间就可以得到四个边界对应NDC坐标系下的xy坐标了,在VertexShader中计算出这4个点对应的射线后,将其传入FragmentShader中,通过插值就会自动得到每个像素点对应的AF。

Frament中还原:

  1. //fragment shader
  2. float4 frag(v2f i) : SV_Target
  3. {
  4. float sceneRawDepth = SAMPLE_DEPTH_TEXTURE(_CameraDepthTexture, sampler_CameraDepthTexture, i.uv);
  5. float linear01Depth = Linear01Depth(sceneRawDepth, _ZBufferParams);
  6. float3 worldPos = _WorldSpaceCameraPos.xyz + ( linear01Depth) * i.viewRayWorld ;
  7. return float4(worldPos, 1);
  8. }

VertexShader中计算射线:

方法1

        用ComputeWorldSpacePosition方法,计算四个顶点对应的世界坐标位置,减去摄像机位置后就是所求射线。这种方式还是很好理解的,每个顶点矩阵运算也只有一次,个人感觉是最优方案。

  1. //vertex shader
  2. v2f vert(appdata v)
  3. {
  4. v2f o;
  5. UNITY_SETUP_INSTANCE_ID(v);
  6. UNITY_INITIALIZE_VERTEX_OUTPUT_STEREO(o);
  7. o.positionCS = TransformObjectToHClip(v.positionOS.xyz);
  8. //方法1
  9. float sceneRawDepth = 1;
  10. #if defined(UNITY_REVERSED_Z)
  11. sceneRawDepth = 1 - sceneRawDepth;
  12. #endif
  13. float3 worldPos = ComputeWorldSpacePosition(v.uv, sceneRawDepth, UNITY_MATRIX_I_VP);
  14. o.viewRayWorld = worldPos - _WorldSpaceCameraPos.xyz;
  15. o.uv = v.uv;
  16. return o;
  17. }

方法2

原理和方法1一样,只是先由clip空间转到View空间,再由View空间转到摄像机空间。其中_InverseVMatrix是由C#端传入的Camera.main.worldToCameraMatrix.inverse。

那么为什么不能直接使用Unity中的UNITY_MATRIX_I_V呢,因为后处理Shader中,Unity根本不会为你设置UNITY_MATRIX_I_VP,UNITY_MATRIX_I_VP是单位矩阵。

  1. v2f vert(appdata v)
  2. {
  3. v2f o;
  4. UNITY_SETUP_INSTANCE_ID(v);
  5. UNITY_INITIALIZE_VERTEX_OUTPUT_STEREO(o);
  6. o.positionCS = TransformObjectToHClip(v.positionOS.xyz);
  7. float4 clipPos = ComputeClipSpacePosition(v.uv, 0);
  8. float4 viewPos = mul(UNITY_MATRIX_I_P, clipPos);
  9. viewPos.xyz = viewPos.xyz / viewPos.w;
  10. float3 worldPos = mul(_InverseVMatrix, viewPos).xyz;
  11. o.viewRayWorld = worldPos - _WorldSpaceCameraPos.xyz;
  12. o.uv = v.uv;
  13. return o;
  14. }

方法3

这次我们不求得四个顶点在世界空间中的位置,而是在View空间中,以射线的方式做逆变换,因为在view空间中,camera的位置为0,所以viewpos就是viewRay的方向。射线的逆变换要注意的是,只需要3X3的3维矩阵,要排除掉平移变换的影响,因为射线无论如何平移,都是一样的射线

  1. v2f vert(appdata v)
  2. {
  3. v2f o;
  4. UNITY_SETUP_INSTANCE_ID(v);
  5. UNITY_INITIALIZE_VERTEX_OUTPUT_STEREO(o);
  6. o.positionCS = TransformObjectToHClip(v.positionOS.xyz);
  7. //方法3
  8. float4 clipPos = ComputeClipSpacePosition(v.uv, 0);
  9. float4 viewPos = mul(UNITY_MATRIX_I_P, clipPos);
  10. float3 viewRay = viewPos.xyz / viewPos.w;
  11. o.viewRayWorld = mul((float3x3)_InverseVMatrix, viewRay);
  12. o.uv = v.uv;
  13. return o;
  14. }

最终结果

 无论用那种方式,开关后处理效果,都能发现场景是相同效果,证明重建成功!

完整工程代码

GitHub - Dejavu0709/StudyForShader  中的ReconstructPositionWithDepth文件夹

相关资料:感谢大佬们的无私分享

Reconstruct the world space positions of pixels from the depth texture | Universal RP | 10.5.1

Unity Shader-深度相关知识总结与效果实现(LinearDepth,Reverse Z,世界坐标重建,软粒子,高度雾,运动模糊,扫描线效果)_puppet_master的专栏-CSDN博客_shader深度

使用深度图重建世界坐标_小孔明的专栏-CSDN博客

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
推荐阅读
相关标签
  

闽ICP备14008679号