赞
踩
立体视觉是一种计算机视觉技术,其目的是从两幅或两幅以上的图像中推理出图像中每个像素点的深度信息。
机器人、辅助驾驶/无人驾驶、无人机等等。
立体视觉借鉴了人类双眼的“视差”原理,即左、右眼对于真实世界中某一物体的观测是存在差异的,我们的大脑正是利用了左、右眼的差异,使得我们能够辨识物体的远近。
O 点为相机的光心,π 是摄像头的成像平面。
根据三角形相似定理:
△
P
p
p
′
∼
△
P
O
R
O
T
B
Z
=
p
p
′
Z
−
f
=
B
−
(
X
R
−
W
2
)
−
(
W
2
−
X
T
)
Z
−
f
=
B
+
X
T
−
X
R
Z
−
f
Z
=
B
∗
f
X
R
−
X
T
=
B
∗
f
D
f
是摄像机焦距
D
也就是我们通常所说的视差(
d
i
s
p
a
r
i
t
y
)
\triangle Ppp' \sim \triangle PO_RO_T\\ \frac{B}{Z}=\frac{pp'}{Z-f}=\frac{B-(X_R-\frac{W}{2})-(\frac{W}{2}-X_T)}{Z-f}=\frac{B+X_T-X_R}{Z-f}\\ Z=\frac{B*f}{X_R-X_T}=\frac{B*f}{D}\\ f 是摄像机焦距\\ D 也就是我们通常所说的视差(disparity)
△Ppp′∼△POROTZB=Z−fpp′=Z−fB−(XR−2W)−(2W−XT)=Z−fB+XT−XRZ=XR−XTB∗f=DB∗ff是摄像机焦距D也就是我们通常所说的视差(disparity)
将同一空间物理点在不同图像中的映像点对应起来,这个差别,我们称作视差(Disparity)图像。
Z
=
B
∗
f
X
R
−
X
T
=
B
∗
f
D
Z=\frac{B*f}{X_R-X_T}=\frac{B*f}{D}
Z=XR−XTB∗f=DB∗f
记录学习过程,欢迎讨论交流,尊重原创,转载请注明出处~
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。