赞
踩
Edit by Linhao Cui
参考 James LeSage(2014) , Paul Elhost (2018), Luc Anselin (1988), Qiang Chen(2014)
主要来源于对LeSage(2014)的整理学习,图表利用GeoDa软件制作,例子数据为Anselin的哥伦比亚地区的犯罪数据。仅供大家学习交流使用,禁止转载。如有侵权请联系撤回。
空间计量经济学的核心定义在于空间依赖关系,空间计量实际上就是一种空间依赖。空间依赖直观上的理解就是个体之间的相关性,正如时间序列上的序列相关,只不过时间序列中是一种前向关联,是单向的;而空间计量的关联是相互的。
正式的:
一个区域称之为一个空间单元;如果一个空间单位的观察值 i i i ,依赖于邻近空间单元的观察值 j j j ,那么称为两个空间单元之间存在空间依赖关系。
以Anselin 在Geoda软件中提供的哥伦比亚地区犯罪数据为例:分位数地图显示了相关变量的集聚。
用数学表示:
一个普通的截面随机抽样数据:
y
i
=
X
i
β
+
ξ
i
ξ
i
∼
N
(
0
,
σ
2
)
ξ
∼
N
(
0
,
σ
2
I
n
)
y_i=X_i \beta + \xi_i \\ \xi_i \sim N(0, \sigma^2) \\ \xi \sim N(0, \sigma^2I_n)
yi=Xiβ+ξiξi∼N(0,σ2)ξ∼N(0,σ2In)
两个空间单元
i
,
j
i, j
i,j 存在空间依赖的表达式:
y
i
=
α
i
y
j
+
X
i
β
+
ξ
i
ξ
i
∼
N
(
0
,
σ
2
)
y
j
=
α
j
y
i
+
X
j
β
+
ξ
j
ξ
j
∼
N
(
0
,
σ
2
)
y_i = \alpha_i y_j + X_i \beta + \xi_i \ \ \ \ \xi_i \sim N(0,\sigma^2) \\ y_j = \alpha_j y_i + X_j \beta + \xi_j \ \ \ \ \xi_j \sim N(0,\sigma^2)
yi=αiyj+Xiβ+ξi ξi∼N(0,σ2)yj=αjyi+Xjβ+ξj ξj∼N(0,σ2)
首先需要引入空间权重矩阵的概念
空间权重矩阵为反映空间近邻关系的稀疏矩阵式,两个空间单位如果存在紧邻关系则对应元素为1,否则为0。
依靠空间权重矩阵的概念,可以将观察值
j
j
j 之外的其他空间单元的观察值的线性组合表示出来即:
∑
i
=
1
n
w
i
j
y
i
\sum_{i=1}^n w_{ij} y_i
i=1∑nwijyi
莫兰散点图即绘制了任意空间观察值和其对应的其他观察值的线性组合的关系。
如图所示,横轴为 i i i 地区的犯罪观察值,纵轴为其他地区的犯罪观察值的线性组合 W y Wy Wy 。莫兰散点图反映了两者之间的关系,也就是一个空间单元的观察值和其周边地区观察值的空间依赖关系,莫兰散点图的集聚和分布代表了空间依赖关系的方向,高点和高点、低点和低点的集聚代表着存在正向的空间依赖,高点和低点的集聚代表存在着负向的空间依赖。
全局莫兰指数是所有点的空间依赖程度的测度,具体表达式为:
M
o
r
a
n
′
s
I
=
n
s
o
⋅
∑
i
∑
j
w
i
j
(
x
i
−
x
ˉ
)
(
y
i
−
y
ˉ
)
∑
(
x
i
−
x
ˉ
)
2
Moran's \ \ I =\frac n {s_o} \cdot \frac {\sum_i \sum_j w_{ij} (x_i - \bar x) (y_i- \bar y)} { \sum(x_i - \bar x)^2 }
Moran′s I=son⋅∑(xi−xˉ)2∑i∑jwij(xi−xˉ)(yi−yˉ)
其中:
S
o
=
∑
i
∑
j
w
i
j
S_o = \sum_i \sum_j w_{ij}
So=i∑j∑wij
对全局莫兰指数的理解:
将全局莫兰指数的公式变形为:
I
=
∑
i
∑
j
w
i
j
(
x
i
−
x
ˉ
)
(
y
j
−
y
ˉ
)
∑
i
∑
j
w
i
j
/
∑
(
x
i
−
x
ˉ
)
2
n
I= \frac {\sum_i \sum_j w_{ij}(x_i- \bar x)(y_j - \bar y)} {\sum_i \sum_j w_{ij}} / {\frac {\sum (x_i - \bar x)^2} {n} }
I=∑i∑jwij∑i∑jwij(xi−xˉ)(yj−yˉ)/n∑(xi−xˉ)2
莫兰指数的分子的分式代表了地理上的临近关系,即地理单元之间的偏差乘以空间权重之和,表示为地理上的位置×空间单元属性值偏差。分母的分式代表了统计上的相关关系,即方差。
莫兰指数的取值范围为(-1,1)之间,注意如果空间权重矩阵没有经过标准化处理则很可能处于该区间以外。由于莫兰指数为样本数据计算的统计指标,因此需要对显著性进行检验:
Z
=
I
−
E
(
I
)
V
a
r
(
I
)
Z= \frac {I - E(I)} {Var(I)}
Z=Var(I)I−E(I)
该图为GeoDa绘制的关于全局莫兰指数的显著性检验,检验结果由999次蒙特卡洛模拟给出。
在哥伦比亚地区的犯罪这一例子中莫兰指数的P值为0.001,表示空间差异是显著的。
局部莫兰指数是对每一个点的空间差异都计算一个相应的指数。其具体的表达式为:
I
i
=
Z
i
∑
i
j
w
i
j
z
j
其
中
z
i
=
y
i
−
y
ˉ
I_i = Z_i \sum_{ij} w_{ij} z_j \\ 其中z_i = y_i - \bar y
Ii=Ziij∑wijzj其中zi=yi−yˉ
值得注意的是,莫兰散点图中的横纵坐标的乘积即为局部莫兰指数:
局部莫兰指数的统计检验仍然和全局莫兰指数一致,仍然为值减去期望除于方差。将局部莫兰指数通过显著性检验的地理单元绘制在图上即为LISA聚集图。
空间自回归过程
假设有三个样本点
i
,
j
,
k
i,j,k
i,j,k ,如果存在空间依赖关系,则三个点之间的空间自回归过程为:
y
i
=
α
i
j
y
j
+
α
i
k
y
k
+
X
i
β
+
ξ
i
ξ
i
∼
N
(
0
,
σ
2
)
y
j
=
α
j
i
y
i
+
α
j
k
y
k
+
X
j
β
+
ξ
j
ξ
j
∼
N
(
0
,
σ
2
)
y
k
=
α
k
i
y
i
+
α
k
j
y
j
+
X
k
β
+
ξ
k
ξ
k
∼
N
(
0
,
σ
2
)
y_i = \alpha_{ij}y_j + \alpha_{ik}y_k + X_i \beta + \xi_i \ \ \ \xi_i \sim N(0,\sigma^2) \\ y_j = \alpha_{ji}y_i + \alpha_{jk}y_k + X_j \beta + \xi_j \ \ \ \xi_j \sim N(0,\sigma^2)\\ y_k = \alpha_{ki}y_i + \alpha_{kj}y_j + X_k \beta + \xi_k \ \ \ \xi_k \sim N(0,\sigma^2)
yi=αijyj+αikyk+Xiβ+ξi ξi∼N(0,σ2)yj=αjiyi+αjkyk+Xjβ+ξj ξj∼N(0,σ2)yk=αkiyi+αkjyj+Xkβ+ξk ξk∼N(0,σ2)
因此,如果按照这样的逻辑,将会产生
n
2
−
n
n^2-n
n2−n 个空间参数,在只有n个样本点的条件下无法估计所有的空间参数,也即出现了过度参数化的问题。为了避免这一问题的出现,采用了人为设定空间权重矩阵的方式。
y
i
=
ρ
∑
w
i
j
y
j
+
ξ
i
ξ
i
∼
N
(
0
,
σ
2
)
y_i= \rho \sum w_{ij} y_j + \xi_i \ \ \ \ \xi_i \sim N(0,\sigma^2)
yi=ρ∑wijyj+ξi ξi∼N(0,σ2)
其中
∑
w
i
j
y
j
\sum w_{ij}y_j
∑wijyj 称为空间滞后项,此时为一个标量,代表来自邻近地区观察值的一个线性组合。
矩阵形式表示为:
Y
=
ρ
W
Y
+
ξ
ξ
∼
N
(
0
,
σ
2
I
n
)
Y = \rho WY + \xi \ \ \ \ \ \ \xi \sim N(0,\sigma^2 I_n)
Y=ρWY+ξ ξ∼N(0,σ2In)
其中,标量参数 $\rho $ 代表了空间依赖的强度,
ρ
\rho
ρ 的正负代表了空间依赖的方向。
根据观察值的均值情况,可以选择是否带有截距项。或者是省略截距项的情况(前提是带有自变量向量,比如设定Z=[
ι
n
\iota_n
ιn X WX ] ,
δ
\delta
δ = [
α
,
β
,
θ
\alpha, \beta, \theta
α,β,θ], 这样就可以把原来的 $Y= \alpha \iota_n + \rho WY + X \beta + WX \theta + \xi $ 表示为
Y
=
ρ
W
Y
+
Z
δ
+
ξ
Y = \rho WY +Z\delta + \xi
Y=ρWY+Zδ+ξ。)
Y
=
α
ι
n
+
ρ
W
Y
+
ξ
Y= \alpha \iota_n + \rho WY + \xi
Y=αιn+ρWY+ξ
其中 σ 2 I n \sigma^2 I_n σ2In 即为随机误差项的方差-协方差矩阵。
标量参数 ρ \rho ρ 代表了空间依赖的强度。
将这样的空间自回归过程写为数据生成过程的形式:
Y
=
(
I
n
−
ρ
W
)
−
1
α
ι
n
+
(
I
n
−
ρ
W
)
−
1
ξ
ξ
∼
N
(
0
,
σ
2
I
n
)
(DGP)
Y= (I_n - \rho W)^{-1} \alpha \iota_n + (I_n - \rho W)^{-1} \xi \ \ \ \ \ \xi \sim N(0,\sigma^2 I_n) \ \ \ \tag {DGP}
Y=(In−ρW)−1αιn+(In−ρW)−1ξ ξ∼N(0,σ2In) (DGP)
这样的数据生成过程可以表述为:
每一个空间单元的观察值 y i y_i yi 的期望值都取决于均值 α \alpha α 和空间依赖参数 ρ \rho ρ 所度量的临近观察值的线性组合。
这样的数据生成过程也反映了空间数据的同期性
(
I
n
−
ρ
W
)
−
1
=
I
n
+
ρ
W
+
ρ
2
W
2
+
ρ
3
W
3
+
…
…
(I_n - \rho W)^{-1} = I_n+ \rho W + \rho^2 W^2 + \rho^3 W^3 + ……
(In−ρW)−1=In+ρW+ρ2W2+ρ3W3+……
一个一阶临近的空间权重矩阵将会导致高阶的空间近邻,即对角线上的非0元素。(对角线为0的对称矩阵的偶次幂的对角线元素一定为非0的元素)。
Y t = ρ W Y t − 1 + X β + ξ t Y_t = \rho WY_{t-1} + X \beta +\xi_t Yt=ρWYt−1+Xβ+ξt
很多不可观测的因素,(不同于面板数据的非观测效应,这里的不可观测的因素主要是依赖于其他空间单元的不可观测因素)难以使用解释变量捕捉。
假设:
Y
=
X
β
+
Z
θ
Y = X\beta + Z \theta
Y=Xβ+Zθ
如果这里的Z代表不可观测的因素,假设Z与X无关,那么
β
\beta
β 仍然可以被一致估计。此时,
Z
θ
Z\theta
Zθ 起到的是干扰项的作用。
相当于:
Y
=
X
β
+
ξ
Y = X\beta + \xi
Y=Xβ+ξ
这一策略等价于:
Z
=
ρ
W
Z
+
r
=
(
I
n
−
ρ
W
)
−
1
r
,
r
∼
N
(
0
,
σ
r
2
I
n
)
Z= \rho WZ + r =(I_n - \rho W)^{-1}r \ \ \ ,\ \ r \sim N(0,\sigma_r^2I_n)
Z=ρWZ+r=(In−ρW)−1r , r∼N(0,σr2In)
这一表达式表示非观测因素并无不合理之处,带回原式:
Y
=
X
β
+
(
I
n
−
ρ
W
)
−
1
r
θ
Y = X\beta + (I_n - \rho W)^{-1} r \theta
Y=Xβ+(In−ρW)−1rθ
令:$ u = r\theta $ 则:
Y
=
X
β
+
(
I
n
−
ρ
W
)
−
1
u
⟺
Y
=
ρ
W
Y
+
(
I
n
−
ρ
W
)
X
β
+
u
u
∼
N
(
0
,
θ
σ
2
I
n
)
Y = X\beta + (I_n - \rho W)^{-1}u \\ \iff \\ Y=\rho WY + (I_n - \rho W)X\beta + u \ \ \ u \sim N(0,\theta \sigma^2I_n)
Y=Xβ+(In−ρW)−1u⟺Y=ρWY+(In−ρW)Xβ+u u∼N(0,θσ2In)
但是回顾X与Z不相关这一假设并不合理,为此可以具体化X与Z的关系,这里即X与u的关系
假设
u
=
X
γ
+
v
v
∼
N
(
0
,
σ
2
I
n
)
u = X\gamma + v \ \ \ \ \ \ v \sim N(0,\sigma^2I_n)
u=Xγ+v v∼N(0,σ2In)
那么代入原式:
Y
=
X
β
+
(
I
n
−
ρ
W
)
−
1
(
X
γ
+
v
)
⟹
Y
=
ρ
W
y
+
X
(
β
+
γ
)
+
W
X
(
−
ρ
β
)
+
v
Y = X\beta + (I_n - \rho W)^{-1}(X\gamma + v) \\ \implies Y = \rho Wy + X(\beta + \gamma) + WX(-\rho \beta) +v
Y=Xβ+(In−ρW)−1(Xγ+v)⟹Y=ρWy+X(β+γ)+WX(−ρβ)+v
令 $-\rho \beta = \theta $
Y
=
ρ
W
Y
+
X
(
β
+
γ
)
+
W
X
θ
+
v
Y=\rho WY + X(\beta + \gamma) + WX\theta + v
Y=ρWY+X(β+γ)+WXθ+v
即空间杜宾模型(SDM)
不同空间个体存在不同的个体效应即空间异质性(注意,空间异质性不同于空间差别),通常建立每一个个体具有独立截距的模型:
Y
=
α
+
X
β
这
里
α
代
表
不
同
个
体
的
不
同
截
距
。
Y = \alpha + X\beta \ \ \ 这里\alpha代表不同个体的不同截距。
Y=α+Xβ 这里α代表不同个体的不同截距。
为了表示空间异质性的影响因素的存在,
α
\alpha
α 可以表示成一个空间结构的随机效应向量。
α
=
ρ
W
α
+
ξ
α
=
(
I
n
−
ρ
W
)
−
1
ξ
\alpha = \rho W \alpha + \xi \\ \alpha = (I_n - \rho W)^{-1}\xi
α=ρWα+ξα=(In−ρW)−1ξ
如果
α
\alpha
α 与 X 独立,则可以表示成空间误差模型(SEM)的形式:
Y
=
X
β
+
(
I
n
−
ρ
W
)
−
1
ξ
(SEM)
Y = X\beta + (I_n - \rho W)^{-1} \xi \ \ \ \ \tag {SEM}
Y=Xβ+(In−ρW)−1ξ (SEM)
如果
α
\alpha
α 和 X 相关,仍然可以把这种关系假设为线性形式:
α
=
ρ
W
α
+
X
γ
+
v
v
∼
N
(
0
,
σ
2
I
n
)
⟹
α
=
(
I
n
−
ρ
W
)
−
1
X
γ
+
(
I
n
−
ρ
W
)
−
1
v
\alpha = \rho W \alpha + X \gamma + v \ \ \ \ \ v \sim N(0,\sigma^2I_n) \\ \implies \alpha= (I_n - \rho W)^{-1}X \gamma + (I_n- \rho W)^{-1}v
α=ρWα+Xγ+v v∼N(0,σ2In)⟹α=(In−ρW)−1Xγ+(In−ρW)−1v
带回到原式:
Y
=
X
β
+
(
I
n
−
ρ
W
)
−
1
(
X
γ
+
v
)
Y
=
ρ
W
Y
+
X
(
β
+
γ
)
+
W
X
(
−
ρ
β
)
+
v
令
θ
=
−
ρ
β
Y
=
ρ
W
Y
+
X
(
β
+
γ
)
+
W
X
θ
+
v
v
∼
N
(
0
,
σ
2
I
n
)
Y= X\beta + (I_n - \rho W)^{-1}(X\gamma + v) \\ Y= \rho WY + X(\beta + \gamma) + WX(-\rho \beta) +v \\ 令 \ \ \theta= -\rho \beta \\ Y = \rho WY + X(\beta+\gamma) + WX\theta +v \\ v \sim N(0,\sigma^2 I_n)
Y=Xβ+(In−ρW)−1(Xγ+v)Y=ρWY+X(β+γ)+WX(−ρβ)+v令 θ=−ρβY=ρWY+X(β+γ)+WXθ+vv∼N(0,σ2In)
即空间杜宾模型(SDM)
比如LeSage 的例子中,房价的决定因素和周边地区的房屋特征有关,
Y
=
α
W
Y
+
X
β
+
W
X
θ
+
ξ
(SLX)
Y= \alpha WY + X\beta + WX\theta + \xi \ \ \ \ \tag {SLX}
Y=αWY+Xβ+WXθ+ξ (SLX)
a= -\rho \beta \
Y = \rho WY + X(\beta+\gamma) + WX\theta +v \
v \sim N(0,\sigma^2 I_n)
$$
即空间杜宾模型(SDM)
比如LeSage 的例子中,房价的决定因素和周边地区的房屋特征有关,
Y
=
α
W
Y
+
X
β
+
W
X
θ
+
ξ
(SLX)
Y= \alpha WY + X\beta + WX\theta + \xi \ \ \ \ \tag {SLX}
Y=αWY+Xβ+WXθ+ξ (SLX)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。