0%

空间自回归模型

空间自回归(网络自回归)

考虑一组变量 $Y_i (i=1,2,\dots,n)$ 之间是如何影响的,如小学生的学习成绩与他们之间是否是好朋友的关系,
又比如微博的转发量与他们是否是粉丝的关系,再比如各省的 GDP 与地图上是否相邻的关系,再比如各省毕业生的去向与空间是否相邻的关系。

直接的考虑是拿 $Y_i$ 与其他 $Y_j$ 进行回归:

$$
\begin{aligned}
Y_1 &= \beta_{11} Y_{1} + \beta_{12} Y_{2} + \dots + \beta_{1n} Y_{n} + \varepsilon_1 \\
Y_2 &= \beta_{21} Y_{1} + \beta_{22} Y_{2} + \dots + \beta_{2n} Y_{n} + \varepsilon_2 \\
&\dots \\
Y_n &= \beta_{n1} Y_{1} + \beta_{n2} Y_{2} + \dots + \beta_{nn} Y_{n} + \varepsilon_n \\
\end{aligned}
$$

其中 $\beta_{ii} = 0 (i=1,2,\dots,n)$,但是这样的模型具有 $n\times (n-1)$ 个参数,而样本数只有 $n$ 个,故参数不可估计。

有两种方法可以解决参数估计的问题,其一是通过稀疏性假设(假设 $\boldsymbol \beta$ 中大部分参数为 0),其二是参数化(假定参数只与某些较少的参数有关)。

参数化

假定 $\beta_{ij} = f\left (a_{ij}\right)$,$a_{ij}$ 为定性变量,为 1 表示两者有关,为 0 表示两者无关,最简单的形式为 $f = \rho$(常值函数),这样
原来 $n\times (n-1)$ 个参数就转变为了 1 个参数,$\boldsymbol A = (a_{ij})$ 为邻接矩阵。

假设 $\boldsymbol \varepsilon \sim N (0,I\sigma^2)$,原模型可表示为:

$$
\boldsymbol Y = \rho \boldsymbol A \boldsymbol Y + \boldsymbol \varepsilon
$$

但此时对于 $Y_1$ 而言,$Y_1 = \rho (a_{11} Y_{1} + a_{12} Y_{2} + \dots + a_{1n} Y_{n} ) + \varepsilon_1 $,会引起 $Y_1$ 的方差的膨胀。

直观的想法就是对 $\boldsymbol A$ 加权,加权形式有两种,一种是对于行加权,另一种对于列加权,这两种分别代表不同的含义。

  • 行加权:$w_{ij} = \frac {a_{ij}}{ \sum_{j=1}^{n} a_{ij} }$,此时模型 $\boldsymbol Y = \rho \boldsymbol W \boldsymbol Y + \boldsymbol \varepsilon $
    ,此时 $\rho$ 反映伙伴效应(朋友怎么影响自己的,)。
  • 列加权:$w_{ij} = \frac {a_{ij}}{ \sum_{i=1}^{n} a_{ij} }$,此时模型 $\boldsymbol Y = \rho \boldsymbol W \boldsymbol Y + \boldsymbol \varepsilon $
    ,此时 $Y$ 的信息平均分给指向 Ta 的人。

参数的估计方式为极大似然估计,估计的理论性质包括一致性和渐进正态性(…)

模型的延伸

带解释变量的网络自回归模型

原模型只有被解释变量之间的影响,但是对于一个个体而言,其自身的属性也会对其造成影响,故可添加解释变量,即

$$
\boldsymbol Y = \rho \boldsymbol W \boldsymbol Y + \boldsymbol \beta \boldsymbol X + \boldsymbol \varepsilon
$$

其中 $\boldsymbol \beta$ 衡量自身属性的影响。

但是不止自己的属性会对自己产生影响,Ta 的属性可能也会对自己产生影响,即

$$
\boldsymbol Y = \rho \boldsymbol W \boldsymbol Y + \boldsymbol \beta \boldsymbol X + \boldsymbol \alpha \boldsymbol X + \boldsymbol \varepsilon
$$

其中 $\boldsymbol \alpha$ 衡量 Ta 人属性的影响。

参数估计:先固定 $\rho$,运用 OLS 估计 $\boldsymbol \beta$,再利用 MLE 估计 $\rho$,再利用 OLS 估计 $\boldsymbol \beta$,如此往复直至收敛。

每个个体单独的 $\rho$

原模型中只有个体与个体之间的影响假设是相等的 $\rho$,但是实际中这几乎不可能,需要考虑个体的差异,即

$$
Y_i = \sum_{j=1}^{n} \rho w_{ij} Y_{j} + \varepsilon
$$

如何替换这个 $\rho$,有两种方法,一种是替换为 $\rho_j$,另一种是替换为 $\rho_i$,两种方法含义不同。

  • $\rho_j$ 反映第 $j$ 个个体对于 $i$ 的影响强度,此时模型变为 $\boldsymbol Y = \boldsymbol W \boldsymbol \rho_{diag} \boldsymbol Y + \boldsymbol\varepsilon$,
    此时具有 $n$ 个参数仍然不可估计,可运用稀疏性假设或参数化。
    • 参数化:假设 $\rho_j = F (\eta_0 + \eta_1 Z_1 + \dots + \eta_p Z_p)$,即假设与 $Y$ 的属性 $Z_i$ 有关,最简单形式 $F = 1$ 即回归,参数个数从 $n\to p$。
  • $\rho_i$ 反映第 $i$ 个个体的被影响力强度。

带网络效应的误差项

比如:某省新产生了一个新技术,其余省可能引进这种技术。

原模型中的 $\varepsilon$ 可能不满足独立同分布假设,此时对 $\varepsilon$ 进行网络效应即,

$$
\boldsymbol \varepsilon = \boldsymbol \gamma \boldsymbol W \boldsymbol \epsilon + \boldsymbol V
$$

假设 $V \sim N (0,I\sigma^2)$