0%

时间序列

时间序列分析主要是挖掘时间序列内在统计特性和动态变化规律,以下是对时间序列分析入门的基础介绍。

时间序列的简介

区别于截面数据,时间序列是特殊的随机过程,都是一系列随机变量的序列,时间序列将指标集取为时间 $t$。

传统的时间序列分析
将时间序列分解为长期趋势(T)、季节变动(S)、循环变动(C)和随机变动(N),通过确定的函数(加法模型、乘法模型)表示。
现代的时间序列分析

  • 描述性的时间序列分析:通过直接绘图观察,发现其中蕴含的规律。
  • 频域分析方法:假设任意无趋势的时间序列可以分解成若干不同频率的周期波动,分析方法复杂。
  • 时域分析方法:寻找时间序列不同时间点的相关关系,分析方法简单完善。后面部分都是时序分析方法。

时序分析方法

时序分析方法可用一个表达式表示:
$$
Y_t = f\left(Y_{t-1},Y_{t-2},\cdots,Y_0\right) + \epsilon_t
$$
其中,

  • 对于 $Y_t$ 分为单变量和多变量,对于单变量有 AR、MA、ARMA、ARIMA 模型,对于多变量有 VAR、ECM、Cointegration (协整) 模型。
  • 对于 $f$ 分为线性和非线性。
  • 对于 $\epsilon$ 的方差可分为同方差和异方差,异方差有 ARCH、GARCH 模型。

AR、MA、ARMA、ARIMA 模型为单变量线性同方差模型。

时间序列基本概念

由于时间序列在每一个时间点上都是一个随机变量的观察,故以下特征均为关于时间的函数。

均值、方差都属于随机变量的二阶矩,为什么不研究更高的矩呢?

原因在于一个随机变量的所有信息由它的分布决定,而分布很大程度上由低阶矩决定,比如正态分布完全由一二阶矩决定,而随着阶数的增加,矩的信息在减少,直观的解释为 $E (X^k) = \int x^k・p (x) \mathrm {d} x$ 当 $x$ 很小时无足轻重,所以更高阶的矩实质刻画的是分布尾部的一点点信息。

均值函数

$$
u_t = E(X_t)
$$

方差函数

$$
\sigma_t^2 = \mathcal{VAR}(X_t)
$$

自协方差函数

$$
\gamma\left(s,t\right) = Cov\left(X_s,X_t\right)
$$

自相关系数

$$
\rho\left(s,t\right) = Cor\left(X_s,X_t\right)
$$

偏自相关系数

$$
\phi\left(s,t\right) = Cor\left(X_s,X_t | X_s , X_{s+1},\dots,X_{t-1} \right)
$$

平稳性

  • 严平稳
    $X_n$ 为时间序列,$\forall n,\forall \tau$,下面成立
    $$
    F\left(X_1,X_2,\dots,X_n\right) = F\left(X_{1+\tau},X_{2+\tau},\dots,X_{n+\tau}\right)
    $$
    特别地,取 $n=1$,那么任意时间点变量服从相同的分布。
  • 宽平稳
    $X_n$ 为宽平稳,则需要满足:
    1. 均值函数 $u_t$ 为常数;
    2. 方差函数 $\sigma_t^2$ 有界;
    3. 自协方差函数 $\gamma\left (s,t\right)$ 只与时间差 $s-t$ 有关,与时间点无关。

严平稳不一定是宽平稳,比如柯西分布没有矩;宽平稳也不一定是严平稳,可以找出不同的分布来凑条件。

AR 模型

$AR\left (p\right)$ 模型,时间序列 ${ X_t }$ 可分解为:
$$
X_t = \varphi_1 X_{t-1} + \varphi_2 X_{t-2} + \dots + \varphi_p X_{t-p} + \epsilon_t
$$
其中,

  • $\varphi_p \neq 0$
  • $\epsilon_t \sim WN\left(0,\sigma_{\epsilon}^2\right)$
  • $E\left(X_k , \epsilon_t \right) = 0 , \forall k < t$