参
第一章 时间序列分析基础
1. 横截面数据、时间序列数据和面板数据;时间序列数据是指同一个个体的一个或者多个特征在一系列时间观测点上的数据;例如,1980年到2020年全球平均温度指数、上证指数从2000年1月到2021年1月的月收益率、我国经济总量从2001年到2020年的年度数据。 2. 时序图、散点图、密度图、季节图。
3. 序列平稳、非平稳、差分平稳、结构变化、季节性、协整、波动率聚集等。 4. 奇异值检测、缺失值填补、数据转换和数据分解等。
5. 平稳性分为严平稳和弱平稳,参考定义1.1和定义1.2;遍历性刻画的是时间序列数据之间的相依程度随着数据之间时间间隔的增加而逐渐减弱的特征;白噪声是指均值为0、方差有限、且不存在时间维度上的相关性的平稳时间序列,是宽平稳的。
6. 可以使用Pearson相关系数度量变量之间的线性相关性,以及非线性相关系数,例如Spearman秩相关系数和Kendall 𝜏相关系数,来度量变量之间的非线性相关关系。以上度量的共同点在于均为数据之间相依性的度量,并对样本数据得到相应的统计量,进行假设检验;但当时间序列数据之间存在非线性关系时,线性相关度量可能无法反应变量之间的相依性。
7. 白噪声检验可基于样本自相关函数SACF或者𝑄𝐵𝑃、𝑄𝐿𝐵统计量做假设检验。若各阶SACF均落在置信区间内或者𝑄𝐵𝑃、𝑄𝐿𝐵落在拒绝区域外,则接受序列白噪声假设;否则,拒绝白噪声假设。 8. 略。
9. 白噪声模型、滑动平均模型、自回归模型和自回归滑动平均模型。 10.均值预测法、朴素预测法、滑动平均法、指数平滑法和模型预测法。 11.略。
第二章 线性时间序列模型
1. 时间序列𝑟𝑡可以表示成白噪声𝑎𝑡及其滞后项的线性函数,则其为线性时间序列过程;线性序列过程通过白噪声滞后项刻画序列相依性;在现实建模中常基于Box和Jenkins (1976)的思想进行建模,即采用𝐴𝑅𝑀𝐴(𝑝,𝑞)去近似该平稳时间序列。
2. 自回归模型是指时间序列当前观测对其过去观测(滞后项)的回归模型,例如𝑝阶自回归模型:𝑟𝑡=𝜙0+𝜙1𝑟𝑡−1+⋯+𝜙𝑝𝑟𝑡−𝑝+𝑎𝑡 这里𝑎𝑡为白噪声,当方程1−𝜙1𝑧−⋯−𝜙𝑝𝑧𝑝=0的根落在单位圆之外,该自回归过程平稳。 3. (1)是平稳的,因为方程1−0.95𝑧=0的根为1/0.95,在单位圆外。由2.2.1节公式可得,𝐸𝑟𝑡=1−𝜙1,𝜌𝑙=(0.95)𝑙 对𝑙≥1。
𝜙0
1
2𝜎𝑎
=60,𝑉𝑎𝑟(𝑟𝑡)=
=1−𝜙21
40039
2𝜎𝑎,ACF 𝜌0=
(2)不是平稳的,因为方程1−1.05𝑧=0的根在单位圆内。
(3)不是平稳的,因为方程1−0.8𝑧−0.2𝑧2=0的两根为−5和−1,并不在单位圆外,故为非平稳。
(4)是平稳的,因为方程1+0.9𝑧+0.45𝑧2>0当|𝑧|≤1,因此其根在单位圆外。由2.2.2节公式,𝐸𝑟𝑡=1−𝜙
𝜙
2
𝜙0
1−𝜙2
=0,𝑉𝑎𝑟(𝑟𝑡)=
2(1−𝜙2)𝜎𝑎
2](1+𝜙2)[(1−𝜙2)2−𝜙1
≈
12
2.040𝜎𝑎,ACF 𝜌0=1,𝜌1=1−𝜙=−29,当𝑙≥2 ,𝜌𝑙=−0.9𝜌𝑙−1−0.45𝜌𝑙−2。
18
𝑖4. (1)是可逆的,𝑟𝑡+∑∞𝑖=1(−0.95)𝑟𝑡−𝑖=1.95+𝑎𝑡。由2.3.1节公式,𝐸𝑟𝑡=2
3,𝑉𝑎𝑟(𝑟𝑡)=1.9025𝜎𝑎,𝜌0=1,𝜌1≈0.4993,𝜌𝑙=0,𝑙>1。
2
(2)不可逆。由2.3.1节公式,𝐸𝑟𝑡=1,𝑉𝑎𝑟(𝑟𝑡)=2.1025𝜎𝑎,𝜌0=1,𝜌1≈0.4994,𝜌𝑙=0,𝑙>1。
(3)是可逆的。假设𝑎𝑡=𝑟𝑡+∑∞𝑖=1𝑏𝑖𝑟𝑡−𝑖,由于𝑎𝑡+0.8𝑎𝑡−1+0.2𝑎𝑡−2=𝑟𝑡,根据等式两边对应项系数相等,可得𝑎1=−0.8,𝑎2=0.44,𝑎𝑙=−0.8𝑎𝑙−1−
2
0.2𝑎𝑙−2,𝑙≥3。由2.3.2节公式,𝐸𝑟𝑡=0,𝑉𝑎𝑟(𝑟𝑡)=1.68𝜎𝑎,𝜌0=1,𝜌1=
3
−21,𝜌2=42,𝜌𝑙=0,𝑙>2。
(4)不是可逆的,因为1−0.9𝑧−0.45𝑧2=0的一个根在单位圆内。由
2
2.3.2节公式,𝐸𝑟𝑡=0,𝑉𝑎𝑟(𝑟𝑡)=2.0125𝜎𝑎, 𝜌0=1,𝜌1≈−0.2460,𝜌2=−0.2236,𝜌𝑙=0,𝑙>2。
5. (1)由公式(2.8)可计算得𝜙11=𝜌1=0.95,𝜙𝑘𝑘=0,𝑘≥2。
0
125
𝜌
(2)是非平稳的,无法计算PACF。 (3)是非平稳的,无法计算PACF。
(4)由公式(2.8)可得𝜙11=𝜌=−29,𝜙22=
0
𝜌1
18
2−𝜌𝜌𝜌1022−𝜌2𝜌10
=−0.45,𝜙𝑘𝑘=
0,𝑘≥3。
6. 由于对于MA序列,PACF并无截尾性质,其数值可根据(2.8)式以及第4题中得到的ACF进行计算。在本题中我们只计算1-阶和2-阶偏自相关系数作为示例。 (1) 𝜙11=𝜌=0.4993,𝜙22=
0
𝜌1𝜌1
0
2−𝜌𝜌𝜌1022−𝜌2𝜌10
=−0.3321。 =−0.3323。
(2) 𝜙11=𝜌=0.4994,𝜙22=(3) 𝜙11=𝜌=−21,𝜙22=
0
2−𝜌𝜌𝜌1022−𝜌2𝜌10
𝜌1𝜌1
0
12
2−𝜌𝜌𝜌1022−𝜌2𝜌10
=−0.3081。
=−0.3024。
(4) 𝜙11=𝜌=−0.20,𝜙22=
2−𝜌𝜌𝜌1022−𝜌2𝜌10
7. (1)序列自相关系数关于阶数的变化的函数即为自相关函数,记为ACF;
(2)序列𝑟𝑡关于𝑟𝑡−1,…,𝑟𝑡−𝑘的线性投影中,最后一个解释变量𝑟𝑡−𝑘前的系数𝜙𝑘𝑘被称为𝑟𝑡的𝑘-阶偏自相关系数。序列偏自相关系数关于阶数变化的函数
即为偏自相关函数,记为PACF;
(3)EACF指拓展的自相关系数,用于ARMA模型的定阶;
(4)信息选择法是选择最优的阶数以平衡模型的拟合优度和模型的复杂度; (5)模型诊断通常指通过检验模型的误差是否符合模型的基本假设来实现的定阶方法。 8. 略。
第三章 单位根时间序列模型
1. 对于1阶自回归过程,(1−𝜌𝐵)𝑦𝑡=𝜙0+𝑢𝑡,当𝜌=1,该过程即为单位根过程。
2. 利用最小二乘得到𝜌的估计𝜌̂,平稳过程、单位根过程和爆炸过程的极限分布为教材中(3.2)、(3.3)和(3.4)式。从收敛速度来看,平稳过程的估计量收敛速度最慢为𝑂𝑝(𝑇),单位根过程的估计量收敛速度其次,为𝑂𝑝(𝑇),
√11
爆炸过程的估计量收敛速度最快,为𝑂𝑝(𝜌−𝑇)。从极限分布来看,平稳过程估计量极限分布为正态分布,单位根过程极限分布为随机积分,爆炸过程极限分布为柯西分布。
3. 首先判断该𝐴𝑅(1)过程属于平稳过程、单位根过程还是爆炸过程。对该过程执行情形1下的Dickey-Fuller检验。当𝑝值处于(0.05,0.95)之间时,接受原假设认为该过程为单位根过程,当𝑝值大于0.95,拒绝原假设,同时接受该过程为爆炸过程;当𝑝值小于0.05,拒绝原假设,同时接受该过程为平稳过程。对该序列所属过程进行判断后,便可根据其对应的极限分布的分位数构造置信区间。平稳过程和爆炸过程的极限分布(3.2)和(3.4)式存在冗余参数𝜌,在构造置信区间的过程中可以使用其相合估计量𝜌̂替代,单位根过程极限分布(3.3)式的分位数,可以通过查询DF检验在情形1下的分位数表得到。
4. (1)我们可以得到FCLT(functional central limit theorem):
𝑦[𝑇𝑡]𝑑
→σ𝑊(𝑡), √𝑇在Skorohord空间𝒟[0,1]下成立。因此我们可以写为积分形式:
𝑇
𝑇
2
𝑇−2∑𝑦𝑡−1=𝑇−1∑(𝑦𝑡−1/√𝑇)=∫(𝑦[𝑇𝑡]/√𝑇)𝑑𝑡.
𝑡=11
𝑡=1
0
2
1
2
由于FCLT和∫0(⋅)2𝑑𝑡是Skorohord空间𝒟[0,1]中的连续泛函,根据连续映射定理,我们有
∫(𝑦[𝑇𝑡]/√𝑇)𝑑𝑡→σ2∫[𝑊(𝑡)]2𝑑𝑡.
0
0
1
2
𝑑
1
(2)我们有
𝑇𝑇
𝑇−1∑𝑦𝑡−1𝑢𝑡=𝑇−1∑(𝑦𝑡−1+𝑦𝑡−𝑦𝑡)(𝑦𝑡−𝑦𝑡−1)
𝑡=1
𝑡=1
𝑇
22
=𝑇−1(𝑦𝑇− 𝑦0−∑𝑦𝑡𝑢𝑡)
𝑡=1
𝑇𝑇2
由于∑𝑇𝑡=1𝑦𝑡𝑢𝑡=∑𝑡=1𝑦𝑡−1𝑢𝑡+∑𝑡=1𝑢𝑡,我们有
𝑇
𝑇
𝑇−1∑𝑦𝑡−1𝑢𝑡=
𝑡=1
𝑑
𝑝
1−12
22
𝑇(𝑦𝑇−𝑦0−∑𝑢𝑡), 2𝑡=1
𝑝
222
因为𝑦𝑇/√𝑇→σ𝑊(𝑡)、𝑦0/𝑇→0以及大数率𝑇−1∑𝑇𝑡=1𝑢𝑡→σ,我们可得
2
σ
𝑇−1∑𝑦𝑡−1𝑢𝑡→{[𝑊(1)]2−1}.
2𝑑
𝑡=1𝑇
5. 由书中(3.1)式,我们只需分析1√𝑇𝑇2∑𝑇𝑡=1𝑦𝑡−1𝑢𝑡和1/𝑇∑𝑡=1𝑦𝑡−1的极限性质
σ2
𝑖2
即可。易证𝑦𝑡服从正态分布,方差为(∑𝑡−1𝑖=0ρ)σ,且其方差的极限为1−ρ2,
由于
𝑇
2
𝑇
𝑇
22
𝐸[𝑇−1∑𝑦𝑡−𝐸𝑦𝑡]≤𝐶𝑇−2∑∑ρ2(𝑗−𝑖)=𝑂(𝑇−1),
𝑡=1
𝑝
𝑖=1𝑗=𝑖+1
σ2
这里𝐶为与ρ和σ有关但与𝑇无关的常数。根据切比雪夫不等式,我们可以得
22−1∑𝑇2
到𝑇−1∑𝑇𝑡=1(𝑦𝑡−𝐸𝑦𝑡)→0。由于我们有𝑇𝑡=1𝐸𝑦𝑡→1−ρ2,故
2
σ2
𝑇−1∑𝑦𝑡→.
1−ρ2𝑝
𝑡=1𝑇
为了证明1/√𝑇∑𝑇𝑡=1𝑦𝑡−1𝑢𝑡证明以下两个式子
𝑇
→𝑁(0,1−ρ2),根据鞅的中心极限定理我们只需
𝑑
σ4
4𝑝1σ22
∑𝑦𝑡−1𝑢𝑡→, (1) 𝑇1−ρ2𝑡=1
1/√𝑇𝑚𝑎𝑥|𝑦𝑡−1𝑢𝑡|=𝑜𝑝(1). (2)
1≤𝑡≤𝑇
(1)的证明可以用与上面完全相似的步骤去证。对于(2)式,易证序列𝑦𝑡 几乎处处收敛到一个正态分布,故(2)式等价于1/√𝑇𝑚𝑎𝑥|𝑢𝑡|=𝑜𝑝(1)。由
1≤𝑡≤𝑇
于
𝑇
4
𝑃(1/√𝑇𝑚𝑎𝑥|𝑢𝑡|≥δ)≤δ−2𝑇−2∑𝐸𝑢𝑡=𝑂(𝑇−1),
1≤𝑡≤𝑇
𝑡=1
故(2)式成立。因此根据Slutsky定理,我们便可以完成最终证明。另外一种证明思路见Hamilton(1994,pp.216),(8.2.30)式。 6. 该证明较为繁琐,具体细节请参考White (1958)。
7. 首先,如果有一个比较明确的生成数据的过程和需要检验的假设,那么则可以确定需要选择的情形。其次,如果没有明确的上述指引,一般的原则是:选择一个模型和数据生成的设定,使他们在原假设和备择假设下都能够比较合理地刻画数据的主要特征。特别地,如果数据呈现出明显的时间趋势,则要考虑采用情形4;否则考虑采用情形2。 8. 略。
第四章 非线性时间序列模型
1. 例如门限自回归模型,其特征为根据门限变量划分区制,在各个区制中均是线性自回归结构,但不同区制中,自回归模型参数取值不同;平滑转化模型,其特征为解决了SETAR模型不同区制中参数取值离散的问题;马尔科夫转换模型,根据潜在变量划分区制,且潜在变量由一个马尔科夫链驱动。
2. 检验非线性的方法,包括参数方法和非参数方法。参数非线性检验,包括RESET检验、门限检验。非参数模型设定检验,典型的有基于L2距离的检验和基于条件均值距离的检验。
3. 核函数𝑘(⋅):𝑅𝑞→𝑅,又被成为权重函数,满足∫𝑘(𝑥)𝑑𝑥=1。常用的一元核函数包括:(i)均匀核函数:𝑘0(𝑥)=2𝐼(𝑥∈(−1,1));(ii)Epanechnikov核函数:𝑘1(𝑥)=4(1−𝑥2)𝐼(𝑥∈(−1,1));(iii)Gaussian核函数:𝑘𝜙(𝑥)=
1√3
1
𝑒𝑥𝑝(−
2𝜋𝑥22
)。
−
1
4+𝑞, 𝐺𝑎𝑢𝑠𝑠𝑖𝑎𝑛
4. 第一种方法是大拇指法,即取
̂𝑜𝑝𝑡={1.06𝑠𝑇1h
−
2.34𝑠𝑇4+𝑞, 𝐸𝑝𝑎𝑛𝑒𝑐ℎ𝑛𝑖𝑘𝑜𝑣
其中𝑠为𝑥𝑡的样本标准差,𝑇为样本容量,𝑞为𝑥𝑡的维度。第二种方法是交
1𝑇
̂()()∑[𝑦−叉验证的方法,即ℎ=𝑎𝑟𝑔𝑚𝑖𝑛𝐶𝑉ℎ,这里𝐶𝑉ℎ=𝑐𝑣𝑇𝑗=1𝑗
ℎ∈𝐻
̂ℎ,−𝑗(𝑥𝑗)]2𝑊(𝑥𝑗),这里𝑓̂ℎ,−𝑗(𝑥𝑗)=1∑𝑡≠𝑗𝑤𝑡(𝑥𝑗)𝑦𝑡,𝑊(𝑥𝑗)是对预测平𝑓
𝑇−1
方误差加总时用到的权重函数。
5. 筛分估计是一类将函数在全局近似而得到估计的方法的总称,依赖于函数的近似逼近理论,假设未知函数落在一个函数空间,且该函数空间具有一组基函数{ℎ𝑗(𝑥)}𝑗=0,则𝑓(𝑥)=∑𝑗=0𝑐𝑗ℎ𝑗(𝑥)。常用的筛分空间有多项式空间、三角多项式空间、样条空间、埃尔米特多项式空间。阶通过广义交叉验证方法来选取,假设未知函数𝑚阶可导,对0<𝑎<𝑏<∞,0<𝑑<𝑐<2(𝑚+1),定义𝒩𝒯={𝑝𝑇,𝑝𝑇+1,…,𝑞𝑇},这里𝑝𝑇=[𝑎𝑇𝑑],𝑞𝑇=[𝑏𝑇𝑐]。选取𝑘使得
1
∞
∞
𝑘𝐺𝐶𝑉
σ2(𝑘)̂
=𝑎𝑟𝑔𝑖𝑛𝑓, 2[]1−𝑘/𝑇𝑘∈𝒩𝒯
1
̂𝑘(𝑥𝑡)}2。 这里σ̂2(𝑘)=𝑇∑𝑇𝑡=1{𝑦𝑡−𝑓
6. 例如可加模型𝑦𝑡=𝑓(𝑥𝑡)+𝑎𝑡=𝑔1(𝑥𝑡)+⋯+𝑔𝑙(𝑥𝑙𝑡)+𝑎𝑡,这里𝑥𝑡=
(𝑥1𝑡,…,𝑥𝑙𝑡)′,针对该模型的估计方法有迭代拟合(backfitting)估计法和边际积分(marginal integration)估计法。 7. 可以使用基于L2距离的检验,其检验统计量为
𝐼𝑇,𝐻𝑀(ℎ)=𝑇ℎℎ
这里
∑𝑇𝑡=1𝐾ℎ(𝑥−𝑥𝑡)𝑦𝑡
𝑚̂ℎ(𝑥)=𝑇,
∑𝑡=1𝐾ℎ(𝑥−𝑥𝑡)𝑚̃θ̂(𝑥)=
∑𝑇𝑡=1𝐾ℎ(𝑥−𝑥𝑡)𝑚θ̂(𝑥𝑡)
∑𝑇𝑡=1𝐾ℎ(𝑥−𝑥𝑡).
𝑑/2
2
∫{𝑚̂(𝑥)−𝑚̃θ̂(𝑥)}𝑤(𝑥)𝑑𝑥.
̂为原假设下θ0的一个√𝑇-相合估计量。 其中θ
此外,还可使用基于条件均值距离的检验,该统计量为
1
𝐼𝑇(ℎ)=∑∑𝑒̂𝑠𝑒̂𝑡𝐾ℎ(𝑥𝑠,𝑥𝑡).
𝑇(𝑇−1)𝑠=1𝑡=1,𝑡≠𝑠𝑇
𝑇
经过标准化,可采用下述统计量进行检验:
𝐽𝑇=
其中
𝑑2ℎ222(σ2=̂∑∑𝑒̂𝑠𝑒̂𝑡𝐾ℎ𝑥𝑠,𝑥𝑡). ()𝑇𝑇−1𝑠=1𝑡=1,𝑡≠𝑠𝑇
𝑇
𝑇ℎ𝑑/2𝐼𝑇(ℎ)√𝜎̂2→𝑁(0,1).
𝑑
此外可以通过自助抽样的方法,避免检验结果对窗宽参数敏感的问题。
8. 略。
第五章 协整时间序列模型
1.(1)虚假回归是指:两个的单位根过程在线性回归中发现存在显著相关性的现象。
(2)虚假回归的显著特征有:
①t值很大且呈现统计上的显著性; ②回归的𝑅2很大,非常接近于1;
③回归的残差存在较强的序列相依性,接近单位根过程(Durbin-Watson统计量接近0)。
2.(1)协整的定义是:一个𝑛×1向量时间序列𝑦𝑡是协整的,当它的每一个子序列都是单位根过程,且存在非零的向量𝑎𝜖𝑅𝑛,使得线性组合𝑎T𝑦𝑡是一个平稳过程;此时,𝑎被称为协整向量。
(2)协整的误差修正表示是:假设𝑦𝑡为p阶自回归模型:
𝑦𝑡=𝛼+Φ1𝑦𝑡−1+Φ2𝑦𝑡−2+⋯+Φ𝑝𝑦𝑡−𝑝+𝜀𝑡=Φ(𝐵)𝑦𝑡=𝛼+𝜀𝑡. 假设∆𝑦𝑡存在Wold分解
(1−𝐵)𝑦𝑡=𝛿+𝜓(𝐿)𝜀𝑡.
如果𝑦𝑡中存在ℎ个协整关系,则可以证明: ① Φ(1)𝛿=0,Φ(1)𝜓(1)=0;
② 存在一个𝑛×ℎ的矩阵B,使得Φ(1)=𝑩𝑨𝑇,其中𝑨𝑇中的行构成协整向量空间的基。 可等价表述为:
𝑦𝑡=𝜁1𝛥𝑦𝑡−1+𝜁2𝛥𝑦𝑡−2+⋯+𝜁𝑝−1𝛥𝑦𝑡−𝑝+1+𝛼+𝜌𝑦𝑡−1+𝜀𝑡, 其中𝜁𝑠=−[Φ𝑠+1+⋯+Φ𝑝], 𝜌≡Φ1+⋯+Φ𝑝。 同时有:
𝛥𝑦𝑡=𝜁1𝛥𝑦𝑡−1+𝜁2𝛥𝑦𝑡−2+⋯+𝜁𝑝−1𝛥𝑦𝑡−𝑝+1+𝛼+𝜁0𝑦𝑡−1+𝜀𝑡, 其中𝜁0≡𝜌−I𝑛=−[I𝑛−Φ1−⋯−Φ𝑝]=−Φ(1)。 若𝑦𝑡包含ℎ个协整关系,则有
𝛥𝑦𝑡=𝜁1𝛥𝑦𝑡−1+𝜁2𝛥𝑦𝑡−2+⋯+𝜁𝑝−1𝛥𝑦𝑡−𝑝+1+𝛼−𝑩𝑧𝑡−1+𝜀𝑡.
其中,𝑧𝑡≡𝑨𝑇𝑦𝑡为平稳协整变量。
(3)在数据分析中,误差修正表示可以刻画长期均衡(协整关系)对短期波动(差分序列)的影响。
3.(1)虚假回归中回归系数的估计不相合,随着样本量的增加收敛到一个随机变量; t检验统计量以√𝑇的速度随样本量T增加发散到无穷。
(2)协整回归中回归系数的估计是超相合的,t检验统计量是非标准分布的。 (3)忽视分布的差异会导致在假设检验时使用错误的极限理论而得出错误的结论。
4.对变量𝑦𝑡和𝑥𝑡, 考虑以下平衡回归模型
𝑦𝑡= 𝛼+𝛽𝑥𝑡+𝛾𝑦𝑡−1+𝛿𝑥𝑡−1+𝑢𝑡,
检验𝛽是否为零,为零是虚假回归,否则是协整回归。 5.(1)采用最小二乘估计法估计回归方程
𝑦1𝑡= 𝛼+𝛾2𝑦2𝑡+𝑢𝑡,
再利用得到的残差𝑢̂𝑡来构造单位根检验统计量。 (2)采用最小二乘估计法估计回归方程
𝑦1𝑡= 𝛼+𝛾2𝑦2𝑡+𝛾3𝑦3𝑡+⋯+𝛾𝑛𝑦𝑛𝑡+𝑢𝑡,
再利用得到的残差𝑢̂𝑡来构造单位根检验统计量。 (3)对ℎ= 1,2,⋯考虑检验
𝐻0:𝑦𝑡中存在h个协整关系; 𝐻𝐴1:𝑦𝑡中存在n个协整关系。
构造似然比检验的迹统计量进行检验。
6.①对向量𝑦𝑡中的每一个序列进行单位根检验;
②针对给定向量𝑎,对序列𝑧𝑡=𝑎𝑇𝑦𝑡进行单位根检验。若不存在单位根,则协整向量为𝑎。 7.略。 8.对
𝑦𝑡=𝑚(𝑥𝑡)+𝑒𝑡,𝑡=1,2,⋯,𝑇,
考虑:
𝐻0:𝑚(𝑥)=𝑚𝜃0(𝑥),对∀𝑥∈𝑅𝑑,𝜃0∈𝛩 𝐻1:𝑚(𝑥)=𝑚𝜃1(𝑥)+𝐶𝑇𝛥(𝑥),𝜃1∈𝛩;
采用Wang 和Phillips(2012) 考虑的经典模型设定检验统计量
𝑇
𝑇
𝑆𝑇=∑∑𝑒̂𝑠𝑒̂𝑡𝐾ℎ(𝑥𝑠,𝑥𝑡)
𝑠=1𝑡=1,𝑡≠𝑠
进行检验。 9.对
𝑦𝑡=𝑓(𝑥𝑡,𝜃)+𝑢𝑡,
采用非线性最小二乘估计量
̂=𝑎𝑟𝑔𝑚𝑖𝑛∑[𝑦𝑡−𝑓(𝑥𝑡,𝜃)]2。 𝜃
第六章 波动率模型
1.
222𝑢𝑡=𝛼0+𝛼1𝑢𝑡−1+⋯+𝛼𝑚𝑢𝑡−𝑚+𝑤𝑡,
2
其中𝑤𝑡是白噪声,且E(𝑤𝑡)= 𝜆2,
满足上述过程的白噪声𝑢𝑡被称为ARCH(m)过程。 易见:
22|22
𝐸(𝑢𝑡𝑢𝑡−1,⋯)=𝛼0+𝛼1𝑢𝑡−1+⋯+𝛼𝑚𝑢𝑡−𝑚。
2.考虑均值回归
𝑇
𝑦𝑡=𝑥𝑡𝛽+𝑢𝑡,
其中解释变量𝑥𝑡可以包含𝑦𝑡的滞后项。对均值回归采用OLS估计,得到残差估
2
计量𝑢̂𝑡。再将𝑢̂𝑡对它的m个滞后变量回归:
222
𝑢̂𝑡=𝛼0+𝛼1𝑢̂𝑡−1+⋯+𝛼𝑚𝑢̂𝑡−𝑚+𝑒𝑡,
在上述回归中检验𝐻0:𝛼1=⋯=𝛼𝑚=0,若𝐻0被拒绝,则𝑦𝑡具有ARCH效应;否则,不存在ARCH效应。
3.在确定均值回归模型之后,将均值回归模型拟合得到的残差进行ARCH建模,估计并检验ARCH效应是否存在;若存在,则采用PACF或者Ljung-Box检验来确定ARCH模型的阶m。
4.可以采用信息准则(AIC,BIC)的方法确定GARCH模型的阶数。 5.略。 6.略。
第七章 时间序列的机器学习方法
1.(1)支持向量回归是对于时间序列样本{𝑦𝑡,𝑥𝑡}𝑇𝑡=1,考虑
𝑦𝑡=𝑓(𝑥𝑡)+𝑒𝑡,
𝑥𝑡可以包含𝑦𝑡的滞后项和其他可以用来预测的解释变量,𝑓(𝑥)=𝑤𝑇𝑥+𝑏,𝑤和𝑏为待确定的模型参数。定义𝜖-不敏感损失函数为
0,若|𝑒|≤𝜖;
𝑙𝜖(𝑒)={
|𝑒|−𝜖,其他。
支持向量回归的目标函数为:
𝑇
𝑚𝑖𝑛𝑤,𝑏∑𝑙𝜖(𝑦𝑡−𝑤𝑇𝑥𝑡+𝑏)+
𝑡=1𝑇
1𝑇
𝑤𝑤, 2𝜆其中,𝜆为正则化参数,𝑤𝑤为𝑤的𝑙2范数。
(2)最小二乘基于平方损失函数,只有当准确预测时,损失才会为零;而支持向量回归基于𝜖-不敏感损失函数,可以容忍存在一个较小的𝜖偏差。 2.在非线性SVR中,采用核函数𝑘(·,·),可以将未知函数近似表示为
𝑇
𝑓(𝑥𝑡)=∑𝛼𝑡𝑘(𝑥𝑡,𝑥𝑠)+𝑏=𝐾𝑡𝛼+𝑏。
𝑠=1
常用的核函数有:线性核、多项式核、高斯核、拉普拉斯核、Sigmoid核。 3.(1)分类回归树是利用分类树的思想,把𝑥𝑡 取值的区域递归地分成两个子区域𝑅1(𝑥,𝑠)={𝑥|𝑥≤𝑠}和𝑅2(𝑥,𝑠)={𝑥|𝑥>𝑠},并确定每个区域上对𝑦的预测值,进而对每个子区域重复这个过程,直到某种停止条件满足。 (2) ①遍历𝑗=1,⋯,𝑝,求解最优切分变量j和切分点s使得 𝑚𝑖𝑛𝑗,𝑠[𝑚𝑖𝑛𝑐1∑𝑥𝑡∈𝑅1(𝑥,𝑠)(𝑦𝑡−𝑐1)2+𝑚𝑖𝑛𝑐2∑𝑥𝑡∈𝑅2(𝑥,𝑠)(𝑦𝑡−𝑐2)2]. ②计算在上述最优(𝑗,𝑠)下的区域划分及每个区域的预测
𝑅1(𝑥,𝑠)={𝑥|𝑥(𝑗)≤𝑠},𝑅2(𝑥,𝑠)={𝑥|𝑥(𝑗)>𝑠},
𝑐̂𝑚=𝑎𝑣𝑔(𝑦𝑡|𝑥𝑡∈𝑅𝑚),𝑚=1,2.
③ 继续对上述区域采用①-②步进行切分,直至停止条件满足。 ④ 将③步所得的区域记为𝑅1,⋯,𝑅𝑚,计算得到的回归树
̂(𝑥)=∑𝑓
𝑀𝑚=1
𝑐̂𝑚1(𝑥∈𝑅𝑚).
4.满足停止条件时,切分所得的区域个数即为回归树中的枝数。
5.(1)𝐾均值聚类是在给定聚类个数𝐾后,采用欧氏距离的平方作为相似度度量,将观测数据分到各个类的方法。首先,给定每一类的中心位置𝑐𝑘,将每一个观测值分到离它最近的类。其次,再重新计算每一类数据的均值,作为新的中心位置𝑐𝑘。将上述两个步骤迭代,即可求得聚类问题的局部最优解。 (2)分层聚类不用设定聚类数目𝐾,从每一个数据开始寻找最近的数据邻居,形成聚类,随后层层往上聚类,形成一个树状图,最终再确定聚类数目。 (3)𝐾均值聚类需要提前指定聚类数目K,而分层聚类无需设定聚类数目。 6.可以通过信息准则(AIC, BIC)的方法确定聚类分析中类的个数。
第八章 时间序列的深度学习预测
1.多层感知器的信息由输入层输入,从输出层输出,中间层被称之为隐藏层。各个自变量通过输入层的神经元输入到网络。输入层的各个神经元和第一层隐藏层的各个神经元连接,每一层隐藏层的各个神经元又同下一层的各个神经元连接。输入层的自变量通过各个隐藏层的神经元进行信息转换后,在输出层输出最终的预测值𝑦̂𝑡。在隐藏层,信息通过线性函数进行组合,然后通过S型激活函数处理加工;在输出层,信息经过线性函数组合后,通过和预测变量类型相匹配的激活函数进行变换。
2.激活函数的选择根据预测变量𝑦的类型来决定,如:若𝑦为连续变量,则采用恒等变换𝑓(𝑢)=𝑢。 3.(1)卷积的目的是降维,它是将卷积核在输入矩阵上进行滑动,不同的卷积核可以提取出来数据的不同特征。
(2)汇聚的目的是为了对数据进行进一步降维。
(3)卷积层中的卷积核需要由所需提取的特征来确定,卷积层可以看成是部分连接的隐藏层,连接的权重可以当作参数进行估计;而汇聚层只包含求局部最大或平均,没有待估参数。
4.据通用近似定理,一个具有足够多的简单循环隐藏单元的神经网络可以足够准确地近似任意一个非线性函数。因此,可以将简单循环网络连接到前馈网络,以解决所有近似可计算的预测问题。
5.①简单循环单元网络无法将数据的长时记忆传递到对未来数据的预测中去,而长短期记忆网络和门控循环单元网络可以。②与简单循环单元网络相比,长短期记忆网络加入了隐藏状态,单元状态和门控机制。③门控循环单元网络,是一种比长短期记忆网络更加简单的循环神经网络,它不引入额外的记忆单元,而只是引入一个更新门来控制当前状态需要从历史状态中保留多少信息,以及需要从候选状态中接受多少新信息。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo0.cn 版权所有 湘ICP备2023017654号-2
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务