《精编》某学院时间序列分析与预测教程

第12章时间序列分析与预测本章我们将介绍几种分析时间序列的方法这些分析主要是用来描述事物随时间发展变化的规律并对变量的未来值提供合适的预测 12 1时间序列分析概述时间序列分析的应用范围十分广泛可以根据对系统进行观测得到的时间序列数据用曲线拟合方法对系统进行客观的描述可以用一个时间序列中的变化去说明另一个时间序列中的变化从而深入了解给定时间序列产生的机理还可以根据时间序列模型调整输入变量以使系统在发展过程中保持在目标值上即预测到过程要偏离目标时便可进行必要的控制现在时间序列分析已经用在国民经济宏观控制区域综合发展规划企业经营管理市场潜量预测气象预报水文预报地震前兆预报农作物病虫灾害预报环境污染控制生态平衡天文学和海洋学等方面 1 时间序列及其分类时间序列时间序列是指一个变量的观测值按时间顺序排列而成的序列它反映了现象动态变化的过程和特点是研究事物发展趋势规律以及进行预测的依据时间序列数据在自然经济及社会等领域都是很常见的时间序列的分类举例说明表12 1国内生产总值等时间序列国内生产总值年末总人口数是绝对数时间序列其中国内生产总值就是时期序列年末总人口数是时点序列第一产业贡献率是相对数时间序列房屋平均销售价格是平均数时间序列 2 时间序列的组成因素与模型统计学上时间序列一般有两种的模型乘法模型和加法模型乘法模型加法模型 12 2平稳时间序列平滑与预测如果某公司1986到2005的销售额如右图所示从时间序列图我们的直观印象是长期趋势不明显我们很难判断出这个序列是否确实存在着长期逐渐向上或逐渐向下的趋势这时移动平均法和指数平滑法可以用来对时间序列进行平滑以描述序列的趋势 1 移动平均法移动平均法是用一组最近的实际数据值来预测时间序列未来值的一种常用方法它是采用逐项递移的办法分别计算一系列移动的序时平均数形成一个新的派生序时平均数时间数列在这个派生的时间数列中短期的偶然因素引起的变动被削弱从而呈现出现象在较长时间的基本发展趋势移动平均法根据预测时使用的各元素的权重不同可以分为简单移动平均和加权移动平均一简单移动平均法简单移动平均法是将最近的N期数据加以平均作为下一期的预测值当时间序列的变动趋势为线性时可以用简单移动平均法进行分析简单移动平均法对各元素给的权重都相等简单的移动平均的计算公式如下式中 N为期数为t j 1期的实际值为t 1期的预测值例12 1 已知某企业1986到2005的20年销售额情况分别计算3年和7年移动平均趋势值并作图与原序列比较解以3年移动平均为例说明计算步骤 3年移动平均趋势值由一系列3个连续观察值平均得到第一个3年移动平均趋势值由序列中前5年的观察值相加再除以3得到依次类推可得3年移动平均趋势值和7年移动平均趋势值如图12 2所示在序列中前年和后年都不可能得到移动平均值所以以3年移动平均序列为例序列的前一年和后两一年都是没有移动平均值的图12 2某公司销售量移动平均趋势值和移动平均趋势图分析结论如下从图12 2中观察到 3年移动平均趋势值放在第二项对应的位置上 7年移动平均趋势值放在第4项对应的位置上同时看到7年移动平均序列比3年移动平均序列表现的趋势更明显这是因为它的移动间隔更长移动间隔越长可以得到的移动平均值越少因此长于7年的移动间隔通常是不可取的因为在序列的前几项和后几项将失去太多的移动平均值这可能导致脱离现象发展的真实趋势二加权移动平均法加权移动平均的原理是时间序列过去各期的数据信息对预测未来趋势值的作用是不一样的除了以N为周期的周期性变化外远离预测期的观测值的影响力相对较低故应给予较低的权重加权移动平均法的计算公式如下式中为第t j 1期实际销售额的权重 N为预测的时期数为t j 1期的实际值为t 1期的预测值在运用加权平均法时权重的选择是一个重要的问题一般而言最近期的数据最能预示未来的情况因而权重应大些例如根据前一个月的产量和利润比起根据前几个月能更好地估测下个月的产量和利润但是如果数据是季节性的则权重也应是季节性的移动平均法存在的一些问题 1 加大移动平均法的期数即加大N值会使平滑波动效果更好但会使预测值对时间序列数据的实际变动更不敏感 2 移动平均值并不总是很好地反映出趋势由于是平均值预测值总是停留在过去的水平上从而不能预测将来的波动性 3 移动平均法还需要有大量过去数据的记录如果缺少历史数据移动平均法就无法使用 2 指数平滑法指数平滑法通过对历史时间数列进行逐层平滑计算从而消除随机因素的影响识别经济现象基本变化趋势并以此预测未来简单移动平均法是对时间序列过去的近期数据加以同等利用但不考虑较远期的数据加权移动平均法给予近期观测值更大的权重而指数平滑法则不舍弃过去的观测值但是仅给予逐渐减弱的影响程度即随着观测期的远离赋予逐渐收敛为零的权数指数平滑法的基本公式是式中为时间t的平滑值为时间t 1的实际值为时间t 1的预测值为平滑常数取值范围为 0 1 指数平滑常数取值至关重要平滑常数决定了平滑水平以及对预测值与实际结果之间差异的响应速度平滑常数越接近于1 远期实际值对本期平滑值的下降越迅速平滑常数越接近于0 远期实际值对本期平滑值影响程度的下降越缓慢由此当时间序列相对平稳时可取较大的当时间序列波动较大时应取较小的以不忽略远期实际值的影响例12 2小汽车租赁预测冬天即将来临某从事汽车租赁业务的经理着手调查客户对防雪汽车的需求情况经过监测后一场初冬的暴风雪席卷了整个地区正如所料每天的需求量都有显著增长这时想知道第10天应该储备多少辆防雪汽车以备第11天使用解取利用Excel分析的结果如图12 3所示利用指数平滑法得到汽车租赁需求量在第11天的预测值为16 6辆图12 3汽车租赁需求量预测值 12 3有趋势序列的最小二乘法预测模型 1 线性趋势模型在实际应用中很多时间序列像销售额进出口额和产品的产量等都近似是一条直线那么可以用下面的线性趋势方程来描述式中是时间t的预测值是时间标号是趋势线在纵轴上的截距是趋势线的斜率应用最小二乘法可得到线形趋势方程中未知参数和的表达式假定时间序列的中间项为0 这样上述公式可以简化为例12 3假定某企业1986 2005年20年的销售额序列表如表12 5所示使用Excel的做直线趋势分析输出结果如下从分析结果得直线趋势方程为直线曲线方程如下所示可以清楚的观察到一条逐渐向上的直线其直线回归的调整后的判定系数为0 966 2 二次曲线趋势模型当时间序列中各观察值发展呈抛物线状态并且各期发展水平得二次增长量逐期增长量之差大致相等时有二次曲线趋势模型如下所示同样利用最小二乘法我们可以得到以下方程组来求得三个未知常数a b c 如将时间序列中间项设为原点上述公式可以简化例12 4仍然以上例所示某企业1986 2005年20年的销售额序列进行分析 Excel再一次用于计算以获得二次曲线趋势方程输出结果如下由上图输出结果可以看出二次曲线趋势方程为二次曲线方程如下图所示明显看出二次曲线趋势模型不如直线趋势模型适合这个时间序列它调整后的判定系数为0 965 3 指数趋势模型当时间序列的观察值按照一定的增长率增长或者衰退则可以考虑配合指数趋势模型指数趋势模型的一般形式为为了对这个指数曲线方程求解我们可将其以两边同时取对数的形式转化为直线方程然后根据最小二乘法得到未知常数a b 同样可以取时间序列中间项为原点方程可简化为例12 5仍然以例12 3所示某企业1986 2005年20年的销售额序列进行分析使用Excel用于计算以获得指数趋势方程输出结果如下输出结果可得指数趋势方程为采用对数还原可得到最终的指数趋势方程为指数曲线方程如下图所示同二次曲线趋势模型一样指数曲线趋势模型不如直线趋势模型适合这个时间序列它调整后的判定系数为0 966 4 使用第一第二百分数差异法选择模型上面我们对表12 5所示某企业1986 2005年20年的销售额序列分别使用了直线趋势模型二次曲线趋势模型和指数曲线趋势模型那么怎么对一个时间序列判断应该使用什么模型呢除了直观观察法和比较调整后的判定系数外我们还可以使用第一第二百分数差异法选择模型如果直线趋势模型能完全适用于的一个时间序列那么这个时间序列的第一差异将相等也就是说连续观察值之间的差值应该是相等的即如果二次曲线趋势模型能完全适用于的一个时间序列那么这个时间序列的第二差异将相等即如果指数曲线趋势模型能完全适用于的一个时间序列那么这个时间序列的百分数差异将相等即虽说我们不可能期望一个时间序列存在完全适用的模型但是我们可以考虑使用第一第二和百分数差异法来选择一个合适的模型例12 6我们对表12 5所示某企业2000 2005年部分的销售额序列进行第一第二和百分数差异法分析如表12 6所示观察表12 6中的数据发现这个时间序列的第一第二和百分数差异都不相等这样我们在12 4节将介绍另外一个可能更适合这个时间序列的模型 12 4有趋势序列的自回归预测模型自回归预测模型 AutoregressiveModeling 与上节介绍的指数平滑都是Box Jenkins引入的整合自回归移动平均模型 ARIMA 的特例通常情况下时间序列的各期观察值之间必定存在着一定程度的自相关利用时间序列中各期数据的相关性通过前期数据计算后期数据或者预测未来这就是自回归预测模型自回归预测模型可分为一级自回归模型和二级自回归模型和n级自回归模型一般一级自回归模型为二级自回归模型为 n级自回归模型为都是参数可以用最小二乘法进行参数的估计用自回归预测模型预测的具体步骤为 1 确定最大滞后值n 而是后面进行回归系数显著性检验 t检验的自由度 2 形成一系列的滞后时间序列 3 运用Excel给出滞后序列的回归结果确定自回归方程 4 对模型中最高级别参数进行显著性检验检验统计量t值由公式如下定义式中是回归模型中最高级别参数的假设值是自回归模型中最高级别参数的估计值是的标准离差a 如果零假设被拒绝那么n级自回归模型适用于时间序列的预测 b 如果不拒绝零假设那么第n个变量将舍弃将n 1 重复进行第三步和第四步 5 重复进行第三步和第四步直到最高级的自回归参数具有统计上的显著性这个自回归模型将选择用于时间序列的预测例12 7我们参看例12 3中某企业1986 2005年20年的销售额序列表数据资料如上节中表12 5所示步骤一确定最大滞后值n 3 形成滞后1年 2年 3年的时间序列如图12 10显示步骤二运用Excel进行滞后序列的回归我们使用Excel分析三级自回归模型时我们选择数据分析中的回归分析并且在X变量范围里面输入如图所示得D5 F21 在Y变量范围里面输入如图所示得C5 C21 同样的分析二级自回归模型时在X变量范围里面输入如图所示得D4 E21 在Y变量范围里面输入如图所示得C4 C21 分析一级自回归模型时在X变量范围里面输入如图所示得D3 D21 在Y变量范围里面输入如图所示得C3 C21 图12 10某企业销售额的一级二级三级自回归模型序列我们从三级自回归模型开始分析选择一个最适合这个时间序列的自回归模型使用Excel的分析结果如下图所示根据输出结果得到三级自回归方程是步骤三对 0 006 进行显著性检验了标准离差我们从图12 11中看到是0 3263 在这个显著性检验中我们首先提出假设将图12 11的数据结果代入到公式12 24中可以得到t值根据显著性水平自由度为查t分布表得到临界值为由于或者我们看到输出结果中P值为0