《精编》某学院时间序列分析与预测教程

第12章时间序列分析与预测 本章我们将介绍几种分析时间序列的方法 这些分析主要是用来描述事物随时间发展变化的规律 并对变量的未来值提供合适的预测 12 1时间序列分析概述 时间序列分析的应用范围十分广泛 可以根据对系统进行观测得到的时间序列数据 用曲线拟合方法对系统进行客观的描述 可以用一个时间序列中的变化去说明另一个时间序列中的变化 从而深入了解给定时间序列产生的机理 还可以根据时间序列模型调整输入变量 以使系统在发展过程中保持在目标值上 即预测到过程要偏离目标时便可进行必要的控制 现在时间序列分析已经用在国民经济宏观控制 区域综合发展规划 企业经营管理 市场潜量预测 气象预报 水文预报 地震前兆预报 农作物病虫灾害预报 环境污染控制 生态平衡 天文学和海洋学等方面 1 时间序列及其分类 时间序列 时间序列是指一个变量的观测值按时间顺序排列而成的序列 它反映了现象动态变化的过程和特点 是研究事物发展趋势 规律以及进行预测的依据 时间序列数据在自然 经济及社会等领域都是很常见的 时间序列的分类 举例说明 表12 1国内生产总值等时间序列 国内生产总值 年末总人口数是绝对数时间序列 其中国内生产总值就是时期序列 年末总人口数是时点序列 第一产业贡献率是相对数时间序列 房屋平均销售价格是平均数时间序列 2 时间序列的组成因素与模型 统计学上 时间序列一般有两种的模型 乘法模型和加法模型 乘法模型 加法模型 12 2平稳时间序列平滑与预测 如果某公司1986到2005的销售额如右图所示 从时间序列图我们的直观印象是长期趋势不明显 我们很难判断出这个序列是否确实存在着长期逐渐向上或逐渐向下的趋势 这时 移动平均法和指数平滑法可以用来对时间序列进行平滑以描述序列的趋势 1 移动平均法 移动平均法是用一组最近的实际数据值来预测时间序列未来值的一种常用方法 它是采用逐项递移的办法分别计算一系列移动的序时平均数 形成一个新的派生序时平均数时间数列 在这个派生的时间数列中 短期的偶然因素引起的变动被削弱 从而呈现出现象在较长时间的基本发展趋势 移动平均法根据预测时使用的各元素的权重不同 可以分为简单移动平均和加权移动平均 一 简单移动平均法简单移动平均法是将最近的N期数据加以平均 作为下一期的预测值 当时间序列的变动趋势为线性时 可以用简单移动平均法进行分析 简单移动平均法对各元素给的权重都相等 简单的移动平均的计算公式如下 式中 N为期数 为t j 1期的实际值 为t 1期的预测值 例12 1 已知某企业1986到2005的20年销售额情况 分别计算3年和7年移动平均趋势值 并作图与原序列比较 解 以3年移动平均为例说明计算步骤 3年移动平均趋势值由一系列3个连续观察值平均得到 第一个3年移动平均趋势值由序列中前5年的观察值相加再除以3得到 依次类推 可得3年移动平均趋势值和7年移动平均趋势值如图12 2所示 在序列中前年和后年都不可能得到移动平均值 所以 以3年移动平均序列为例 序列的前一年和后两一年都是没有移动平均值的 图12 2某公司销售量移动平均趋势值和移动平均趋势图 分析结论如下 从图12 2中观察到 3年移动平均趋势值放在第二项对应的位置上 7年移动平均趋势值放在第4项对应的位置上 同时 看到7年移动平均序列比3年移动平均序列表现的趋势更明显 这是因为它的移动间隔更长 移动间隔越长 可以得到的移动平均值越少 因此 长于7年的移动间隔通常是不可取的 因为在序列的前几项和后几项将失去太多的移动平均值 这可能导致脱离现象发展的真实趋势 二 加权移动平均法加权移动平均的原理是 时间序列过去各期的数据信息对预测未来趋势值的作用是不一样的 除了以N为周期的周期性变化外 远离预测期的观测值的影响力相对较低 故应给予较低的权重 加权移动平均法的计算公式如下 式中 为第t j 1期实际销售额的权重 N为预测的时期数 为t j 1期的实际值 为t 1期的预测值 在运用加权平均法时 权重的选择是一个重要的问题 一般而言 最近期的数据最能预示未来的情况 因而权重应大些 例如 根据前一个月的产量和利润比起根据前几个月能更好地估测下个月的产量和利润 但是 如果数据是季节性的 则权重也应是季节性的 移动平均法存在的一些问题 1 加大移动平均法的期数 即加大N值 会使平滑波动效果更好 但会使预测值对时间序列数据的实际变动更不敏感 2 移动平均值并不总是很好地反映出趋势 由于是平均值 预测值总是停留在过去的水平上 从而不能预测将来的波动性 3 移动平均法还需要有大量过去数据的记录 如果缺少历史数据 移动平均法就无法使用 2 指数平滑法 指数平滑法通过对历史时间数列进行逐层平滑计算 从而消除随机因素的影响 识别经济现象基本变化趋势 并以此预测未来 简单移动平均法是对时间序列过去的近期数据加以同等利用 但不考虑较远期的数据 加权移动平均法给予近期观测值更大的权重 而指数平滑法则不舍弃过去的观测值 但是仅给予逐渐减弱的影响程度 即随着观测期的远离 赋予逐渐收敛为零的权数 指数平滑法的基本公式是 式中 为时间t的平滑值 为时间t 1的实际值 为时间t 1的预测值 为平滑常数 取值范围为 0 1 指数平滑常数取值至关重要 平滑常数决定了平滑水平以及对预测值与实际结果之间差异的响应速度 平滑常数越接近于1 远期实际值对本期平滑值的下降越迅速 平滑常数越接近于0 远期实际值对本期平滑值影响程度的下降越缓慢 由此 当时间序列相对平稳时 可取较大的 当时间序列波动较大时 应取较小的 以不忽略远期实际值的影响 例12 2小汽车租赁预测冬天即将来临 某从事汽车租赁业务的经理着手调查客户对防雪汽车的需求情况 经过监测后 一场初冬的暴风雪席卷了整个地区 正如所料 每天的需求量都有显著增长 这时 想知道第10天应该储备多少辆防雪汽车以备第11天使用 解 取 利用Excel分析的结果如图12 3所示 利用指数平滑法得到汽车租赁需求量在第11天的预测值为16 6辆 图12 3汽车租赁需求量预测值 12 3有趋势序列的最小二乘法预测模型 1 线性趋势模型 在实际应用中 很多时间序列像销售额 进出口额和产品的产量等都近似是一条直线 那么 可以用下面的线性趋势方程来描述 式中 是时间t的预测值 是时间标号 是趋势线在纵轴上的截距 是趋势线的斜率 应用最小二乘法 可得到线形趋势方程中未知参数和的表达式 假定时间序列的中间项为0 这样上述公式可以简化为 例12 3假定某企业1986 2005年20年的销售额序列表如表12 5所示 使用Excel的做直线趋势分析 输出结果如下 从分析结果得直线趋势方程为 直线曲线方程如下所示 可以清楚的观察到一条逐渐向上的直线 其直线回归的调整后的判定系数为0 966 2 二次曲线趋势模型 当时间序列中各观察值发展呈抛物线状态 并且各期发展水平得二次增长量 逐期增长量之差 大致相等时 有二次曲线趋势模型如下所示 同样利用最小二乘法 我们可以得到以下方程组来求得三个未知常数a b c 如将时间序列中间项设为原点 上述公式可以简化 例12 4仍然以上例所示某企业1986 2005年20年的销售额序列进行分析 Excel再一次用于计算以获得二次曲线趋势方程 输出结果如下 由上图输出结果可以看出二次曲线趋势方程为 二次曲线方程如下图所示 明显看出二次曲线趋势模型不如直线趋势模型适合这个时间序列 它调整后的判定系数为0 965 3 指数趋势模型 当时间序列的观察值按照一定的增长率增长或者衰退 则可以考虑配合指数趋势模型 指数趋势模型的一般形式为 为了对这个指数曲线方程求解 我们可将其以两边同时取对数的形式转化为直线方程 然后根据最小二乘法得到未知常数a b 同样 可以取时间序列中间项为原点 方程可简化为 例12 5仍然以例12 3所示某企业1986 2005年20年的销售额序列进行分析 使用Excel用于计算以获得指数趋势方程 输出结果如下 输出结果可得指数趋势方程为 采用对数还原可得到最终的指数趋势方程为 指数曲线方程如下图所示 同二次曲线趋势模型一样 指数曲线趋势模型不如直线趋势模型适合这个时间序列 它调整后的判定系数为0 966 4 使用第一 第二 百分数差异法选择模型 上面我们对表12 5所示某企业1986 2005年20年的销售额序列分别使用了直线趋势模型 二次曲线趋势模型和指数曲线趋势模型 那么 怎么对一个时间序列判断应该使用什么模型呢 除了直观观察法和比较调整后的判定系数外 我们还可以使用第一 第二 百分数差异法选择模型 如果直线趋势模型能完全适用于的一个时间序列 那么这个时间序列的第一差异将相等 也就是说连续观察值之间的差值应该是相等的 即如果二次曲线趋势模型能完全适用于的一个时间序列 那么这个时间序列的第二差异将相等 即 如果指数曲线趋势模型能完全适用于的一个时间序列 那么这个时间序列的百分数差异将相等 即虽说我们不可能期望一个时间序列存在完全适用的模型 但是我们可以考虑使用第一 第二和百分数差异法来选择一个合适的模型 例12 6我们对表12 5所示某企业2000 2005年部分的销售额序列进行第一 第二和百分数差异法分析如表12 6所示 观察表12 6中的数据 发现这个时间序列的第一 第二和百分数差异都不相等 这样 我们在12 4节将介绍另外一个可能更适合这个时间序列的模型 12 4有趋势序列的自回归预测模型 自回归预测模型 AutoregressiveModeling 与上节介绍的指数平滑都是Box Jenkins引入的整合自回归移动平均模型 ARIMA 的特例 通常情况下 时间序列的各期观察值之间必定存在着一定程度的自相关 利用时间序列中各期数据的相关性 通过前期数据计算后期数据或者预测未来 这就是自回归预测模型 自回归预测模型可分为一级自回归模型和二级自回归模型 和n级自回归模型 一般 一级自回归模型为 二级自回归模型为 n级自回归模型为 都是参数 可以用最小二乘法进行参数的估计 用自回归预测模型预测的具体步骤为 1 确定最大滞后值n 而是后面进行回归系数显著性检验 t检验 的自由度 2 形成一系列的滞后时间序列 3 运用Excel给出滞后序列的回归结果 确定自回归方程 4 对模型中最高级别参数进行显著性检验 检验统计量t值由公式如下定义 式中 是回归模型中最高级别参数的假设值是自回归模型中最高级别参数的估计值是的标准离差a 如果零假设被拒绝 那么n级自回归模型适用于时间序列的预测 b 如果不拒绝零假设 那么第n个变量将舍弃 将n 1 重复进行第三步和第四步 5 重复进行第三步和第四步 直到最高级的自回归参数具有统计上的显著性 这个自回归模型将选择用于时间序列的预测 例12 7我们参看例12 3中某企业1986 2005年20年的销售额序列表 数据资料如上节中表12 5所示 步骤一 确定最大滞后值n 3 形成滞后1年 2年 3年的时间序列如图12 10显示 步骤二 运用Excel进行滞后序列的回归 我们使用Excel分析三级自回归模型时 我们选择数据分析中的回归分析 并且在X变量范围里面输入如图所示得D5 F21 在Y变量范围里面输入如图所示得C5 C21 同样的分析二级自回归模型时 在X变量范围里面输入如图所示得D4 E21 在Y变量范围里面输入如图所示得C4 C21 分析一级自回归模型时 在X变量范围里面输入如图所示得D3 D21 在Y变量范围里面输入如图所示得C3 C21 图12 10某企业销售额的一级 二级 三级自回归模型序列 我们从三级自回归模型开始分析选择一个最适合这个时间序列的自回归模型 使用Excel的分析结果如下图所示 根据输出结果 得到三级自回归方程是 步骤三 对 0 006 进行显著性检验了 标准离差我们从图12 11中看到是0 3263 在这个显著性检验中我们首先提出假设 将图12 11的数据结果代入到公式12 24中可以得到t值根据显著性水平 自由度为 查t分布表 得到临界值为 由于或者我们看到 输出结果中P值为0