罗戈网
搜  索
登陆成功

登陆成功

积分  

预测案例1:渠道业务

[罗戈导读]预测案例1:渠道业务

预测,是供应链绕不开的话题。其复杂性和难度,在所有供应链问题中可谓“首屈一指”。

同时,预测,又是统计分析里内容最为繁杂的。你甚至可以认为,整个统计分析理论,就是以预测为唯一目标的。

从本篇起,我们就来看看,供应链可以如何面对预测问题。

(按照本号开篇谈及的方法论,每个案例将分为三个部分。首先是从技术方向审题,其次是从现实方向审题,最后是关于实用方案的总结。)

**************************************************************************

案例1:

已知过去四年的销售数据如下:

我们是否可以搭建合适模型,用于预测未来?

**************************************************************************

技术方向的讨论:

连续4年48个月的销售数据,数据按照时间顺序展开……并不意外,就像大多数供应链预测问题一样,这是个时间序列分析问题。

对于时间序列分析,我们首先需要回答的第一个问题是:这是不是个平稳序列?

(知识点:时间序列分为两类,即,平稳序列、非平稳序列。                 所谓“平稳序列”,也即序列中只有随机波动。

                 所谓“非平稳序列”,是指序列中包含着趋势、季节性、周期性等一种或者多种成分。当然,                        随机波动,也一样可以存在于“非平稳序列”之中。)

顾名思义,如果我们面前是个“平稳序列”,那么我们甚至可以说,这种序列是不需要“预测”的。因为,该序列本身的均值、方差等特征就已经足够描述未来了。

如何确认是否是平稳序列呢?

按照统计学语言,这是个“假设检验”,这个问题可以重新表述为:这个序列是否满足“平稳序列”的假设?--按照定义我们知道,平稳序列,应该是围绕着均值而随机波动的序列。

(统计假设的检验方法其实很多。我们这里仅推荐两种简单易用并且在Excel里非常容易实现的方式:        1、相关性分析。两个序列之间的统计相关性,值范围[-1,1],>0.7为强正相关,<-0.7为强负相关。Excel函数CORREL。

        2、RMSE剩余标准差分析。先计算预测序列相对于原始序列的剩余标准差,然后以其相对于序列均值的比值来判定。要求该比值低于15%)

原序列的均值为808,“平稳序列”假设的涵义是,该数列每一个值都是围绕均值808波动的。因此,假定的“平稳序列”即为均值序列:                       {808,808,808,808,……,808,808}  

这里直接进入计算结果和结论。后面的“非平稳序列”分析中将详细说明计算过程。

********************************************************************************

计算结果:相关性结果为-3.18918E-16,基本上等于0,完全不相关。                 剩余标准差分析结果得到比值32%,未通过。

       结论:该序列不是“平稳序列”

********************************************************************************

既然不是“平稳序列”,那就意味着序列中应当含有趋势、季节性、周期性等成分。我们现在需要做的,是第二个问题:求解该序列中的趋势性、季节性和周期性。

首先,该序列的“季节性”。

自相关分析,可以清楚地揭示时间序列的季节性,尤其是季节周期的长度。

(知识点:所谓“自相关分析”,是指序列自身的相关性。

                具体涵义是:原序列是从第1个数据开始的,如果我们剔除掉最前面的n-1个数据,

                      就得到了从第n个数据(n>1)开始的新序列,这个新序列与原序列的相关性,

                      就称之为原数列的第n阶自相关系数。)

对于48个值的原始序列,这里计算了1~36阶自相关系数,如下表所示。

可以很清晰地看到,在第12、24、36阶,自相关系数明显提高到0.7左右的水平。这就清晰地告诉我们,原始序列具有明显的“季节性”,并且这种季节性表现为年度正相关关系。也即,每年12个月的走势都具有相似性,正所谓“年年月月花相似”。

***下表展示了实际计算过程,注意隐去了中间的一大部分列和行。主要的计算公式在单元格"B2","C3"(公式可以下拉自动填充至“C36”)和"A3"(公式可以下拉自动填充至“A36”)。A列的计算结果即为1~36阶自相关系数。

其次,该序列的“趋势性”。

趋势性,描述的是时间序列季节性之上的增长趋势,也即,每一个季节周期,对上一个季节周期的增长趋势。

由于已经查明原始序列的季节周期为年(12个月),因此,这里的趋势性其实就是年度增长趋势。简单计算结果如下表:

连续三年的增长率为8%,40%,19%。年均增长率22%。

正常接下来我们就应该分析这个年度增长趋势了。但是很遗憾,对于本序列,这个分析没啥意义。因为样本数据量只有3个,我们只能简单估计年度增长期望值为22%,而这个期望值的均方差高达59%。

这意味着:我们只能预测年度增长为22%,并且我们很清楚知道这个预测基本等同于拍脑袋。(所以,放弃吧少年 ^_^)

当然,这也并不意味着我们没办法处理“趋势性”。我们只是需要更多的数据才能处理这类趋势性问题,以及,我们或许需要查找其背后逻辑相关的宏观经济数据然后通过建模分析来解释或者描述原始序列中的趋势性。

最后,该序列的“周期性”。

周期性,也就是时间序列的循环波动,是时间序列所呈现的围绕长期趋势的一种波浪形或震荡式波动。通常,周期性是由商业和经济活动引起的,不同于趋势变动也不同于季节变动,而是一种涨落相间的交替波动,其变动周期多在一年以上并且周期长短不一。

所以,我们几乎不可能从前述4年数据中求得“周期性”。当然,除非是5~10年及以上尺度的供应链规划问题,否则我们也完全不需要介入这个问题。

********************************************************************************

讨论结果:该时间序列具有明显的以12个月为周期的“季节性”。                 该时间序列的趋势性为持续正增长,但增长率可预测性差。

********************************************************************************

正儿八经讲了半天,说实话我都累。

其实,真实工作没这么复杂,图形观察通常是最简易快捷通向结论的。请看下图:

看着这个图,所谓的“12个月周期的季节性”是不是显而易见呢?(除了相对特殊的Y2)

所以,现实中,大多情况下你只需要直接检验各年度序列之间的相关性即可。

前文洋洋洒洒千言,您只需要作为知识背景了解一下即可,或者,以备不时之需——如果很悲催你所面对的不是年度季节性序列,那么你就照葫芦画瓢从头开始来一遍好了……

我们已经完成了对案例1的定性解答,但是,实际工作总是要求我们给出定量工具的。

所以,第三个问题:如何构建定量模型来支持未来预测?

基于前述定性讨论,我们知道,定量预测未来所需要的参数包括:(1)年度增长趋势值(期望值22%,误差可能很大);(2)12个月各自的季节趋势值。

对于季节趋势值,简单粗暴的计算方式如下:

也即,我们的时间序列预测模型将长成下面的样子:

     Y(t) M(n) = Y(o) * (1 + Year Growth Rate) ^(t-o) * Season Factor(n)

      这里的o表示基准年份,t 表示待预测年份,第t年;n表示待预测月份,n=1~12。        Y(o)表示基准年份的年度总和,Y(t) M(n)表示第t年的第n月的预测值。

 可以看到,它不同于所有应用统计学书上能够看到的乘法或者加法模型。但这不是重点,毕竟乘法或者加法都是表述方式而已。重点在于,搭出来的模型,是否是统计意义上可用的?

最后一个问题:模型的检验。

前文提及了两种统计检验的简单方法:相关性分析、剩余标准差分析。

但是首先,我们得依据预测模型生成预测序列,或者说,拟合序列。如下表:

请注意,这里忽略了明知道误差很大的年度增长趋势值,改采用了真实值。这么做的原因,会在下篇文章中解释。

1、相关性分析计算过程如图:

***下表展示了实际计算过程,注意隐去了中间的一大部分行。主要的计算公式在单元格"B4",即相关系数

2、剩余标准差分析

计算过程如图:

***下表展示了实际计算过程,预测偏差即为对应预测值与原始序列值的差,预测方差为预测偏差的平方。      RMSE剩余标准差,计算公式=SQRT(SUM(C31:N34)/(48-2))。这里,C31:N34即为48个预测偏差的平方,“48-2”的含义是序列数48减去自由度2。这里的“减2”是计算剩余标准差是必须的。

      RMSE/ave,即“剩余标准差 / 均值”,结果是个比值。判定标准为“<15%”

********************************************************************************

计算结果:相关性结果为0.945,远大于0.7,预测模型与原始序列高度相关。                 剩余标准差分析结果得到比值10%,通过,该模型拟合度可以接受。

       结论:(在不考虑年度增长预测误差的前提下,)该定量预测模型可接受

********************************************************************************

技术方向讨论的总结:

案例1所提供的时间序列,为非平稳序列,有着明显的以12个月为周期的季节性。

即便基于最简单的移动平均法的季节因子定量模型,模型的拟合程度也是可以接受的。

(本篇完)

下一篇我们将继续从现实方向讨论案例1。

从“知其然”到“知其所以然”,我们就能够理解,本篇技术方向讨论中以“或繁或简甚至有些随心所欲地”调用不同统计学技术的原因所在。

下周日再见~~

免责声明:罗戈网对转载、分享、陈述、观点、图片、视频保持中立,目的仅在于传递更多信息,版权归原作者。如无意中侵犯了您的版权,请第一时间联系,核实后,我们将立即更正或删除有关内容,谢谢!
上一篇:【物流】解码:社区团购供应链还有多少降本空间?
下一篇:预测案例2:有限客户/行业
罗戈订阅
周报
1元 2元 5元 10元

感谢您的打赏

登录后才能发表评论

登录

相关文章

2025-01-25
2025-01-24
2025-01-24
2025-01-24
2025-01-24
2025-01-23
活动/直播 更多

2.22北京【线下公开课】仓储精细化管理:从混乱到有序

  • 时间:2025-02-22 ~ 2025-02-23
  • 主办方:冯银川
  • 协办方:罗戈网

¥:2580.0元起

报告 更多

2024年12月物流行业月报-个人版

  • 作者:罗戈研究

¥:9.9元