第10周是几个月?
这个问题很有意思,我们一般不讨论周和月这样的周期,而是讨论周月年这些更长的周期。之所以这么做是因为时间越长,趋势就越稳定,参考性就越高。 当然如果你问的是第10周还是第9个月?这种问题其实已经含有答案了,选择第10周显然更合理一些;但如果你问的是“这一周是第几周?”那就得具体问题了。 如果问题是“这一周是第几周?”那么答案就是这周是新的一周,所以是第53周。但如果问题是“第10周是几个月?”那答案是4个月。 为什么两种问题的答案不一样呢? 因为时间和空间有关联但不能完全对应,时间的单位是周期而不是连续的。比如一周有7天,但一个月却有4个星期。如果从一年的角度计算的话,每7天算一个循环(一星期又叫做一礼拜),如此一年可以被分割成52个循环;而每个月都有4个周日,因此全年共有256个周日。也就是说,一年被分割成256个时间单元——这就是日历的基础。
因为一年的时间长度是稳定的,所以以年为单位的时间序列也是稳定可测的;反之就不成立,比如一天的时间长度虽然可以被精确测量到秒,但一天的时间长度在一年里却是有长有短的。这就是为什么时间序列分析中需要先对数据进行加权处理的原因所在。 对周进行加权处理方式比较简单,就是把每周七天等分成若干部分,每一部分代表一天的含义,然后根据这部分开始与结束的时刻来计算加权系数。如果将一周看成是由7个同等长度的一天组成的,那么每天占本周的比例就等于每天24小时占周一到周日比例的一半,即1/7。以此类推,每月4周的加权方式就相当于把每月第一天到最后一天等分成两部分,每一部分代表该月的意思,然后根据这两部分的开始与结束的时刻来计算加权系数。
由于每一天的开始和结束时刻都是整数,所以在计算加权系数时只能取整。对于四舍五入留下的余数,我采用如下规则来处理:如果余数为正,则直接加到下一时间单元;如果是负值,就把其绝对值加到最前面那个时间单元上。这样处理的目的是为了使各个时间单元的长度尽可能接近。 我这里采用的加权公式为 T_{i+1}=T_i\pm \Delta 其中\tau 为加权系数,\tau <1,T_i表示在第i时间段内的观测值,\pm 表示取正值或负值,而\Delta 的确定可以参考上文中的加权处理方法。