如何计算婴儿百岁?
这个“怎么计算”的问题,问住我了。 我是学统计的,但是我的专业里是没有涉及到统计软件的课程。我自己的软件操作能力,也是基本停留在Excel的水平。我并没有办法像某些大佬一样通过R语言或者SPSS完成对数据进行深度分析。 我只能基于我现有的知识储备,来谈一谈我对这个问题浅显的看法。如果各位有更好的想法或意见,欢迎随时指正(跪谢)~
我们首先要明确一点,在统计中所谓的“样本”和“总体”的概念。简单点儿说就是,先假设一个样本,然后再用这个样本的数据去近似估计总体的情况。 也就是说,对于1000个婴儿从出生到百岁的数据而言,这1000个婴儿就是一个样本;而所有未出生的婴儿,就是我们的总体了。
但是我们不可能去直接收集所有未出生的婴儿的数据,这是很不现实的事情。因此我们就需要运用推理的方法,让样本的数据去接近总体的情况。这样,我们的研究才有意义。否则,就只是一堆毫无用处的数字而已。 所以接下来就要谈到推算了。推断主要包括两个方面的内容:数据的推断和模型的构建。
数据的推断是比较容易理解的,无非就是利用已知的样本数据去拟合未知总体的情况。而模型的构建相对较难,我们需要基于已有的知识,搭建一个可以用于描述总体情况(未出生婴儿情况)的模式,然后利用数据对模型进行参数估计,进而得到各个参数所代表的具体含义(不同年龄阶段的婴儿死亡率等)。
当然,对于题主提到的“如何计算”的问题,我认为答案其实早已经在我们身边。国家每年都会发布各种年龄段的儿童死亡报告,包括新生儿、婴儿和儿童的死亡原因以及概率等等。这些数据,都是基于全国的总体数据得出的,是我们想要获得的结果。 但是要找到这些数据,可不那么容易。以新生儿为例,我们要想找到全国各年龄组新生儿的死亡率,就需要进入“卫生部网站”(网址:URL)。在这个网站上,我们可以找到各种年份的《中国卫生统计年鉴》,年鉴里有我们想要知道的一切:每年新生儿死亡的性别比(男孩/女孩)、各年龄段的死亡率以及死因构成比。
我们以云南省2015年的新生儿死亡数据为例,看看我们能得到什么信息。 数据来源:云南省2015年出生居民死亡分析报告 经整理后的新生儿年龄别死亡率表格如下: 对表中的数据进行简单处理,我们就可以得到图中所示的年龄别死亡率曲线。
由图可知,在0岁~1岁时,婴儿死亡风险最高,之后逐渐下降,但在8岁之前,仍然保持在较高水平。这与我们的日常生活经验是相符的,即孩子在1岁以内由于疾病等原因死亡的风险最大,8岁之前因为意外伤害死亡的风险较高。
有了这些数据,我们就能够利用数学方法对问题进行推断,从而得到我们所希望知道的答案——每个年龄段婴儿的死亡风险。 不过,我还需要提醒大家的是,以上提到的全部内容,都建立在已有数据的基础上。换言之,这些数据都是基于客观存在的真实世界而得出的,我们只能通过数据去尽可能接近真实的总体情况。然而真实世界往往是复杂多变的,我们无法掌控整体的情况,也只能试图去把握局部的问题。