本文讨论数据分析的几个常用概念,如环比增速、同比增速、平均增速、子项数据在整体中的占比、子项数据对整体增速的影响(贡献率、拉动点数)、饼图的应用等。
讨论某个指标的增长速度时,首先要确定数据对比的报告期,常见的报告期有月报、季报、年报等,常用的增速类型包括环比增速、同比增速、几个报告期的平均增速等。计算增速时要注意指标数据含义与数量单位的一致性。
环比增速是指当前报告期与前一报告期数据对比的增长速度,计算公式为“(当期数据÷上期数据-1)×100%”。如报告期为月报时,当年3月相对于当年2月的增长速度就称为环比增速。如果指标的3月数据为210,2月数据为200(实际应用中注意数量单位应相同);则环比增速就是(210÷200-1)×100%=5%,即3月与2月相比,环比增长5%;如果计算结果为负数,则环比呈下降趋势,称为环比下降n%,而不应称为环比增长-n%。增速为0%时则环比持平。如果直接使用计算结果,可以称环比增速为多少。
同比增速是指某指标本年某个报告期数据与去年相同报告期数据相比的增长速度,计算公式为"(当期数据÷同期数据-1)×100%"。如某指标2025年1-6月累计数据为1100,2024年1-6月数据为1000,则2025年上半年同比增速为(1100÷1000-1)×100%=10%,即2025年1-6月与2024年1-6月相比,同比增长10%;如果计算结果为负数,则同比呈下降趋势,称为同比下降n%,而不应称为增长-n%。增速为0%时称为同比持平。同样的,如果直接使用计算结果,可以称同比增速为多少。
计算增速时有一些特殊情况,以同比增速为例,当期数据和同期数据都大于0时,可以正常使用公式计算增速,但是数据为0,甚至是负数时就需要注意,如:
还以同比增速为例,在Excel中进行计算非常方便,但需要注意以下两种计算方法的区别:
使用第一种计算方法时,可以将单元格设置为百分比,并根据需要保留小数位数,如下图所示,其中指定只显示1位小数位数。
使用第二种计算方法时,如果设置为百分比格式,则数据会自动乘以100,这与数据的实际含义不符;此时可以使用自定义格式,并设置为“G/通用格式!%”格式,此时可以显示百分号,如下图所示。
下图显示了两种计算方法的结果和公式,其中E列使用了FORMULATEXT()函数显示公式内容。
实际工作中,在Excel中应更多地使用第一种计算方法,只是需要注意,计算结果不是真正的百分数,需要乘以100%才是真正的增速,并且需要设置单元格格式为百分比。在自己的工作或团队工作中,应事前约定计算方法和显示格式。
此外,如果百分数不需要计算获取,也可以直接在单元格中录入,如“10%”,而且直接输入的百分数可以参与数值运算,如“=10%*10”结果为1。
平均增速是指连续几个报告期数据的平均增速,其计算方法是,第一步,计算各报告期数据与上期数据的比值,保留小数形式;第二步,将比值相乘;第三步,将相乘的积开n次方并减1,其中n为报告期数量。
假设指标1有如下图所示的连续6年的数据。
现在可以计算“指标1”2021年以后的平均增速,如2021到2025年连续5年的平均增速。第一步是计算每年数据与同期数据的比值,如2021年就是1600÷1500,上图中的C列已经计算出了2021到2025年数据分别与上期数据的比值。需要注意的是,2020作为基础数据,因表中没有2019年数据,所以无法计算其与上期数据的比值,图中的C2单元格的横线表示没有数据。
第二步是计算2021到2025年数据与上期比值的积,最后开5次方并减1,在C8单元格可以使用公式“=PRODUCT(C3:C7)^(1/5)-1”进行计算,结果如下图所示。
图中的结果换算成百分数约为3.6%(保留一位小数),即指标1数据2021年到2025年的平均增速为3.6%,也就是年平均增长3.6%。请注意,如果计算结果为负数,如-n%,则为年平均下降n%。
数据关系中往往有整体和子项数据的结构,对于这类结构,一般也会用百分比或小数表示,如一班有同学50人,其中男生26人,女人24人,则男生占全班人数的52%,计算方法也很简单,即使用公式"子项数据÷整体数据×100%";占比使用小数形式时直接使用公式"子项数据÷整体数据"即可。
使用图形表示子项与整体的关系时,常常使用饼图。假如一班男、女生数量如下图所示。
在Excel中绘制饼图时,首先选中数据区域中的一个数据单元格,然后点击“插入”选项卡>>“图表”组中的饼图图标,如下图所示。
点击饼图图标后,在菜单中选择二维饼图中的第一个,如下图所示。
选中后会自动生成基本的饼图,并且在功能区会出现“图表设计”选项卡,可以对图表进行设置,如下图红框中就可以选择饼图的样式。
修改饼图样式和标签等内容时,还可以点击图形右上角的“+”号图标,如显示各部分百分比数据可以按下图所示进行设置。
修改图表标题时可以双击标题进入编辑状态,直接修改即可;修改图表尺寸时,可以通过图形周边的8个控制点进行操作。下图就是修改标题和尺寸后的效果。
实际应用中可以选择多种饼图样式,如下图显示了三维效果的饼图。
当子项数据和整体数据都与同期数据对比时,还应关注子项数据对整体数据增长(或下降)的贡献率和拉动点数,下面讨论相关的计算方法。
首先,贡献率的计算方法是:子项贡献率=子项增量÷整体增量,即:子项贡献率=(子项本期数据-子项同期数据)÷(整体本期数据-整体同期数据)。假如有下图所示的数据。
图中的数据,指标1A和指标1B是指标1的子项数据,可以看到指标1整体情况是增长的,子项指标1A也是增长的,而指标1B同比是下降的。接下来我们先来计算指标1A的贡献率,在E3单元格添加公式“=(B3-C3)/($B$2-$C$2)”,注意整体数据引用时使用了绝对地址,然后向下复制公式,最后设置单元格格式为百分比并保留1位小数,计算结果如下图所示。
可以看到,指标1A的增量大于整体数据的增量,贡献率超过了100%,说明整体的增长完全是靠指标1A的数据在支撑;而指标1B的数据同比是在下降,对整体的贡献率为负数,也就是说指标1B是在下拉整体数据;那么指标1A和指标1B分别拉动和下拉多个百分点呢?有了贡献率,可以使用公式“子项拉动点数=子项贡献率×整体增速”计算拉动(下位)点数。
首先在F3单元格添加公式“=E3*$D$2*100”并向下复制公式,注意引用整体数据时使用绝对地址,然后设置单元格格式为数值并保留1位小数,计算结果如下图所示。
从计算结果中可以看到,指标1A拉动整体(指标1)数据14.8个百分点,而指标1B则下拉整体数据5.3个百分点。
可以观察数据的计算结果,因为指标1等于指标1A加指标1B的和,所以,指标1A和指标1B的贡献率相加正好等于100%,而拉动的百分点数相加正好等于整体数据的同比增速。
当对比数据多样化以后,单一的图形可能无法有效表达,下一篇文章会讨论更多统计图的绘制,如折线图、条形图和组合图形。