对比分析法|数据分析中必不可少的分析方法之一

2024-05-08 16:47

1. 对比分析法|数据分析中必不可少的分析方法之一

​我们都知道没有对比的分析是没有意义的。例如我的网站2019年7月浏览量26W,这个孤立值没有任何参考价值,只是单纯的一个数字。因为26W到底是高还是低呢,效果到底是好还是不好,没有一个参考的标准。
  
 假如6月份的浏览量是19.5W,那么7月份比6月份的浏览量增长了6.5万,环比增长率为34%左右。正常情况下,当看到网站浏览量环比增长了34%时,我们会暗自欣喜,因为从6月到7月网站向好的方向发展。
                                          
 ps:7月与6月相比,就是我们通常说的环比,环比增长率=(本期数据-上期数据)/上期数据。通常环比为日环比、周环比、月环比、年环比等。这里是月环比的示例。
  
 但是,画风一转,请看下面一图,2019年7月份相比2018年的7月份浏览量数据居然是下降的,下降率为50%左右。看到这样的情况,我们开始慌了~
                                          
 ps:2019年7月与2018年7月相比,就是我们通常说的同比,同比增长率=(本期数据-上期数据)/上期数据。通常同比包括:某年、某月、某周与上一年同期数据对比。
  
 这就是对比分析法的奥妙,从不同的维度对比分析,可能分析出的结果大相径庭,所以我们需要尽可能全方位的从多个角度进行数据分析及原因查找。
  
 通过了解,原来在2018年7月时,网站在线举办了一个投票活动,活动为网站带了了不错的效果,2018年时7月份环比6月份增长了182%。而在2019年7月份没有举办过任何活动,2019年7月份同比2018年7月浏览量下降。
                                          
 对比分析法,它是数据分析中一种最基础的分析方法。对比分析法就是将两个或者两个以上的数据进行比较,进而发现数据之间的差异和规律。对比分析包括绝对对比和相对对比。
  
 绝对对比指绝对数据之间的比较,例如用户数、浏览量、访问量、下单量、注册量等。
  
 相对对比指相对数据之间的比较,例如转化率、留存率、沉默率、下单率、注册率等。
                                                                                 
 从不同的对比视角,可以归纳为如下常见的对比场景:
  
  时间对比 :同比、环比、变化趋势等
  
  空间对比 :不同城市对比、不同类别对比、不同渠道对比等
  
  用户对比 :新用户与老用户对比、登录用户与未登录用户对比、高粘用户与低粘用户对比、活跃用户与不活跃用户对比等
  
  转化对比 :不同渠道转化对比、不同类别转化对比、不同活动转化对比等
  
  竞品对比 :推广方式对比、功能对比、用户体验对比、产品定位对比、营收对比等
  
  前后变化对比 :活动前与活动后对比、推广前与推广后对比、改版前与改版后对比、新功能上线前与上线后对比等
  
  ...... 
  
 首先介绍一下数据标准化公式:
                                          
 数据标准化最直观的优点就是更加清晰的可视化展示数据变化规律,例如下图左边是没有标准化之前网站从第一周到17周每一天的浏览量,右图是将浏览量数据标准化后,右图很显然看出如下趋势变化规律(1)前7周网站的浏览量相比8周后的浏览量低;(2)周六日明显低于平时。
  
 接下来分析师还需要结合其他维度找一下这两个时间段的浏览量比较低的原因是正常还是异常。
                                          
  不同指标对比 
  
 对比不同单位指标,由于量纲本身的不同,数据直接进行对比没有意义,这时需要对各项数据先进行数据标准化,去除量纲因素,再做对比分析。举个例子:通过活跃用户数与次均时长评价不同渠道的质量,从而选择最优的渠道进行推广。没有标准化前,两个指标的单位不同,例如渠道1用户数最多,但是次均时长不是最长,而渠道3用户活跃数最少,但是次均时长确实最长,那么这三个渠道到底哪个质量更高呢?
                                          
 下面对两组数据按照标准化公式分别计算,并把标准化结果按照平均数合并,如下图所示
                                          
 从图中很明显看出渠道1标准化后均值最大,说明渠道1的质量最优(这里采用的均值合并,当然合并时权重设定需要结合实际业务,比如对于内容型产品,业务认为次均时长更重要,则将次均时长的权重设置的大一些,具体多大需要数据验证)。

对比分析法|数据分析中必不可少的分析方法之一

2. 数据分析中常用分析思路-对比分析解析(二)

   
   对比是识别事物的基本方法对比——横向、纵向及多维度对比比值比率背后的逻辑指标的逻辑与管理指标对标的层次和维度标杆管理与榜样的力量。
   最常见的对比是大小的对比、数量的对比,例如销售额的对比、人数的对比、时间长短的对比。使用不同的对比指标会得到不同的结论。
     
   我们把对比标准的选择叫作对比的视角,对比视角不同,就会得出不同的结论。例如将小强和小明对比,从身高的角度对比,就有了高矮的判断,我们还可以从学习成绩、年龄等其他的视角进行对比。在对比人的时候,我们可能会有更加综合的维度,例如在对比客户的时候,我们会综合考虑各种因素;在对比各种变化的原因时,我们也有各种模型。对比随时随地都在发生,我们所要做的就是找到合适的对比视角,针对同样的问题,发现不同的洞察。
     
   对第一层级的变量做了对比之后,我们还可以形成综合的变量。将第一层级的变量(直接描述事物的变量,如长度、数量、额度、宽度、高度等)加工之后得到的变量,称作二级变量。在进行二级变量对比的时候,常用的有增速、效率、效益等指标。
     
   增速是指在一定时间范围内数量变化的比率。两家公司、两个产品、两个市场、两个客户、两个渠道,都可以对比增速。而对比的时间周期可以按照月份、季度或者年度来设定。2015年,美国的国内生产总值为17.4万亿美元,中国的国内生产总值为10.4万亿美元,美国全年经济的增速是2.4%,中国全年经济的增速是6.9%。这就是速度的比较,如下图所示。我们很自然地会问,如果按照这个增速发展下去,中国国内生产总值赶超美国大概要等到哪一年?2027年!
                                                                                     效率是投入与产出之间的比值,是资源利用能力的评价指标。效率对比就是看谁能够利用更少的投入产出更多的价值。对比两家企业的效率,可以看出哪家企业更有发展潜力,更有竞争力。
     
   常用的衡量人力资源效率的指标是人均产值(一定时期内平均每个人产出的价值)、元当产值(公司每发出一元工资所带来的产值),如下图所示。前者是把人数作为投入要素来评价的,而后者是把人员工资作为投入要素来评价的。如果一家公司的销售额和利润实现了快速且稳定的增长,但是在公司成长的过程中,物质要素的效率在提高,而劳动力要素的效率却在下降,即人均产值在下降,那就意味着随着公司的发展,新招聘的人员的平均水平在下降,而工资却在不断增长,每一元工资投入的产出在大幅度下降。
                                                                                     一些表面繁荣的公司,背后却蕴藏着巨大的人力资源危机,公司的人力资源整体水平在下降,这样的公司是很难持续发展的,特别是到了市场竞争越来越激烈时期,人力能力跟不上公司的发展。如果公司在发展的过程中看不到这个问题,将来就会成为非常关键的问题——公司在快速发展时,所有的问题都不是问题,但到了公司发展受阻时,一个小问题都会成为天大的问题。很多公司在危难时期面临的问题都是在顺境中衍生的。所以,对一些效率指标的跟踪非常重要。
   对于相对比较复杂的事物,某一个维度的分析往往只代表一个侧面,不能代表事物的全貌。而如果对比的维度太多,我们往往就不能得到一个明确的答复。
     
   例如小明比小强高10厘米,但小强比小明帅;有的客户购买力不强,但他能够带动朋友来购买公司的产品和服务。这就需要综合考虑各个因素,也给数据分析工作带来了新的挑战——我们需要找到一个更加简单的方法来评价事物。
     
   所谓的指标,就是各种评价标准经过加权综合之后得到的具有一定意义的评价体系。例如消费者物价指数就是衡量物价变化的指标。蔬菜价格在上涨,但大米的价格在下降,肉、禽、蛋、奶的价格也在下降,我们就不能说整体的物价在上涨。那么如何评价物价的波动呢?可以用衡量物价的综合指标——CPI(ConsumerPriceIndex,消费者物价指数)或工业价格指数PPI(ProducerPriceIndex,生产者物价指数)等指标来衡量物价的波动。
     
   消费者物价指数(CPI)是综合了大多数人的消费习惯,按照消费产品的比例加权计算消费者综合的消费价格波动,不同时期的CPI组成也不同,不同国家也会根据消费者不同的消费习惯组合成不同的消费者物价指数。因为中国地域广阔,消费者的消费习惯差异很大,所以CPI带给大家的感觉也会不同。CPI的本质是用来衡量消费者所拥有的现金在特定时期生活消费购买力变化的指标。PPI则是指工业生产者综合购买力的指标。
     
   在企业管理中也会采用一些综合的评价指标来进行对比。例如,最为典型的就是KPI(KeyPerformanceIndicator,关键业绩指标),它是根据公司对某个岗位的要求,以及在各个维度上要求的重要程度的不同,设定不同的权重,从而形成的一个综合评分指标。不同岗位在不同公司的KPI设定肯定会不同。为了能够更好地让业绩指标为公司战略服务,曾经有知名的咨询公司提出一个通过综合考虑4个方面要素而组合出来的KPI指标,叫作BSC(BalanceScoreCard,平衡记分卡),其考虑到每个岗位的财务指标、客户指标、成长指标和流程指标。不同公司中不同岗位的BSC肯定不同,但基本涵盖的是4大类指标的综合加权平均值。
     
   数据分析师有一个关键的职能就是要设计“指标”来对比。设计指标与应用指标有着天壤之别,很多人在应用别人的指标的时候还会出错,如果要真正设计指标,则需要对事物之间的逻辑关系有着深刻的理解。
     
   例如,笔者服务过一家经营婴幼儿食品的公司,其产品包括配方奶粉、米粉、水果泥和婴幼儿安全营养补充零食。他们的业务与一个市场中人口的出生率、这个市场的整体购买力、消费者对婴幼儿食用包装食品的观念有直接的关系,还与政府对这个市场中的食品安全管控力度有关系。分析了这么多关系之后,他们希望能够构建一个指标反映一个市场对公司的吸引力,从而能够让公司根据这个市场吸引力指标来投资。
     
   而市场的吸引力还与市场中的竞争强度有关系,如果在这个市场中竞争者众多,前几名的竞争者实力雄厚,后台资本实力强大,那么这个市场的吸引力就小;如果这个市场几乎是空白市场,那么这个市场的吸引力就大。
     
   考虑到以上因素,我们需要建立一个综合指标来评价这个市场的吸引力,最好能够直接得到一个分数进行直观判断,例如80分的市场比75分的市场有5分的吸引力差异,60分的市场是30分的市场的吸引力的两倍。那么如何设计这个指标呢?我们需要各种数据的加权计算。
     
   在不考虑市场规模的情况下,我们可以先构建一个指标指数模型:
    Y=aX1+bX2+cX3+dX4+eX5+fX6+… 
   其中:
   Y:市场吸引力指标值。X1:婴儿出生率(或者每年婴儿出生的数量)。X2:市场购买力平价指标。X3:消费者对婴幼儿包装食品的态度。X4:企业信誉对消费者购买婴幼儿产品的影响。X5:政府对婴幼儿食品的管控力度。
   a,b,c,d,e,f…是系数,代表影响的程度。
   我们可以构建一个加法模型。加法模型代表各个要素之间并没有相互的影响,各个要素独立地对市场吸引力产生影响。
   当然我们也可以构建成乘法模型:
   Y=aX1×X2×X3×X4×X5×X6×…
   此乘法模型假设各个要素之间是相互影响的。例如如果消费者的信心不足,则购买力会因此被大幅度缩小。
     
   我们可以追踪各种历史数据,将不同阶段的数据放到一起,形成多个数据组合方程式,通过近似求解的方法实现对模型的构建。最终得到一个计算市场吸引力指标的数学模型:
   Y市场吸引力=f(X1,X2,X3,X4,X5,X6,…)这个数学模型可以用来指导公司未来的市场投资实践,也可以在公司不断拓展市场的过程中不断地验证这个数学模型,不断完善各种假设、指数、系数、计算方法,最终形成适合公司自我发展过程中的扩张模型。
     
   这是本书第一次提到数学模型的构建,这些内容需要读者具有数学基础。如果以上的内容让你感到很难理解,那么完全可以跳过这部分内容;如果你是从事数据分析专业的人士,那么这部分内容对你来说应该不太难;如果你不是从事数据分析专业的人士,那么只需要了解这些内容就足够了,不需要深究,更不需要自己去构筑完成一个数学模型;如果你是公司的高层管理者,那么阅读这部分内容可以让你更好地了解一个数据模型产生的过程,从而能够理解数据分析师每日的工作内容。
     
   下面就以CPI来进行示范说明。CPI本质上是一个构筑数学模型后形成的综合数据指标。
     
   假设一个居民每个月要吃掉5斤猪肉、3斤鸡肉、2斤牛肉、1斤羊肉、0.5斤鸭肉,0.5斤鹅肉、5斤白面、5斤青瓜……经过大量的统计调研,我们得到全国人民的饮食结构是如上的构成要素。
     
   我们调研所有的菜市场(其实是抽样代表)中所有这些产品的价格,得到本月该居民的消费支出,假定为1000元;下个月他同样购买这些产品来满足自己的日常生活需要,但是各个产品的价格发生了变化,用当月新的产品价格重新计算了他的消费支出情况,得到的结果是1050元,那么将该月的消费支出与上个月的消费支出进行对比,消费者价格上涨了(1050-1000)/1000=5%。如果把上个月的CPI认定为100元,则本月的CPI为105元,CPI上涨5%。这就是对CPI即消费价格指数的形象描述。当然,实际的CPI计算会比这个要复杂,因为我们监控的产品品种比我列举的要多,获取产品价格的渠道和监测点也要多得多。
     
   指数在整个经济领域中有着重要的地位,有的指数直接代表了经济的风向标,甚至左右着经济的发展。代表一个经济体、一个经济实体或者公司的指标有信誉评级指标,价格指标有CPI和PPI,短期经济发展兴衰指标有PMI(采购经理人指数)……
     
   我们对数据进行对比分析的时候,除简单地直接对比数据外,还需要构建一些可以重复使用或者在某个部门、某个业务领域、某个情景下进行评测的指标。这些指标背后可以是多个数据的综合分析结果,也可以是某个业务指标的合集。数据分析师要根据业务需求做出各种指标的模型,并形成长期的观测数据集,从而验证这种指标的合理性,只有通过长时期实践检验的指标才可以成为公司持续使用的对比指标。一个综合指标企业使用越久,就越完善,并且可以体现出公司管理的特色。
     
   当企业的管理指标逐步丰富之后,你会发觉企业的管理文化和管理体系都在发生着潜移默化的改变。之前管理者的职责是根据生产经营状况做出决策并确保决策的执行,在执行的过程中形成事前、事中和事后的反馈,并不断调整决策的执行过程。
     
   当数据承担起更多的这种分析和决策的过程时,管理者的职责逐渐从“思考型”向“指挥型”过渡,并且对管理者的聪明程度、经验能力的要求反而变弱了。同样能力的管理者所能够管理的人员数量在逐步发生变化,管理幅度在增加,一些复杂的管理工作逐步由数据和数据指标在发挥作用,一些分析和判断性的工作由智能的系统来完成,企业组织逐步转向扁平化、社群化。
   全文摘自《企业经营数据分析-思路、方法、应用与工具》赵兴峰著
       
    上期内容: 
   数据分析中常用分析思路-对比分析解析(一)、
   ①对比是识别事物的基本方法
   ②对比——横向、纵向及多维度对比
    下期内容预告: 
   数据分析中常用分析思路-对比分析解析(三)
   ①对标的层次和维度
   ②标杆管理与榜样的力量