文本描述
最近在看几个数据分析平台的数据,基本上都有DAU/MAU这个指标,这个指标很早之前就在社交游戏平台得以广泛使用,对于这个指标的一些解析,以前有写过,今天换个角度,通过比率分析来具体的分析一下这个DAU/MAU。或许从中你会得到一些其他的信息。? ??DAU/MAU的传统分析与局限性? ? 首先,我们来看一下这个图:? ? 此图总结的是2011年12月25日到2012年9月19日的DAU/MAU的比值曲线图,可以看到初期的的变化比较剧烈,这点是因为刚刚开始测试,初期的DAU导入速度比MAU导入速度更快一些,因此此时比值相对较高,因为初期的DAU贡献主要来自于新登用户,DAU的快速扩张能力很强。? ? 但是我们去除初期的几个上线版本时期的数据,得到新的曲线时,就会发现其实这个比值存在一些差异的情况,比如图中的2月份,每日产生的DAU/MAU彼此之间的差异很显著。也就是全距很大,这样算数平均计算出来的每月DAU/MAU就会出现问题,不够准确反映该月的粘性情况(其实在这里我们计算的平均月DAU/MAU是一个加权均值)。? ? 关于刚才提到的算数平均值有时候不稳定的原因,我这里拿出来一张8个月的箱线图,可以看到1,4,7这三个月的每日比值是存在一些离群点的,DAU/MAU是从宏观上来看用户粘性和登录情况的(一般我们都是平均一个月的DAU/MAU),如果我们看到以上的情况,那么我们DAU/MAU的这种平均计算式有问题的,这样计算平均值(算数),就会屏蔽了真实情况,在此箱线图为解释该问题的说明。有关箱线图的认识请参考我以前的文章。? ? 下面是DAU和MAU的趋势图,能够看到尽管数量级不同,但是整体曲线的走势是一致的,这点直接反馈在DAU/MAU这个比值上,因此这个比值的参考意义就很大了。但是如刚才所言,我们是参考每个月的平均比值水平,这种做法其实如果我们要做几个月之间的活跃和粘性分析时是不够准确的。因此我们还要采用一些其他的办法。? ? DAU? ? MAU? ? 关于数据分类可以参看一下的内容:baike.baiduview/7032740.htm? ??DAU/MAU的分析探讨? ? 针对这个指标我做了两个方面的探讨,第一个就是引入几何平均数来处理这个指标,针对该方法的详细探讨这里不去详说,主要就是对于加权均值的处理发生了变化。该方法的核心就是几何平均数的使用,这部分知识请参见几何平均数的概念和使用。? ? 第二个探讨就是今天的主角,引入比率分析法。? ? 比率分析主要用于对两个变量间变量值的比率变化进行描述分析,适用于定距型变量。关于数据分类可以参看一下的内容:baike.baiduview/7032740.htm? ? 比率分析能够提供中位数、均值等基本的统计指标,当然了也提供离差系数(COD),价格相关微分(PRD)等等,进而刻画出比率变量的集中趋势和离散程度。这种比率分析实际上应用范围和形式很广泛。SPSS提供了比率分析的功能,此处我就用SPSS来分析一下DAU/MAU。? ? 首先打开该模块,如下图所示:? ? 打开以后我们看到如下的对话框? ? 在此对话框中,分子我们选择DAU,分母就是MAU,组变量就是比率分析中的分组变量,一般为名义或者序数度量。? ? 接下来,我们打开
。。。以下略