01 新用户的源头在哪里?
小李接下了这个活后,苦苦思索思路,最后决定采用由上至下的思维方法来分析。
第一步,新用户从何而来?
现在互联网获取用户的方式多种多样,但重要的一点是,大部分用户的来源都是可追踪的,在A、 B、C、D四个不同的渠道上投放广告,来自不同渠道的用户就会带上对应的标签,我们就知道用户是从哪个渠道来的,这为数据分析提供了基础。
基于由上至下的思维,小李决定首先分析不同来源的新用户留存是不是有差异。假设小李通过数据分析发现不同渠道用户的次留如下:
A:50%B:48%C:46%D:20%通过分析,我们发现了D渠道用户的留存远低于其他渠道,这是一个结论,但分析到这里就结束了吗?
当然不是,告诉产品D渠道的用户留存低虽然不能说完全没有意义,但作为数据分析师,你要告诉产品D渠道的用户留存为什么低才能凸显你的价值。
02 D渠道的留存为什么低?
定位到了D渠道的用户留存低,下面就要分析D渠道的用户留存为什么低。小李基于业务理解想到,不同渠道来的用户在本身属性上可能就有差别。比如在知乎上投放广告,可能来的用户就是新知青年、集中在一二线城市,而在快手投放广告,来的小镇青年就会比较多。
回到D渠道的分析上,小李基于业务理解作出假设,是不是因为D渠道的用户画像和其他渠道不同,所以导致了其新用户留存低?基于这个假设,小李对D渠道的用户画像进行分析,发现D渠道相比其他渠道,五六线城市的用户更多,而五六线用户的留存率要低于一到四线城市。
03 五六线城市的用户留存率为什么低?
小李在第二步发现了五六线城市用户的留存率比较差,分析到这里就结束了吗?当然也不是,我们不能告诉产品五六线用户的留存比较低,建议你以后放弃五六线城市的用户,还需要分析五六线城市用户的留存为什么差。
用户画像的差异最终会反映在app的行为差异上。用户的画像不同,其兴趣偏好、对app的认知可能就不同,最终就会导致其在app上的行为会有差异。到了这一层面,我们就需要分析五六线城市用户的行为是不是和其他城市的用户有差异。
那我们该怎么衡量这个差异呢?这其实是一种量化思维,需要选取一些合适的指标将这个差异量化出来。
小李基于对业务的理解,想到在上,影响新用户留存很重要的一个指标是新用户刷到的前10个视频的完播率怎么样。
如果完播率高,侧面说明用户喜欢推给他的视频,但如果视频的完播率低,用户的行为可能就是不停的刷下一个视频,发现都不喜欢,就会觉得这个app不适合我,推的视频我都不喜欢,大概率就会流失掉了。
基于这个业务理解,小李猜测,五六线城市用户的完播率会不会和其他城市的用户有差异?
再基于这个假设,小李分析了五六线城市和其他城市用户的完播率发现,五六线城市用户的完播率较差,这是五六线城市用户留存较差的一个重要原因。
04 为什么五六线城市新用户完播率较差?
小李已经发现了五六线城市用户的完播率差,但分析到这里也没有结束,小李还需要分析完播率为什么差,这也是最重要的一步,只有找到了完播率差的原因,产品才可以做对应的策略进行调整。
首先依然是依据业务理解尝试做出假设。大家都知道是基于个人兴趣进行个性化推荐,但是对于新用户其实算法不知道他的兴趣的,所以一般会选一些全站热门的视频进行推送,比如美食、宠物等,再基于用户的反馈快速学习。
有了这个业务背景,小李做出假设:五六线城市新用户的完播率差是不是因为不喜欢一开始推给他们的视频?如果不喜欢的话那么他们喜欢什么样的视频?是所有类型的视频完播率都差吗?有没有完播率比较好的视频?
基于上面的假设,小李继续去做分析,发现五六线城市的用户对于偏下沉的视频完播率较高,但是对于其他类型的全站热门视频,比如美食、旅行的完播率均较差,而现在五六线城市的新用户激活时推荐的又是他们不喜欢的视频,更符合一至四线用户的口味,所以导致了完播率较差,又进而导致了留存率差。
05 基于分析对业务做出改进
小李有了一个重大发现,五六城市用户完播率差的原因是因为冷启动推送的视频不喜欢,进而导致了他们的留存差,在产品上,就可以基于这个发现在策略上做出改进。
小李提出了对不同地域的新用户,应当采取个性化冷启动的策略,对于五六线城市的用户,一开始推送的视频应当更加下沉,而不是现在的推送全站热门视频的策略。
基于小李的建议,产品经理调整了五六线城市新用户冷启动的视频推送策略,调整后新用户的留存绝对值上涨了5%,产品经理大喜过望,并决定当天晚饭给小李加一个鸡腿。
06 结语
再梳理一下小李的分析链条,我们发现小李的分析方法是由上至下,层层剖析,从一开始发现D渠道的留存差,到最后发现四五线城市用户不喜欢现在冷启动推送的视频才是新用户留存差的真正原因,数据分析就是要从数据波动的表象中,发现问题的本质。
并且大家可能也注意到了,小李对于每一个问题,都是先基于业务理解做出假设,再通过数据去验证,这是一种业务先行的思维方法(与这种方法相反的,是先分析数据,通过数据发现再反推业务,这两种都是常用的分析方法,有机会再做讲解)。
新用户的留存差,那么新用户是从哪里来的?是渠道,哪个渠道新用户的留存比较差? 留存较差的渠道的用户画像是什么样的?什么类型的用户留存差? 这类型用户的留存为什么差?在app上的行为和留存好的用户有什么差异? 行为差异的原因什么? 基于这个差异的原因,如何在业务上做出改进?
通过上面的分析,我们就完成了一次通过数据分析改进业务的闭环。
在现实业务中,原因往往不会像case里描述的这样简单直接,可能你想了几十个假设,分析了几十个维度在数据上也难以验证,并且在策略的实施上,也需要考虑更多的因素,比如要给五六线城市用户推送下沉视频,那么我们现在的内容储备能不能满足这样的需求?我们有没有足够的下沉视频给用户推送?如果没有的话是不是要培养出一批这样的内容生产者?这就是更深层面的问题了,这也是数据分析的魅力所在。
推荐阅读: