数据分析小思路:从社会化网络数据展现到用户研究数据分析
咱们先从一个例子开始吧:想要500万彩票大奖吗?如何从海量的往期彩票中奖数据发现数据规律。有人教我按照如下流程操作。
第一步:收集数据。以双色球的开奖数据为例,将往期的数据下载下来。在互联网如此发达的年代,相信这件事情最容易了。原始数据清洗后导入SPSS。
第二步:将原始数据转化成关系矩阵。如下图所示。关系矩阵是社会化网络数据分析很重要的表现形式,每个矩阵单元格里面的数据表示出现的频次。
第三步:用图表现关系。社会化网络专用的画图软件有很多,下面这张图是用UCINET画的关系图。其他类似的软件还有很多,简单列举一些。Gephi、Pajek(可以处理海量数据)、Cyto
Scape(可以处理中文case)等等。
从上面的图就可以看出不同数字之间的关系,两个球之间的连线,便是他们之间的关系强度,在这个case里面,就是两个球同时出现的概率大小。这个软件可以调整强度关系,便于我们看到不同强度条件下球与球之间的关系。
你不会还在想着500万在哪里吧?
其实只是利用这个念想,把社会化网络的数据展现形式,用一个简单的例子展现了出来,至于五百万,忘了吧,要不然我还在这里写博客?
这是一个很简单、不能再简单的例子,不过由此可以联想我们用户研究的数据,是不是有时候也可以这么展现呢?我想了两个例子。
用研数据分析1:啤酒和尿布。这是一个耳熟能详的营销案例,但是背后的数据确实用户研究的。尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直为商家所津津乐道。原来,美国的妇女们经常会嘱咐她们的丈夫下班以后要为孩子买尿布。而丈夫在买完尿布之后又要顺手买回自己爱喝的啤酒,因此啤酒和尿布在一起购买的机会还是很多的。啤酒和尿布,不久是超市里面卖得多种商品的强关系链吗?
用研数据分析2:用户使用支付宝产品的关联分析。我们往往能够通过问卷调研拿到一些数据,比如用户使用过公司的哪些产品。那么我们是不是可以去看看这些产品之间的关系强度如何?也就是说,用户用了什么样的产品,使用其他什么产品的可能性很大?这个答案对于整合运营的作用是显而易见的。对于用户研究,能够更深的走入用户,了解深层次的原因,而非简简单单的停在使用与否的表层。
|