大数据时代人人都拥有数据,
但是提到数据分析,听起来似乎是专家才能做的事情。确实, 如果你想成为数据科学家, 那么好好学习机器学习、Hadoop和R吧。
不过如果你只是想简单地做些分析,那么还是有一些学习曲线不那么陡峭的“傻瓜”工具可用,以下是GigaOM的博客作者Derrick
Harris推荐的6款免费在线数据分析工具,IT经理网为大家试用点评如下:
BigML
BigML是一个机器学习的工具。 如果拿数码摄影做类比, BigML使用起来简单得就像傻瓜相机那样,
同时有具备了单反的功能。 用户只需要上传数据, 格式化数据, 然后BigML就根据这些变量生成一个预测模型。
就这么简单。 下图就是Derrick Harris根据自己在用健康应用App软件Fitbit统计出来自己一天的活动数据和消耗的卡路里,
BigML做出的预测模型。
![](images/2013102931.jpg)
![](images/2013102932.jpg)
Google Fusion Table
Google Fusion Table 是Google的一个实验性数据可视化工具。
用户界面算不上多好, 不过使用非常简单。下图就是Derrick Harris把公开的各国枪支犯罪的数据上传上去得出的可视化地图。
![](images/2013102933.jpg)
对每个国家, 点击后可以看到具体数据:
![](images/2013102934.jpg)
Infogram
如果你的数据量不大, 比如列数和行数不多的话。 Infogram 是个不错的可视化选择。
Infrogram最初提供信息图的模板, 而去年又开始增加了大量的图表的模板。用户上传数据后, 可以生成互动的图表,
这些图表可以嵌入网页使用。
此外, Infogram还提供了一些样本数据供用户试验。 用户可以看这些样本数据生成的图表,
如果喜欢的话, 可以用自己的数据替换。
下图是本站编辑根据本站的文章“GE的千亿美元数据转型”进行词频分析并用Infogram生成的词频表以及词云图。
![](images/2013102935.png)
“GE千亿美元大数据转型”词频图-IT经理网(CTOCIO.com)
| Create infographics
“GE千亿美元大数据转型词频分析
![](images/2013102936.png)
“GE千亿美元大数据转型”词频分析-IT经理网(CTOCIO.com)
| Infographics
Many Eyes
Many Eyes是IBM的一个Web服务。 提供很多可视化的工具, 包括各种图表。
而Many Eyes最强的就是文本分析功能。
下图就是IT经理网编辑利用Many Eye上的数据例子对马丁路德金牧师的“我有一个梦”进行文本分析产生的词云图(Many
Eyes 还不支持中文分词)。
![](images/2013102937.jpg)
此外, Many Eyes的文本分析还能显示词组的关联, 让你知道作者常用的词组关联是哪些。
![](images/2013102938.jpg)
比如 “我有一个梦”的演讲里Freedom出现的频次最多。 我们还可以建一个单词树,
来专门看从Freedom延伸下去的词。
![](images/2013102939.jpg)
Statwing
Statwing 是一个非常简单的教会用户使用统计图表的应用。 你只需要上传数据,
把你需要关注的变量打上勾, Statwing就可以把统计关系图画出来。 而且可以把各个变量的样本大小,
最大最小值, 平均数, 中位数以及标准方差等一系列统计指标列出来。
下图是Derrick Harris上传的自己的Fitbit的数据。 试图研究一下自己的每天活动和卡路里消耗量的关系。
![](images/20131029310.jpg)
Tableau Public
Tableau Public 是Tableau的免费版本。 它需要一些结构化的数据,
也需要你懂一些BI。 不过类似于拖拽这样的功能, 对于那些想试试的用户来说, 还是比较方便的。
下图是IT经理网编辑根据data.gov上最近7天的地震数据用Tableau生成的可视化的图。
读者也可以试一试, 数据在这里。
![](images/20131029311.jpg)
总结:
这些数据分析及可视化的工具,可以很简单地帮助用户实现一些看起来很难的分析或者可视化。
对于那些想试着上手的用户来说, 是一个接触数据分析和可视化的捷径。 不过, 需要注意的是,很多工具需要的是结构化的数据,比如列作为变量,
行做为样本。因此,在使用这些工具之前, 需要对数据进行清洗, 把数据整理成为可用的格式才可以使用。
|