大数据时代人人都拥有数据,
但是提到数据分析,听起来似乎是专家才能做的事情。确实, 如果你想成为数据科学家, 那么好好学习机器学习、Hadoop和R吧。
不过如果你只是想简单地做些分析,那么还是有一些学习曲线不那么陡峭的“傻瓜”工具可用,以下是GigaOM的博客作者Derrick
Harris推荐的6款免费在线数据分析工具,IT经理网为大家试用点评如下:
BigML
BigML是一个机器学习的工具。 如果拿数码摄影做类比, BigML使用起来简单得就像傻瓜相机那样,
同时有具备了单反的功能。 用户只需要上传数据, 格式化数据, 然后BigML就根据这些变量生成一个预测模型。
就这么简单。 下图就是Derrick Harris根据自己在用健康应用App软件Fitbit统计出来自己一天的活动数据和消耗的卡路里,
BigML做出的预测模型。
Google Fusion Table
Google Fusion Table 是Google的一个实验性数据可视化工具。
用户界面算不上多好, 不过使用非常简单。下图就是Derrick Harris把公开的各国枪支犯罪的数据上传上去得出的可视化地图。
对每个国家, 点击后可以看到具体数据:
Infogram
如果你的数据量不大, 比如列数和行数不多的话。 Infogram 是个不错的可视化选择。
Infrogram最初提供信息图的模板, 而去年又开始增加了大量的图表的模板。用户上传数据后, 可以生成互动的图表,
这些图表可以嵌入网页使用。
此外, Infogram还提供了一些样本数据供用户试验。 用户可以看这些样本数据生成的图表,
如果喜欢的话, 可以用自己的数据替换。
下图是本站编辑根据本站的文章“GE的千亿美元数据转型”进行词频分析并用Infogram生成的词频表以及词云图。
“GE千亿美元大数据转型”词频图-IT经理网(CTOCIO.com)
| Create infographics
“GE千亿美元大数据转型词频分析
“GE千亿美元大数据转型”词频分析-IT经理网(CTOCIO.com)
| Infographics
Many Eyes
Many Eyes是IBM的一个Web服务。 提供很多可视化的工具, 包括各种图表。
而Many Eyes最强的就是文本分析功能。
下图就是IT经理网编辑利用Many Eye上的数据例子对马丁路德金牧师的“我有一个梦”进行文本分析产生的词云图(Many
Eyes 还不支持中文分词)。
此外, Many Eyes的文本分析还能显示词组的关联, 让你知道作者常用的词组关联是哪些。
比如 “我有一个梦”的演讲里Freedom出现的频次最多。 我们还可以建一个单词树,
来专门看从Freedom延伸下去的词。
Statwing
Statwing 是一个非常简单的教会用户使用统计图表的应用。 你只需要上传数据,
把你需要关注的变量打上勾, Statwing就可以把统计关系图画出来。 而且可以把各个变量的样本大小,
最大最小值, 平均数, 中位数以及标准方差等一系列统计指标列出来。
下图是Derrick Harris上传的自己的Fitbit的数据。 试图研究一下自己的每天活动和卡路里消耗量的关系。
Tableau Public
Tableau Public 是Tableau的免费版本。 它需要一些结构化的数据,
也需要你懂一些BI。 不过类似于拖拽这样的功能, 对于那些想试试的用户来说, 还是比较方便的。
下图是IT经理网编辑根据data.gov上最近7天的地震数据用Tableau生成的可视化的图。
读者也可以试一试, 数据在这里。
总结:
这些数据分析及可视化的工具,可以很简单地帮助用户实现一些看起来很难的分析或者可视化。
对于那些想试着上手的用户来说, 是一个接触数据分析和可视化的捷径。 不过, 需要注意的是,很多工具需要的是结构化的数据,比如列作为变量,
行做为样本。因此,在使用这些工具之前, 需要对数据进行清洗, 把数据整理成为可用的格式才可以使用。
|