求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Modeler   Code  
会员   
 
  
 
 
     
   
分享到
人人都能掌握的6个数据分析工具
 
作者 Derrick Harris,火龙果软件    发布于 2013-10-29
 

大数据时代人人都拥有数据, 但是提到数据分析,听起来似乎是专家才能做的事情。确实, 如果你想成为数据科学家, 那么好好学习机器学习、Hadoop和R吧。 不过如果你只是想简单地做些分析,那么还是有一些学习曲线不那么陡峭的“傻瓜”工具可用,以下是GigaOM的博客作者Derrick Harris推荐的6款免费在线数据分析工具,IT经理网为大家试用点评如下:

BigML

BigML是一个机器学习的工具。 如果拿数码摄影做类比, BigML使用起来简单得就像傻瓜相机那样, 同时有具备了单反的功能。 用户只需要上传数据, 格式化数据, 然后BigML就根据这些变量生成一个预测模型。 就这么简单。 下图就是Derrick Harris根据自己在用健康应用App软件Fitbit统计出来自己一天的活动数据和消耗的卡路里, BigML做出的预测模型。

Google Fusion Table

Google Fusion Table 是Google的一个实验性数据可视化工具。 用户界面算不上多好, 不过使用非常简单。下图就是Derrick Harris把公开的各国枪支犯罪的数据上传上去得出的可视化地图。

对每个国家, 点击后可以看到具体数据:

Infogram

如果你的数据量不大, 比如列数和行数不多的话。 Infogram 是个不错的可视化选择。 Infrogram最初提供信息图的模板, 而去年又开始增加了大量的图表的模板。用户上传数据后, 可以生成互动的图表, 这些图表可以嵌入网页使用。

此外, Infogram还提供了一些样本数据供用户试验。 用户可以看这些样本数据生成的图表, 如果喜欢的话, 可以用自己的数据替换。

下图是本站编辑根据本站的文章“GE的千亿美元数据转型”进行词频分析并用Infogram生成的词频表以及词云图。

“GE千亿美元大数据转型”词频图-IT经理网(CTOCIO.com) | Create infographics

“GE千亿美元大数据转型词频分析

“GE千亿美元大数据转型”词频分析-IT经理网(CTOCIO.com) | Infographics

Many Eyes

Many Eyes是IBM的一个Web服务。 提供很多可视化的工具, 包括各种图表。 而Many Eyes最强的就是文本分析功能。

下图就是IT经理网编辑利用Many Eye上的数据例子对马丁路德金牧师的“我有一个梦”进行文本分析产生的词云图(Many Eyes 还不支持中文分词)。

此外, Many Eyes的文本分析还能显示词组的关联, 让你知道作者常用的词组关联是哪些。

比如 “我有一个梦”的演讲里Freedom出现的频次最多。 我们还可以建一个单词树, 来专门看从Freedom延伸下去的词。

Statwing

Statwing 是一个非常简单的教会用户使用统计图表的应用。 你只需要上传数据, 把你需要关注的变量打上勾, Statwing就可以把统计关系图画出来。 而且可以把各个变量的样本大小, 最大最小值, 平均数, 中位数以及标准方差等一系列统计指标列出来。

下图是Derrick Harris上传的自己的Fitbit的数据。 试图研究一下自己的每天活动和卡路里消耗量的关系。

Tableau Public

Tableau Public 是Tableau的免费版本。 它需要一些结构化的数据, 也需要你懂一些BI。 不过类似于拖拽这样的功能, 对于那些想试试的用户来说, 还是比较方便的。

下图是IT经理网编辑根据data.gov上最近7天的地震数据用Tableau生成的可视化的图。 读者也可以试一试, 数据在这里。

总结:

这些数据分析及可视化的工具,可以很简单地帮助用户实现一些看起来很难的分析或者可视化。 对于那些想试着上手的用户来说, 是一个接触数据分析和可视化的捷径。 不过, 需要注意的是,很多工具需要的是结构化的数据,比如列作为变量, 行做为样本。因此,在使用这些工具之前, 需要对数据进行清洗, 把数据整理成为可用的格式才可以使用。

相关文章 相关文档 相关视频



我们该如何设计数据库
数据库设计经验谈
数据库设计过程
数据库编程总结
数据库性能调优技巧
数据库性能调整
数据库性能优化讲座
数据库系统性能调优系列
高性能数据库设计与优化
高级数据库架构师
数据仓库和数据挖掘技术
Hadoop原理、部署与性能调优
 
分享到
 
 
     


MySQL索引背后的数据结构
MySQL性能调优与架构设计
SQL Server数据库备份与恢复
让数据库飞起来 10大DB2优化
oracle的临时表空间写满磁盘
数据库的跨平台设计
更多...   


并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理


GE 区块链技术与实现培训
航天科工某子公司 Nodejs高级应用开发
中盛益华 卓越管理者必须具备的五项能力
某信息技术公司 Python培训
某博彩IT系统厂商 易用性测试与评估
中国邮储银行 测试成熟度模型集成(TMMI)
中物院 产品经理与产品管理
更多...