求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Modeler   Code  
会员   
 
  
 
 
     
   
分享到
开源的对决,MapR将Apache Drill引入企业应用
 
     作者 Derrick Harris 火龙果软件 发布于 2014-9-19  
 

短短两年,Apache Drill当下已获得超过40个公司的支持和贡献,而在近日,更被MapR加入其公司的大数据平台,作为开发者预览版展示给用户。

近日,MapR正式将Apache Drill整合进该公司的大数据处理平台,并开源了一系列大数据相关工具。时至今日,在高度竞争的Hadoop领域,开源已成为众多公司的利器,他们纷纷通过贡献更多的代码来保护自己,也通过开源来攻击其它公司的开发性。就这个事件,Derrick Harris在Gigaom上做了简要分析。

以下为译文

近日,MapR,Apache Drill项目的创建者,已经将该技术的初期版本整合到该公司的大数据平台。该公司称这个版本的Drill为0.5,以“开发者预览版”的方式展示这个SQL查询引擎。

Drill最初公布是在2012年8月,专注于SQL on Hadoop,当下已经取得了很大的进展。在SQL on Hadoop领域,各个公司可谓是八仙过海各显神通——Cloudera的Impala、Hortonworks的Hive迭代,以及各种各样的初创公司和开源项目,包括当下炙手可热的Spark社区。

然而MapR的Chief Marketing Officer Jack Norris表示,Drill是个值得期待的技术,因为它是其他SQL on Hadoop引擎所有特性的“父集”。同时,Drill的主要特性在于,在数据被加载到数据库之前,它可以快速的生成结构模式,这主要因为取代将数据转换成其他模式或者表格,Drill保持原始的格式。因此,Drill也无法满足那些期望将数据转换成特定格式的用户需求。

MapR产品管理负责人Tomer Shiran表示:“对比其他SQL on Hadoop项目,我们更有信心将Drill做好。”

尽管该公司当下的大数据平台已经整合了Drill,但是这个技术并不是MapR产品的唯一选择。MapR的大数据平台同样整合了Impala和Hive堆栈,甚至通过更紧密的集成支持HP的Vertica分析工具。


Tomer承认:“通过支撑更多的技术及贡献大量的代码,这将作为MapR重塑专有Hadoop供应商形象更广泛战略的一部分。”Norris更表示:

当下,MapR发行版中所有关系到应用程序层组件都使用了开源技术或者标准的API。在将来,MapR将尽可能开源更多的技术。MapR会用实际行动证实这一点,比如这周二,公司就开源了大量Hadoop平台的资源管理功能,并且提交了MapR的磁盘IO分配方法,以及作业调度机制到Apache。

Drill已经得到超过40个以上公司的支持和贡献,其中包括Cisco、LinkedIn以及威斯康星大学。当下,开源已经被证实为产品提升的有效途径,通过众包的方式它可以喜迎大量的工程师致力开源。同时,在高度竞争的Hadoop领域,开源更成为捍卫自己的盾牌,以及在开放性上攻击其它公司的利剑。
 
分享到
 
 
 
 



利用Gitlab和Jenkins做CI
CPU深度学习推理部署优化
九种跨域方式实现原理
 
 讲座 设计模式C语言
 讲师:薛卫国
 时间:2019-4-20
 
 
每天2个文档/视频
扫描微信二维码订阅
订阅技术月刊
获得每月300个技术资源
 
希望我们的资料可以帮助你学习,也欢迎投稿&提建议给我
频道编辑:winner
邮       件:winner@uml.net.cn

关于我们 | 联系我们 | 京ICP备10020922号 京公海网安备110108001071号