|
|
开源的对决,MapR将Apache Drill引入企业应用
|
|
作者 Derrick Harris 火龙果软件 发布于 2014-9-19 |
|
|
短短两年,Apache Drill当下已获得超过40个公司的支持和贡献,而在近日,更被MapR加入其公司的大数据平台,作为开发者预览版展示给用户。
近日,MapR正式将Apache Drill整合进该公司的大数据处理平台,并开源了一系列大数据相关工具。时至今日,在高度竞争的Hadoop领域,开源已成为众多公司的利器,他们纷纷通过贡献更多的代码来保护自己,也通过开源来攻击其它公司的开发性。就这个事件,Derrick Harris在Gigaom上做了简要分析。
以下为译文
近日,MapR,Apache Drill项目的创建者,已经将该技术的初期版本整合到该公司的大数据平台。该公司称这个版本的Drill为0.5,以“开发者预览版”的方式展示这个SQL查询引擎。
Drill最初公布是在2012年8月,专注于SQL on Hadoop,当下已经取得了很大的进展。在SQL on Hadoop领域,各个公司可谓是八仙过海各显神通——Cloudera的Impala、Hortonworks的Hive迭代,以及各种各样的初创公司和开源项目,包括当下炙手可热的Spark社区。
然而MapR的Chief Marketing Officer Jack Norris表示,Drill是个值得期待的技术,因为它是其他SQL on Hadoop引擎所有特性的“父集”。同时,Drill的主要特性在于,在数据被加载到数据库之前,它可以快速的生成结构模式,这主要因为取代将数据转换成其他模式或者表格,Drill保持原始的格式。因此,Drill也无法满足那些期望将数据转换成特定格式的用户需求。
MapR产品管理负责人Tomer Shiran表示:“对比其他SQL on Hadoop项目,我们更有信心将Drill做好。”
尽管该公司当下的大数据平台已经整合了Drill,但是这个技术并不是MapR产品的唯一选择。MapR的大数据平台同样整合了Impala和Hive堆栈,甚至通过更紧密的集成支持HP的Vertica分析工具。
Tomer承认:“通过支撑更多的技术及贡献大量的代码,这将作为MapR重塑专有Hadoop供应商形象更广泛战略的一部分。”Norris更表示:
当下,MapR发行版中所有关系到应用程序层组件都使用了开源技术或者标准的API。在将来,MapR将尽可能开源更多的技术。MapR会用实际行动证实这一点,比如这周二,公司就开源了大量Hadoop平台的资源管理功能,并且提交了MapR的磁盘IO分配方法,以及作业调度机制到Apache。
Drill已经得到超过40个以上公司的支持和贡献,其中包括Cisco、LinkedIn以及威斯康星大学。当下,开源已经被证实为产品提升的有效途径,通过众包的方式它可以喜迎大量的工程师致力开源。同时,在高度竞争的Hadoop领域,开源更成为捍卫自己的盾牌,以及在开放性上攻击其它公司的利剑。
|
|
|