docker和hadoop的区别? - 互动专区论坛 - 爱发电 - 宋马社区

docker和hadoop的区别?

1、形态上的差异

2013年的时候,Hadoop的确 很火,不过当时的感觉是安装和操作极其不方便,如果没有Linux的基础,可能需要个一周都不能搭起一个集群。

因此,不管是国外还是国内都出现了协助方便搭建平台的项目或者公司,当时国内的EasyHadoop,Intel,也包括我们这个兼职小团队。由于我们是做存储和备份一体机,当然就是做Hadoop OS和Appliance,实际证明这个也是Cloudera的发展路线。记得当年还有一个朋友的团队,也是做类似的Hadoop实施,免费拿去POC了半年,然后想做案例。在当时,能很快搭建环境就是牛逼,这个也是特定时期的结果。

但真正大数据发挥出价值是同业务的结合,纯做技术的是很难存活的,目前能有这么多大数据公司,都必须同业务场景结合起来,也因此在大数据领域最缺的不是技术,缺的是即懂技术又懂业务的复合型人才。

Hadoop和Docker都是开源项目,这个的确 不假。但是,在开源大行其道的今天,不能由于都是开源就能做类比。Hadoop是一个大数据的分析框架,可以说是Google的大数据平台的开源实现,它解决的只是一个云计算领域特定的问题,即大量数据的存储和计算问题。因此, 我认为是一个PaaS层级的东西。为用户提供了一个看似人人都可以使用的开源平台,但实际的确 有许多的坑。这个也许正是开源的魅力,任何人都可以快速的使用,但是一旦深入就会步入雷区,也因此才有了这么多的创业公司。

而Docker是操作系统级虚拟化(容器虚拟化)的一种具体实现,容器虚拟化并不是新技术,很早之前就有了。其使用的核心技术跟第一代虚拟化技术-Hypervisor是完全不同的。因此我认为Docker开源项目是一个IaaS层面的东西,当然通过开发可以赋予它PaaS层的属性。

请登录后发表评论