Hadoop是目前大数据分析领域中应用最广泛的一种分布式架构,而经过相当长时间的发展,Hadoop在功能上也越来越成熟。
作为处理海量数据最常用的方法,Hadoop的核心是Map和Reduce,也就是将一个庞大的任务进行分解,然后再将结果进行汇总。但经过10年发展,Hadoop的功能早已不是MapReduce这么简单。今天的Hadoop是分布式计算所涉及的计算、存储、文件系统、网络、安全、负载均衡、管理等一系列软件方法的合集。
作为一个开源项目,Hadoop目前仍在高速发展、快速更新中。
从行业整体的发展来看,人类只是刚刚意识到了大数据的重要性,而大数据技术本身的发展和完善仍需要相当长的时间。无论是大数据还是开源技术,未来仍旧不可估量。