大数据技术领域工具都有哪些?

环球青藤 2020/12/03 08:21

1、Hadop

Hadoop诞生于2005年,是雅虎(Yahoo)为解决网络搜索问题而设计的一个项目。由于它的技术效率,后来被Apache软件基金会作为开源应用程序引入。Hadoop本身不是一个产品,而是一个软件产品的生态系统,这些软件产品结合在一起,实现了全面的功能和灵活的大数据分析。从技术上讲,Hadoop包括两个关键服务:使用Hadoop分布式文件系统(HDFS)的可靠数据存储服务和使用MapReduce技术的高性能并行数据处理服务。

2、蜂巢

Hive是建立在Hadoop文件系统之上的数据仓库架构,用于分析和管理存储在HDFS中的数据。Facebook的诞生和发展是为了应对管理和机器学习Facebook每天产生的大量新社交网络数据的需求。后来,其他公司开始使用和开发Apache Hive,如Netflix、Amazon等。

3、风暴

Storm是一个主要由Clojure编程语言编写的分布式计算框架。这家营销和情报公司由Nathan Marz和他在BackType的团队创立,2011年被Twitter收购。Twitter随后将该项目开源,并将其推广到GitHub。Storm最终于2014年9月加入Apache孵化器项目,正式成为Apache的顶级项目之一。

关于大数据技术领域工具都有哪些,青藤小编就和您分享到这里了。如果您对大数据工程有浓厚的兴趣,希望这篇文章可以为您提供帮助。如果您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。

免费直播

    精选课程 更多

    注册电脑版

    版权所有 2003-2020 广州环球青藤科技发展有限公司