大数据常用工具有哪些?
2317次观看第一,Hadoop
Hadoop是用于分布式处理的大量数据软件框架。但是Hadoop以可靠,高效和可扩展的方式进行处理。Hadoop是可靠的,因为它假定计算元素和存储将发生故障,因此它维护工作数据的多个副本以确保可以为故障节点重新分配处理。Hadoop之所以高效是因为它可以并行工作,并通过并行处理来加快处理速度。Hadoop还具有可伸缩性,可以处理PB级的数据。此外,Hadoop依赖社区服务器,因此其成本相对较低,任何人都可以使用它。
第二,HPCC
HPCC,高性能计算和通信(High Performance Performance and Communications,高性能计算和通信)的缩写。1993年,美国科学,工程和技术联邦协调委员会向国会提交了有关“重大挑战项目:高性能计算和通信”的报告,也被称为HPCC计划的报告,即美国。总统的科学战略项目。目的是通过加强研发来解决许多重要的科学技术挑战。HPCC是一项计划在美国实施信息高速公路。该计划的实施将耗资数百亿美元。它的主要目标是开发可扩展的计算系统和相关软件,以支持TB级网络传输性能并开发数千美元。兆位网络技术扩展了研究和教育机构以及网络连接能力。
第三,暴风雨
Storm是免费的开源软件,是一种分布式的,容错的实时计算系统。Storm可以非常可靠地处理大量数据流,并用于处理Hadoop批处理数据。Storm非常简单,支持多种编程语言,并且使用起来非常有趣。Storm由Twitter开源,其他知名的应用程序公司包括Groupon,淘宝,支付宝,阿里巴巴,Le Element,Admaster等。
©本文版权归环球青藤所有,任何形式转载请联系我们。