问答详情

大数据技术领域工具有哪些?

664次观看
标签: 大数据技术 大数据技术领域工具
老师回答

1、Hadop

Hadoop诞生于2005年,是雅虎(Yahoo)为解决网络搜索问题而设计的一个项目。由于它的技术效率,后来被Apache软件基金会作为开源应用程序引入。Hadoop本身不是一个产品,而是一个软件产品的生态系统,这些软件产品结合在一起,实现了全面的功能和灵活的大数据分析。从技术上讲,Hadoop包括两个关键服务:使用Hadoop分布式文件系统(HDFS)的可靠数据存储服务和使用MapReduce技术的高性能并行数据处理服务。

2、蜂巢

Hive是建立在Hadoop文件系统之上的数据仓库架构,用于分析和管理存储在HDFS中的数据。Facebook的诞生和发展是为了应对管理和机器学习Facebook每天产生的大量新社交网络数据的需求。后来,其他公司开始使用和开发Apache Hive,如Netflix、Amazon等。

3、风暴

Storm是一个主要由Clojure编程语言编写的分布式计算框架。这家营销和情报公司由Nathan Marz和他在BackType的团队创立,2011年被Twitter收购。Twitter随后将该项目开源,并将其推广到GitHub。Storm最终于2014年9月加入Apache孵化器项目,正式成为Apache的顶级项目之一。

免费直播

    精选课程
    相关推荐
    数据科学与大数据技术是什么专业?
    张老师 大数据工程师

    “数据科学与大数据技术”专业是近两年才设立的新专业。“数据科学与大数据技术”专业有着很好的就业前景并且就业的宽度广,就业薪资待遇水平高,缺点可能在于专业设立较新,教学课程设置上可能无法跟上大数据人才培养的技能需求。

    “数据科学与大数据技术”专业的人才培养方向:

    分析类岗位

    分析类工程师。使用统计模型、数据挖掘、机器学习及其他方法,进行数据清洗、数据分析、构建行业数据分析模型,为客户提供有价值的信息,满足客户需求。

    算法工程师。大数据方向,和专业工程师一起从系统应用的角度,利用数据挖掘/统计学习的理论和方法解决实际问题;人工智能方向,根据人工智能产品需求完成技术方案设计及算法设计和核心模块开发,组织解决项目开发过程中的重大技术问题。

    研发类岗位

    架构工程师。负责Hadoop集群架构设计开发、搭建、管理、运维、调优,从数据采集到数据加工,从数据清洗到数据抽取,从数据统计到数据分析,实现大数据全产业线上的应用分析设计。

    开发工程师。基于hadoop、spark等构建数据分析平台,进行设计、开发分布式计算业务,负责机器学习、深度学习领域的开发工作。

    运维工程师。负责大数据基础平台的运维,保障平台的稳定可用,参与设计大数据自动化运维、监控、故障处理工具。

    注册电脑版

    版权所有 2003-2020 广州环球青藤科技发展有限公司