问答详情

大数据工程师有哪些技术要求?

843次观看
标签: 大数据工程师 大数据工程师技术要求
老师回答

1、数据采集技术数据采集主要通过Web、应用、传感器等方式获得各种类型的结构化、半结构化及非结构化数据,难点在于采集量大且数据类型繁多。采集网络数据可以通过网络爬虫或API的方式来获取。对于系统管理员来说,系统日志对于管理有重要的意义,很多互联网企业都有自己的海量数据收集工具,用于系统日志的收集,能满足每秒数百MB的日志数据采集和传输需求,如Hadoop的Chukwa、Flume,Facebook的Scribe等。

2、数据预处理技术大数据的预处理包括对数据的抽取和清洗等方面,数据抽取过程可以将数据转化为单一的或者便于处理的数据结构(常用的数据抽取工具infa)。数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,可以将数据集中的残缺数据、错误数据和重复数据筛选出来并丢弃。

3、大数据存储和管理技术实现对结构化、半结构化、非结构化海量数据的存储与管理,可以综合利用分布式文件系统、数据仓库、关系型数据库、非关系型数据库等技术。

4、大数据计算引擎批处理模式:一堆数据一起做批量处理,不能满足实时性要求,如MapReduce,Spark。流计算:针对流数据(日志流、用户点击流)的实时计算,需要实时处理。只能用流计算框架做,流计算代表产品:S4+Storm+Flume。图计算:MapReduce也能处理,但效率不高。代表软件:Google Pregel。查询分析计算:交互式查询,要求实时性高。代表产品:Google Dremel、Hive、Cassandra、Impala。

免费直播

    精选课程
    相关推荐
    大数据与数据分析师有哪些区别?
    宋老师 大数据工程师

    首先,大数据分析师是大数据时代背景下产生的一种新型技术岗位,与传统数据分析师的区别主要体现在三个方面,其一是技术体系结构不同;其二是岗位任务目的存在一定的区别;其三是工作场景具有一定的区别。

    ​对于大数据分析师来说,要具备更加全面的知识结构,涉及到大数据平台知识、算法设计知识、程序设计知识和具体的行业知识等,所以相对于传统的数据分析师来说,大数据分析师的从业门槛有了一定程度的提升。从目前行业领域的人才招聘情况来看,大数据分析岗位往往需要具有较高的学历要求,研究生往往更愿意从事相关岗位。

    大数据分析的目的与传统的数据分析目的也存在一定的区别,主要体现在两个方面,其一是大数据分析比较注重数据的价值化,简单的说,大数据分析的结果会提升数据的价值,而传统数据分析的目的往往是以应用为导向的。另一个区别在于,大数据分析的结果往往是为了提供给智能体使用,比如人工智能领域的算法训练、验证等过程都需要大数据分析的参与。

    在工作场景上,大数据分析与传统的数据分析也存在一定的区别,大数据分析往往需要借助于大数据平台进行,比如Hadoop、Spark,以及各种商用的大数据平台等,但是传统的数据分析往往会基于Excel或者是传统数据库进行。相对于传统数据分析工具来说,大数据分析的工具往往更加丰富,复杂程度也有明显的提升。

    注册电脑版

    版权所有 2003-2020 广州环球青藤科技发展有限公司