学习大数据要注意的是什么?

环球青藤 2021/08/05 09:49

1、Hadoop

hadoop要求jdk,因此要先安装jdk,hadoop安装主要配置文件为core-site.xml hdfs-site.xml mapred-site.xml 和hadoop-env.sh。

hadoop的核心模块 HDFS:Master和Slave(主从结构)-节点可以理解为物理机器。

主节点,只有一个:namenod。

从节点,有很多个:datanodes。

2、Hbase

Hbase是列族数据库底层依赖于hdfs,在分布式部署上采用Master/Slave的方式。

Hbase的核心三大模块:RegionServer、MasterServer和ClientLibrary。

在分布式存储上使用的是Hadoop的HDFS子框架。

分布式计算功能基于Hadoop的MapReduce实现。

3、Hive

hive是数据仓库,hive底层依赖于hadoop,它的sql解析是通过mapreduce任务完成的。

hive的两个核心模块:metastore和hiveserver。

关于学习大数据要注意的是什么,环球青藤小编就和您分享到这了。如若您对大数据工程有浓厚的兴趣,希望这篇文章可以为您提供帮助。倘若您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。

免费直播

    精选课程 更多

    注册电脑版

    版权所有 2003-2020 广州环球青藤科技发展有限公司