1、Hadoop
hadoop要求jdk,因此要先安装jdk,hadoop安装主要配置文件为core-site.xml hdfs-site.xml mapred-site.xml 和hadoop-env.sh。
hadoop的核心模块 HDFS:Master和Slave(主从结构)-节点可以理解为物理机器。
主节点,只有一个:namenod。
从节点,有很多个:datanodes。
2、Hbase
Hbase是列族数据库底层依赖于hdfs,在分布式部署上采用Master/Slave的方式。
Hbase的核心三大模块:RegionServer、MasterServer和ClientLibrary。
在分布式存储上使用的是Hadoop的HDFS子框架。
分布式计算功能基于Hadoop的MapReduce实现。
3、Hive
hive是数据仓库,hive底层依赖于hadoop,它的sql解析是通过mapreduce任务完成的。
hive的两个核心模块:metastore和hiveserver。
关于学习大数据要注意的是什么,环球青藤小编就和您分享到这了。如若您对大数据工程有浓厚的兴趣,希望这篇文章可以为您提供帮助。倘若您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。