sparkSQL和spark有什么区别？

2020/09/28 05:19

Spark为结构化数据处理引入了一个称为Spark SQL的编程模块。简而言之，sparkSQL是Spark的前身，是在Hadoop发展过程中，为了给熟悉RDBMS但又不理解MapReduce的技术人员提供快速上手的工具。

sparkSQL提供了一个称为DataFrame（数据框）的编程抽象，DF的底层仍然是RDD，并且可以充当分布式SQL查询引擎。

SparkSql有哪些特点呢？

1）引入了新的RDD类型SchemaRDD，可以像传统数据库定义表一样来定义SchemaRDD。

2）在应用程序中可以混合使用不同来源的数据，如可以将来自HiveQL的数据和来自SQL的数据进行Join操作。

3）内嵌了查询优化框架，在把SQL解析成逻辑执行计划之后，最后变成RDD的计算。

免费直播

精选课程更多

VBA实战速成：从零到一的突破

数据分析师 62次课共11学时

吴开斌

吴开斌

火热报名中

WPS高效数据管理

数据分析师 17次课共4学时

王忠超

王忠超

火热报名中

Fine BI 商业智能数据分析

数据分析师 27次课共6学时

王忠超

王忠超

火热报名中

【Excel 高效应用:HR 数字化管理实战】

数据分析师 30次课共3学时

王忠超

王忠超

火热报名中

Power BI 轻松入门：零基础到数据大师

数据分析师 23次课共49学时

吴开斌

吴开斌

火热报名中

Excel函数大师班：效率与精通的融合

数据分析师 62次课共62学时

吴开斌

吴开斌

火热报名中

0基础入门数据分析5天训练营

数据分析师 5次课共4学时

曹峥

张玮

11921人已报名

Power Bl 商务智能数据分析

数据分析师 37次课共10学时

王忠超

王忠超

火热报名中

Excel综合应用案例-进销存、工资管理、应收账款、员工信息人事表

数据分析师 66次课共11学时

吴开斌

吴开斌

火热报名中

Excel入门到精通

数据分析师 12次课共10学时

高老师

高老师

火热报名中

查看更多课程

相关推荐

热门推荐

最新推荐

登录｜注册｜电脑版

版权所有 2003-2020 广州环球青藤科技发展有限公司