问答详情

大数据和python有什么区别

203次观看
标签: 有什么区别 数据 python
老师回答

大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才

能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

首先大数据是一个很大的概念,现在很多领域都用到了大数据,比如:互联网、广告、金融、能源、交通等。而Python是一门编程语言,可以用Python处理和分析各个领域产生的数据。很多初学者经常比较哪种语言是最好的,其实:编程语言没有最好,只有最适用,即在某一种中场景下最适用!!!经常会有很多小伙伴们在一些论坛中喊,PHP是世界第一语言;Java是宇宙第一语言;人生苦短,我用Python等等。

客观的说,如果以后想从事大数据开发方向,两种语言都可能会用到,可以先学一门,因为语言是相通的,学了一门后,再学其他的就很快了!!!不要在到底学习哪门语言上纠结,重要的是先行动起来,学好一门编程语言!因为以后你可能还会学新的语言,比如现在Spark很火,还要学Scala呢!

推荐学习《python教程》

以前在一个论坛上有人这样比较Python、Java、C++,我觉得很形象生动:说Python是自行车,拿过来就骑,但是速度最快也就百十公里;Java是大型运输机,体量大,越飞越快;C++是导弹,一按发射按钮,嗖的一下就飞了,可以飞到几倍音速。经过比较,很容易上手,但是Python的性能最差,C++性能最高,但是想驾驭C++,就像控制导弹一样,成本和难度较高,而Java就脱颖而出了,你会发现现在大数据生态圈中的绝大多数框架都是用Java编写或是运行在JVM之上的!!!

互联网企业是这样做的:如果处理的数量比较大,那先用Hadoop或Spark进行一次或多次处理,然后将处理后的结果保存起来。如果数据量较小并且还要做一些数据挖掘或机器学习,会倾向使用Python,因为Python的机器学习算法更多,更完善!但是Hadoop和Spark也有相应的机器学习库了,比如Hadoop的Mahout和Spark MLlib,但是算法相对较少,随着时间的发展,会越来越完善的!所以到底是使用Spark还是Python,要看数据量的多少和业务的复杂度来决定!

就大数据处理和分析而言,python更适用一些,建议先学好python,毕竟现在大数据生态圈中的技术都脱离不了python,以后再学其他语言也很容易!

免费直播

    精选课程
    相关推荐
    python中sort()和sorted()使用有什么区别?
    付老师 Python编程

    python中有两种列表排序的方法,即sort() 和sorted() 。这两个方法看起来很像,但是有很大的差别。sort() 修改原列表,永久性排序,无返回值,内存消耗小,而sorted() 保持原列表不变,临时性排序,有返回值,内存消耗大。本文向大家详解这二者使用的区别。

    一、sort() 

    1、定义:python列表的一个内置的排序方法,只是列表的一个方法,只适用于列表;

    2、作用:作用于列表,直接修改原有列表,无返回值;

    3、排序时间:对列表进行永久性排序;

    4、内存消耗:无需保存原对象,节省内存空间。

    5、使用实例:

    list_name = [1, 3, 4, -0.2200222, -4.66]
    list_name.sort()
    print(list_name)

    输出

    [-4.66, -0.2200222, 1, 3, 4]
    原列表的值发生变化,原列表被修改

    二、sorted() 

    1、定义:python内置的一个排序函数,接受一切迭代器,返回一个有序的副本,并且类型总是列表;

    2、作用:作用于任意可迭代的对象,原有列表保持不变,会返回一个排序后的列表。

    3、排序时间:对列表进行临时排序。

    4、内存消耗:返回新对象,所以耗费较多资源。

    5、使用实例:

    list_name = [1, 3, 4, -0.2200222, -4.66]
    list_name_new = sorted(list_name)
    print(list_name)
    print(list_name_new)

    输出

    [1, 3, 4, -0.2200222, -4.66] 原列表
    [-4.66, -0.2200222, 1, 3, 4] 排序后的列表

    相比于sort(),sorted() 使用的范围更为广泛,但是sort()消耗内存比较小,效率也比较高。所以如果不需要保留原列表,sort更有效一点哦~

    python中append()和extend()有什么区别?
    刘老师 Python编程

    python列表中,append()和extend()都可以在在原有列表上增加对象,但是使用起来有很大区别。append()用于在列表末尾添加新的对象,任意对象都是可以的,列表只占一个索引位,会修改原来的列表。extend()向列表尾部追加一个列表,对象必须是一个可以迭代的序列,将列表中的每个元素都追加进来,会在已存在的列表中添加新的列表内容。详情请看本文。

    一、append()

    用于在列表末尾添加新的对象,列表只占一个索引位,在原有列表上增加。

    1、语法

    list.append(obj)

    2、参数obj 

    向列表中添加一个对象obj ,即添加到列表末尾的对象;

    任意对象都是可以的;

    直接将整个obj放入列表末尾。

    3、返回值

    无返回值,但是会修改原来的列表。

    4、使用实例

     lia.append(lib)
     lia>>   ['aa', 1, 'bb', None, ['cc', 2, {'dd': 3}]]

    二、extend() 

    向列表尾部追加一个列表,将列表中的每个元素都追加进来,在原有列表上增加。

    1、语法

    list.extend(seq)

    2、参数seq 

    把一个序列seq的内容添加到列表中,即元素列表;

    对象必须是一个可以迭代的序列;

    将seq打散后依次放入列表末尾。

    3、返回值

    无返回值,但会在已存在的列表中添加新的列表内容。

    4、使用实例

    lia.extend(lib)      不能用变量接收
    
    lia>>  ['aa', 1, 'bb', None, 'cc', 2, {'dd': 3}]

    以上就是python中append()和extend()的对比分析,希望能对你有所帮助哦~

    注册电脑版

    版权所有 2003-2020 广州环球青藤科技发展有限公司