1.大数据是新时代的新玩意
事实上,数据分析一点也不新。早从数百年前的启蒙时代,学者们便已开始遵循科学方法,一步步拆解事物形成背后的原因。科学家先观察,取得并分析数据,归纳出假说,然后再经过不断实证,逐渐形成定律。因此我们说的大数据,充其量只是科学方法的应用。
2.100TB以上才叫大数据
数据的大小,事实上没有明确的界线。更重要的,数据的大小,不一定有意义。数据大,也不代表一定能做出準确的预测─假设你拥有地球70亿人口的姓名、性别、生日、身高、体重、肤色、视力,以及他们的上网行为等种种数据,如果题目是要预测他们明年的收入分布,这个庞大的资料库,恐怕还是无法帮上你什么。所以数据在精不在多,重点是要达成的任务,不是储存的数量。
3.数据非常客观
采集数据的软硬件,是人为设计的,因此不可能做到绝对的客观。手机停留在某个画面,就代表你在欣赏这个内容吗?很难说,或许你只是在跟旁边的朋友聊天。对某个发文点赞,就代表你真心喜欢这则资讯吗?也很难说,说不定只是喜欢发文的人,或是手滑不小心按到。
4.数据可以告诉你不知道的内幕
就像字面显现的,数据只能告诉你不知道的数据。但它究竟代表什么样的内幕,必须要靠归纳者自行去解读。举例来说,分析你的App使用者资料后,发现21-30岁女性族群占比最大,这可能代表着你的App对这种人最有吸引力,但也可能代表当初推广团队在发广告时,比较针对这样的族群。究竟事实是什么?往往需要更进一步的综合比较、实验分析,才能逼近。
5.大数据是资讯部门的问题
大数据的收集与储存,的确可以归类为资讯部门的业务。但定义该收集什么,如何收集,收集后该如何应用,绝对是业务主导部门该负责的。要求IT部门把大数据做好,就好像要求财务部门提昇公司获利一样,是本末倒置的。
关于大数据中存在哪些误解,青藤小编就和您分享到这里了。如果您对大数据工程有浓厚的兴趣,希望这篇文章可以为您提供帮助。如果您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。