您的组织是否在考虑分析数据的最佳方法?在你采用大数据分析之前,这里有六个大数据的神话需要注意。
云计算的使用、更快的数据处理速度以及被输入物联网的海量数据意味着,企业现在正在收集前所未有的海量数据。大数据比以往任何时候都要大。但是如何组织、处理和理解数据仍然是许多组织面临的主要挑战。
你的公司还在努力理解什么是大数据以及如何管理它吗?以下是行业专家将帮助你揭开的六大大数据迷局。
1、数据分析的误区——大数据意味着“大量”的数据
目前,大数据已经成为一个流行词。但它的真正含义往往不清楚。有些人认为大数据就是大量的数据。但这并不完全正确。实际情况要复杂一点。大数据是指结构化(如表格)或非结构化(如电子邮件中的元数据)的数据集,这些数据集结合了社交媒体分析或物联网数据等数据,从而形成一个更大的故事。大数据的故事说明了组织利用传统分析技术捕捉趋势是多么困难。
"我认为这是个好主意,"丰田研究所数据研究主管Jim Harding表示。阿德勒说得好:“数据也有质量。它就像水:在玻璃容器中的水非常容易管理。但如果你被洪水淹没,就会变得势不可挡。”“在一个数据分析系统中,在一台机器上工作的数据将被冲走,数据的大小将增加100或1000倍。所以,当然,原型很小,但架构很大。”
2、数据分析的误区——数据需要清理
“最大的误区是,你必须有干净的数据才能进行分析。”BeyondCore的首席执行官Aligat BeyondCore表示:“我认为这是一个好主意。“没有人有干净的数据,”森古普塔说。“它必须被清理,否则就不会工作。这是个疯狂的想法。你所要做的就是做一个足够好的分析。您必须分析所有数据,即使数据是脏的,也意味着存在数据质量问题。我可以告诉您一些模式,尽管数据质量不高,但它们完全能够执行正常的分析。现在,你可以专注于数据质量,只是改善数据,获得更好的洞察力。”
Megan Outsourcing, Inoutsourcing的商业智能和分析总监。“很多时候,公司拖后腿是因为他们认为数据不干净或没有必要,”Bootzman表示同意。部署的分析应用程序将能够发现数据中的弱点。“一旦发现这些问题,就可以制定清理计划。分析应用程序可以利用一种机制来加速清理和监控过程。”
Bootzmein说。“一旦你把数据放在一起,你就可以看到一个应用程序的生活图景,你可以看到聚合的数据是如何相互关联的,你很快就会发现你的数据不够多。”“正如你所看到的,数据的问题在于它提供了一个清理数据的基线,”她说。
3、数据分析的误区——等待,让你的数据完美
森古普塔说,你不应该等着清理你的数据还有另一个原因。“彻底清理这些数据可能需要三个月的时间,但三个月后,这些数据就过时了。”因此,这些信息不再适用。
森古普塔说,第一国家银行的乔希·霍洛威多年来一直致力于这个项目。贝特曼在会上提出了一个重要的观点。Josh展示了他如何运行分析、发现问题、分析更改和重新运行分析。他说:“你看,我的分析时间只有四五分钟。所以如果我能在四五分钟内分析,找到问题,解决问题,再分析,看看报告,然后改变我分析的方式。”
Sengupta用编码来比喻旧的方式。“我做的每件事都是正确的,然后我写代码。但现在,每个人的代码都不那么灵活了。”他说。“在你写完程序之后,你必须测试它,看看如何能把它做得更好,然后当它变得更好的时候。”世界已经变了,人们仍然按照旧的方式做事。”
4、数据分析的误区——湖泊数据
数据湖是一个松散的存储库,包含大量的原始数据和结构化数据,通常在大数据上下文中提到。
唯一的问题是,尽管它们经常被引用,但它们并不存在,阿德勒说。组织的数据不会转储到数据湖中。这是一个精心计划的部门数据库。鼓励专业知识的集中。它们还提供了良好数据治理和合规所需的问责性和透明度。”
数据分析的误区有哪些?数据分析师不注意这些怎么进步,云计算的使用、更快的数据处理速度以及被输入物联网的海量数据意味着,企业现在正在收集前所未有的海量数据,你能处理好吗?如果您还担心自己入门不顺利,可以点击本文其他文章进行学习。