大数据分析要避免的错误有哪些?

环球青藤 2021/03/03 02:43

1、不明确的目标

未能确定收集数据的原因,意味着你将错过阐明假设和确定收集内容的机会。结果是你可能会收集错误的数据或不完整的数据。

2、定义错误

假设你想知道你的客户上个季度花了多少钱在你的服务上。即使是这样一个简单的目标也需要在你得到你想要的信息之前定义一些假设。

首先,你如何定义“顾客”?取决于你的目标,你可能不想把每个人都放到一个桶里。您可能希望通过购买行为细分客户,以便相应地调整营销动作或产品特性。如果是这样的话,那么你需要确保你包含了关于客户的有用信息,例如人口信息或支出历史。

3、捕获错误

一旦确定了希望收集的数据类型,就需要设计一种机制来捕获它。这里的错误可能导致捕获不正确的或偶然的、有偏见的数据。例如,如果你想测试产品A是否比B产品更吸引人,但你总是在你的网站上显示产品A,那么用户可能不会频繁地看到或购买B产品,从而导致你得出错误的结论。

4、测量误差

当你捕获数据的软件或硬件出错时,或无法捕获可用数据或产生虚假数据时,就会出现测量错误。例如,使用日志与服务器不同步,则可能丢失移动应用程序上的用户行为信息。同样,如果你使用像麦克风这样的硬件传感器,你的录音可能会捕捉到背景噪音或其他电信号的干扰。

5、加工误差

许多企业拥有几十年前的数据,原来能够解释数据决策的团队早已不在了。他们的许多假设和问题很可能没有文档化,这将取决于你推断,这可能是一项艰巨的任务。

你的团队可能会做出与原始数据收集过程中不同的假设,并得出截然不同的结果。常见的错误包括缺少一个特定的过滤器,使用不同的会计标准,并简单地犯方法错误。

6、覆盖误差

覆盖误差指,目标受访者都没有足够的机会参与数据调查的情况。例如,如果你正在收集老年人的数据,但只提供网站调查,那么你可能会错过许多答卷人。

关于大数据分析要避免的错误有哪些,青藤小编就和您分享到这里了。如果你对大数据工程有浓厚的兴趣,希望这篇文章能够对你有所帮助。如果您还想了解更多数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。

免费直播

    精选课程 更多

    注册电脑版

    版权所有 2003-2020 广州环球青藤科技发展有限公司