数据分析有哪些误区?

733次观看

标签：数据分析数据分析误区

老师回答

1.目的不明确，为了做而作，导致分析效果不明确。

2.对与行业、公司业务还有其他考虑因素认知不清楚，分析结果偏离实际。数据必须要结合企业业务和行业性质才有意义。摸清楚所在产业链的整个结构，对行业的上游和下游的经营情况有大致的了解，再根据业务当前的需要，制定发展计划，归类出需要整理的数据。同时，熟悉业务才能看到数据背后隐藏的信息。

3.为了方法而方法，为了工具而工具，只要能解决问题的方法和工具就是好的方法和工具。

4.数据本身是客观的，但被解读出来的数据是主观的。同样的数据由不同的人分析很可能得出完全相反的结论，所以一定不能提前带着观点去分析。

©本文版权归环球青藤所有，任何形式转载请联系我们。

免费直播

精选课程

VBA实战速成：从零到一的突破

数据分析师 62次课共11学时

吴开斌

¥ 1299

火热报名中

WPS高效数据管理

数据分析师 17次课共4学时

王忠超

¥ 1299

火热报名中

Fine BI 商业智能数据分析

数据分析师 27次课共6学时

王忠超

¥ 1299

火热报名中

【Excel 高效应用:HR 数字化管理实战】

数据分析师 30次课共3学时

王忠超

¥ 899

火热报名中

Power BI 轻松入门：零基础到数据大师

数据分析师 23次课共49学时

吴开斌

¥ 399

火热报名中

Excel函数大师班：效率与精通的融合

数据分析师 62次课共62学时

吴开斌

¥ 499-898

火热报名中

0基础入门数据分析5天训练营

数据分析师 5次课共4学时

曹峥

张玮

¥ 8

11603人已报名

Power Bl 商务智能数据分析

数据分析师 37次课共10学时

王忠超

¥ 1299

火热报名中

Excel综合应用案例-进销存、工资管理、应收账款、员工信息人事表

数据分析师 66次课共11学时

吴开斌

¥ 1299

火热报名中

Excel入门到精通

数据分析师 12次课共10学时

高老师

相关推荐

1、A* 搜索算法——图形搜索算法，从给定起点到给定终点计算出路径。其中使用了一种启发式的估算，为每个节点估算通过该节点的最佳路径，并以之为各个地点排定次序。算法以得到的次序访问这些节点。因此，A*搜索算法是最佳优先搜索的范例。

2、集束搜索(又名定向搜索，Beam Search)——最佳优先搜索算法的优化。使用启发式函数评估它检查的每个节点的能力。不过，集束搜索只能在每个深度中发现最前面的m个最符合条件的节点，m是固定数字——集束的宽度。

3、二分查找(Binary Search)——在线性数组中找特定值的算法，每个步骤去掉一半不符合要求的数据。

4、分支界定算法(Branch and Bound)——在多种最优化问题中寻找特定最优化解决方案的算法，特别是针对离散、组合的最优化。

5、Buchberger算法——一种数学算法，可将其视为针对单变量最大公约数求解的欧几里得算法和线性系统中高斯消元法的泛化。

6、数据压缩——采取特定编码方案，使用更少的字节数(或是其他信息承载单元)对信息编码的过程，又叫来源编码。

7、Diffie-Hellman密钥交换算法——一种加密协议，允许双方在事先不了解对方的情况下，在不安全的通信信道中，共同建立共享密钥。该密钥以后可与一个对称密码一起，加密后续通讯。

8、Dijkstra算法——针对没有负值权重边的有向图，计算其中的单一起点最短算法。

9、离散微分算法(Discrete differentiation)。

数据分析方法论有哪些?

刘老师数据分析师

1、PEST分析法

PEST，也就是政治(Politics)、经济(Economy)、社会(Society)、技术(Technology)，能从各个方面把握宏观环境的现状及变化趋势，主要用户行业分析。

宏观环境又称一般环境，是指影响一切行业和企业的各种宏观力量。

对宏观环境因素作分析时，由于不同行业和企业有其自身特点和经营需要，分析的具体内容会有差异，但一般都应对政治、经济、技术、社会，这四大类影响企业的主要外部环境因素进行分析。

政治环境：政治体制、经济体制、财政政策、税收政策、产业政策、投资政策等。

社会环境：人口规模、性别比例、年龄结构、生活力式、购买习惯、城市特点等。

技术环境：折旧和报废速度、技术更新速度、技术传播速度、技术商品化速度等。

经济环境：GDP 及增长率、进出口总额及增长率、利率、汇率、通货膨胀率、消费价格指数、居民可支配收入、失业率、劳动生产率等。

2、5W2H分析法

5W2H，即为什么(Why)、什么事(What)、谁(Who)、什么时候(When)、什么地方(Where)、如何做(How)、什么价格(How much)，主要用于用户行为分析、业务问题专题分析、营销活动等。

该分析方法又称为七何分析法，是一个非常简单、方便又实用的工具，以用户购买行为为例：

Why：用户为什么要买?产品的吸引点在哪里?

What：产品提供的功能是什么?

Who：用户群体是什么?这个群体的特点是什么?

When：购买频次是多少?

Where：产品在哪里最受欢迎?在哪里卖出去?

How：用户怎么购买?购买方式什么?

How much：用户购买的成本是多少?时间成本是多少?

3、SWOT分析法

SWOT分析法也叫态势分析法，S (strengths)是优势、W (weaknesses)是劣势，O (opportunities)是机会、T (threats)是威胁或风险。

SWOT分析法是用来确定企业自身的内部优势、劣势和外部的机会和威胁等，通过调查列举出来，并依照矩阵形式排列，然后用系统分析的思想，把各种因素相互匹配起来加以分析。

运用这种方法，可以对研究对象所处的情景进行全面、系统、准确的研究，从而将公司的战略与公司内部资源、外部环境有机地结合起来。

4、4P营销理论

4P即产品(Product)、价格(Price)、渠道(Place)、推广(Promotion)，在营销领域，这种以市场为导向的营销组合理论，被企业应用最普遍。

可以说企业的一切营销动作都是在围绕着4P理论进行，也就是将：产品、价格、渠道、推广。通过将四者的结合、协调发展，从而提高企业的市场份额，达到最终获利的目的。

产品：从市场营销的角度来看，产品是指能够提供给市场，被入们使用和消费并满足人们某种需要的任何东西，包括有形产品、服务、人员、组织、观念或它们的组合。

价格：是指顾客购买产品时的价格，包括基本价格、折扣价格、支付期限等。影响定价的主要因素有三个:需求、成本与竞争。

渠道：是指产品从生产企业流转到用户手上全过程中所经历的各个环节。

促销：是指企业通过销售行为的改变来刺激用户消费，以短期的行为(比如让利、买一送一，营销现场气氛等等)促成消费的增长，吸引其他品牌的用户或导致提前消费来促进销售的增长。广告、宣传推广、人员推销、销售促进是一个机构促销组合的四大要素。

5、逻辑树法

逻辑树又称问题树、演绎树或分解树等。它是把一个已知问题当成“主干”，然后开始考虑这个问题和哪些相关问题有关，也就是“分支”。逻辑树能保证解决问题的过程的完整性，它能将工作细分为便于操作的任务，确定各部分的优先顺序，明确地把责任落实到个人。

逻辑树的使用必须遵循以下三个原则：

要素化：把相同的问题总结归纳成要素。

框架化：将各个要素组织成框架。遵守不重不漏的原则。

关联化：框架内的各要素保持必要的相互关系，简单而不独立。

6、AARRR模型

AARRR模型是所有运营人员都要了解的一个数据模型，从整个用户生命周期入手，包括获取(Acquisition)、激活(Activition)、留存(Retention)、变现(Revenue)和传播(Refer)。

每个环节分别对应生命周期的5个重要过程，即从获取用户，到提升活跃度，提升留存率，并获取收入，直至最后形成病毒式传播。

数据挖掘的常用方法有哪些?

刘老师数据分析师

1、决策树法

决策树在解决归类与预测上有着极强的能力，它以法则的方式表达，而这些法则则以一连串的问题表示出来，经由不断询问问题最终能导出所需的结果。典型的决策树顶端是一个树根，底部有许多的树叶，它将纪录分解成不同的子集，每个子集中的字段可能都包含一个简单的法则。此外，决策树可能有着不同的外型，例如二元树、三元树或混和的决策树型态。

2、神经网络法

神经网络法是模拟生物神经系统的结构和功能，是一种通过训练来学习的非线性预测模型，它将每一个连接看作一个处理单元，试图模拟人脑神经元的功能，可完成分类、聚类、特征挖掘等多种数据挖掘任务。神经网络的学习方法主要表现在权值的修改上。其优点是具有抗干扰、非线性学习、联想记忆功能，对复杂情况能得到精确的预测结果;缺点首先是不适合处理高维变量，不能观察中间的学习过程，具有“黑箱”性，输出结果也难以解释;其次是需较长的学习时间。神经网络法主要应用于数据挖掘的聚类技术中。

3、关联规则法

关联规则是描述数据库中数据项之间所存在的关系的规则，即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现，即隐藏在数据间的关联或相互关系。在客户关系管理中，通过对企业的客户数据库里的大量数据进行挖掘，可以从大量的记录中发现有趣的关联关系，找出影响市场营销效果的关键因素，为产品定位、定价与定制客户群，客户寻求、细分与保持，市场营销与推销，营销风险评估和诈骗预测等决策支持提供参考依据。

4、遗传算法

遗传算法模拟了自然选择和遗传中发生的繁殖、交配和基因突变现象，是一种采用遗传结合、遗传交叉变异及自然选择等操作来生成实现规则的、基于进化理论的机器学习方法。它的基本观点是“适者生存”原理，具有隐含并行性、易于和其他模型结合等性质。主要的优点是可以处理许多数据类型，同时可以并行处理各种数据;缺点是需要的参数太多，编码困难，一般计算量比较大。遗传算法常用于优化神经元网络，能够解决其他技术难以解决的问题。

5、聚类分析法

聚类分析是把一组数据按照相似性和差异性分为几个类别，其目的是使得属于同一类别的数据间的相似性尽可能大，不同类别中的数据间的相似性尽可能小。根据定义可以把其分为四类：基于层次的聚类方法;分区聚类算法;基于密度的聚类算法;网格的聚类算法。常用的经典聚类方法有K-mean，K-medoids，ISODATA等。

6、模糊集法

模糊集法是利用模糊集合理论对问题进行模糊评判、模糊决策、模糊模式识别和模糊聚类分析。模糊集合理论是用隶属度来描述模糊事物的属性。系统的复杂性越高，模糊性就越强。

7、web页挖掘

通过对Web的挖掘，可以利用Web的海量数据进行分析，收集政治、经济、政策、科技、金融、各种市场、竞争对手、供求信息、客户等有关的信息，集中精力分析和处理那些对企业有重大或潜在重大影响的外部环境信息和内部经营信息，并根据分析结果找出企业管理过程中出现的各种问题和可能引起危机的先兆，对这些信息进行分析和处理，以便识别、分析、评价和管理危机。

8、逻辑回归分析

反映的是事务数据库中属性值在时间上的特征，产生一个将数据项映射到一个实值预测变量的函数，发现变量或属性间的依赖关系，其主要研究问题包括数据序列的趋势特征、数据序列的预测以及数据间的相关关系等。

9、粗糙集法

是一种新的处理含糊、不精确、不完备问题的数学工具，可以处理数据约简、数据相关性发现、数据意义的评估等问题。其优点是算法简单，在其处理过程中可以不需要关于数据的先验知识，可以自动找出问题的内在规律;缺点是难以直接处理连续的属性，须先进行属性的离散化。因此，连续属性的离散化问题是制约粗糙集理论实用化的难点。

10、连接分析

它是以关系为主体，由人与人、物与物或是人与物的关系发展出相当多的应用。例如电信服务业可藉连结分析收集到顾客使用电话的时间与频率，进而推断顾客使用偏好为何，提出有利于公司的方案。除了电信业之外，愈来愈多的营销业者亦利用连结分析做有利于企业的研究。