数据分析常见流程有哪些?

1071次观看

标签：数据分析常见流程数据分析

以下回答来自环球青藤，点击开启技能学习>

老师回答

刘老师数据分析师

1、为什么分析?

首先，你得知道为什么分析?弄清楚此次数据分析的目的。比如，什么类型的客户交货期总是拖延。你所有的分析都的围绕这个为什么来回答。避免不符合目标反复返工，这个过程会很痛苦。

2、分析目标是谁?

要牢记清楚的分析因子，统计维度是金额，还是产品，还是供应商行业竞争趋势，还是供应商规模等等。避免把金额当产品算，把产品当金额算，算出的结果是差别非常大的。

3、想达到什么效果?

通过分析各个维度产品类型，公司采购周期，采购条款，找到真正的问题。例如这次分析的薄弱环节供应商，全部集中采购，和保持现状，都不符合利益最大化原则。通过分析，找到真正的问题根源，发现精细化采购管理已经非常必要了。

4、需要哪些数据?

采购过程涉及的数据，很多，需要哪些源数据?采购总额?零部件行业竞争度?货款周期?采购频次?库存备货数?客户地域因子?客户规模?等等列一个表。避免不断增加新的因子。

5、如何采集?

数据库中供应商信息采集,平时供应商各种信息录入,产品特性录入等,做数据分析一定要有原料,否则巧妇难为无米之炊。

6、如何整理?

整理数据是门技术活。不得不承认EXCEL是个强大工具，数据透视表的熟练使用和技巧，作为支付数据分析必不可少，各种函数和公式也需要略懂一二，避免低效率的数据整理。Spss也是一个非常优秀的数据处理工具，特别在数据量比较大，而且当字段由特殊字符的时候，比较好用。

7、如何分析?

整理完毕，如何对数据进行综合分析，相关分析?这个是很考验逻辑思维和推理能力的。同时分析推理过程中，需要对产品了如指掌，对供应商很了解，对采购流程很熟悉。看似一个简单的数据分析，其实是各方面能力的体现。首先是技术层面，对数据来源的抽取-转换-载入原理的理解和认识;其实是全局观，对季节性、公司等层面的业务有清晰的了解;最后是专业度，对业务的流程、设计等了如指掌。练就数据分析的洪荒之力并非一朝一夕之功，而是在实践中不断成长和升华。一个好的数据分析应该以价值为导向，放眼全局、立足业务，用数据来驱动增长。

8、如何展现和输出?

数据可视化也是一个学问。如何用合适的图表表现?每一种图表的寓意是什么?下面列举下常用的8个图表：

1)折线图：合适用于随时间而变化的连续数据，例如随时间收入变化，及增长率变化。

2)柱型图：主要用来表示各组数据之间的差别。主要有二维柱形图、三维柱形图、圆柱图、圆锥图和棱锥图。

3)堆积柱形图：堆积柱形图不仅可以显示同类别中每种数据的大小，还可以显示总量的大小。

4)线-柱图：这种类型的图不仅可以显示出同类别的比较，还可以显示出趋势情况。

5)条形图：类似于横向的柱状图，和柱状图的展示效果相同，主要用于各项类的比较。

6)饼图：主要显示各项占比情况。饼图一般慎用，除非占比区别非常明显。因为肉眼对对饼图的占比比例分辨并不直观。而且饼图的项，一般不要超过6项。6项后建议用柱形图更为直观。

7)复合饼图：一般是对某项比例的下一步分析。

8)母子饼图：可直观地分析项目的组成结构与比重

图表不必太花哨，一个表说一个问题就好。用友好的可视化图表，节省阅读者的时间，也是对阅读者的尊重。

有一些数据，辛辛苦苦做了整理和分析，最后发现对结论输出是没有关系的，虽然做了很多工作，但不能为了体现工作量而堆砌数据。

在展现的过程中，请注明数据的来源，时间，指标的说明，公式的算法，不仅体现数据分析的专业度，更是对报告阅读者的尊重。

©本文版权归环球青藤所有，任何形式转载请联系我们。

免费直播

精选课程

0基础入门数据分析5天训练营（cep）

数据分析师 5次课共4学时

曹峥

张玮

¥ 8

¥ 1

火热报名中

Excel常用技巧助你高效办公

数据分析师 3次课共3学时

张玮

¥ 29

火热报名中

职场数据分析训练营-办公效率班

数据分析师 40次课共30学时

曹峥

¥ 2299

火热报名中

Power BI 轻松入门：零基础到数据大师

数据分析师 23次课共49学时

吴开斌

¥ 399

火热报名中

Excel入门到精通

数据分析师 12次课共10学时

高老师

¥ 199

火热报名中

MOS微软国际认证考试

数据分析师 30次课共1学时

高老师

¥ 600-3000

火热报名中

VBA实战速成：从零到一的突破

数据分析师 62次课共11学时

吴开斌

¥ 1299

火热报名中

WPS高效数据管理

数据分析师 17次课共4学时

王忠超

¥ 1299

火热报名中

Fine BI 商业智能数据分析

数据分析师 27次课共6学时

王忠超

¥ 1299

火热报名中

【Excel 高效应用:HR 数字化管理实战】

数据分析师 30次课共3学时

王忠超

相关推荐

1、态度严谨负责

严谨负责是数据分析师的必备素质之一，只有奔着严谨负责的态度，才能保证数据的客观、准确。在企业里，数据分析师可以说是企业的医生，他们通过对企业运营数据的分析，为企业寻找症结的问题。

2、好奇心强烈

好奇心热皆有之，但是作为数据分析师，这份好奇心就应该更加强烈，要积极主动地发现挖掘隐藏在数据内部的真相。在数据分析师的脑子里，应该充满着无数个“为什么”，为什么是这样的结果，为什么不是那样的结果，导致这个结果的原因是什么，为什么结果是不预期的那样等等，这一系列问题都要在进行分析时提出来，并且通过通过数据分析给自己一个满意的答案。

3、逻辑思维清晰

除了一颗探索真相的好奇心，数据分析师还需要具备缜密的思维和清晰的逻辑推理能力。

通常从事数据分析时所面对的商业问题较为复杂，要考虑错综复杂的成因，分析所面对的各种复杂的环境因素，并在若干发展可能性中选择一个最优的方向。这就需要数据分析师对事实的足够了解，同时也是需要真正理清问题的整体以及局部的结构进而理清结构中相互的逻辑关系。

4、擅长模仿

在做数据分析时，有自己的想法固然重要，但是“前车之鉴”也是非常有必要学习的，它能帮助数据分析师迅速的成长，因此，模仿是快速提高学习成果的有效方法。模仿主要是参考他人优秀的思路和方法，成功的模仿需要领会他人方法的精髓，理解其成分析原理。

5、勇于创新

通过模仿可以借鉴他人的成功经验，但模仿时间不宜太长，每次模仿后都要进行总结，提升可以改进的地方，甚至要有所创新。创新是一个优秀数据分析师应具备的精神，只有不断创新，才能提高自己的分析水平。

让大数据分析更有效的5种技术措施有哪些?

刘老师数据分析师

(1)优化数据收集

数据收集是最终导致业务决策的事件链中的第一步，确保收集的数据和业务感兴趣的指标的相关性非常重要。

定义对企业有影响的数据类型，以及分析如何增加价值。基本上，考虑客户行为，以及这将对企业的业务有何适用性，然后使用此数据进行分析。

存储和管理数据是数据分析中的重要一步。因此，必须保持数据质量和分析效率。

(2)清除垃圾数据

垃圾数据是大数据分析的祸患。这包括不准确，冗余或不完整的客户信息，可能会对算法造成严重破坏，并导致分析结果不佳。根据垃圾数据做出的决策可能会带来麻烦。

清洁数据至关重要，涉及丢弃不相关的数据，只保留高品质的数据，当前，为了获得完整和相关的数据，人工干预不是理想的模式，不可持续并且受主观影响，因此数据库本身需要被清理。这种类型的数据以各种方式渗透到系统中，其中包括随时间推移而变化，如更改客户信息或数据仓库中存储可能会损坏数据集。垃圾数据可能会对营销和潜在客户生产等行业产生明显的影响，但通过基于故障信息的业务决策，财务和客户关系也会受到不利影响。其后果也是广泛的，包括挪用资源，浪费时间和精力。

解决垃圾数据难题的方法是确保数据进入系统得到干净的控制。具体来说，重复免费，完整和准确的信息。如今，那些具有专门从事反调试技术和清理数据的应用程序和企业，可以对任何对大数据分析感兴趣的公司进行调查。数据清洁是市场营销人员的首要任务，因为数据质量差的连锁效应可能会大大提高企业成本。

为了获得最大的数据量，企业必须花时间确保质量足以准确地查看业务决策和营销策略。

(3)标准化数据集

在大多数商业情况下，数据来自各种来源和各种格式。这些不一致可能转化为错误的分析结果，这将会大大扭曲统计推断结果。为了避免这种可能性，必须决定数据的标准化框架或格式，并严格遵守。

(4)数据整合

大多数企业如今组成不同的自治部门，因此许多企业都有隔离的数据存储库或数据“孤岛”。这是具有挑战性的，因为来自一个部门的客户信息的更改将不会转移到另一个部门，因此他们将根据不准确的源数据进行决策。

为了解决这个问题，采用中央数据管理平台是必要的，整合所有部门，从而确保数据分析的准确性更高，所有部门的任何变化都可以立即访问。

(5)数据隔离

即使数据干净，将其组织和集成在一起，也可能是分析问题。在这种情况下，将数据分成几组是有帮助的，同时牢记分析正在尝试实现什么。这样，可以分析子群体内的趋势，这些趋势可能更有意义并具有更大的价值。当查看可能与整个数据集可能无关的高度具体的趋势和行为时尤其如此。

数据质量对大数据分析至关重要。许多公司试图采用分析软件，但却没有考虑到进入系统做什么。这将导致不准确的推断和解释，可能代价昂贵，并且对企业造成损害。一个定义明确，管理良好的数据库管理平台是使用大数据分析的企业不可或缺的工具。

大数据核心算法有哪些?

刘老师数据分析师

1、A* 搜索算法——图形搜索算法，从给定起点到给定终点计算出路径。其中使用了一种启发式的估算，为每个节点估算通过该节点的最佳路径，并以之为各个地点排定次序。算法以得到的次序访问这些节点。因此，A*搜索算法是最佳优先搜索的范例。

2、集束搜索(又名定向搜索，Beam Search)——最佳优先搜索算法的优化。使用启发式函数评估它检查的每个节点的能力。不过，集束搜索只能在每个深度中发现最前面的m个最符合条件的节点，m是固定数字——集束的宽度。

3、二分查找(Binary Search)——在线性数组中找特定值的算法，每个步骤去掉一半不符合要求的数据。

4、分支界定算法(Branch and Bound)——在多种最优化问题中寻找特定最优化解决方案的算法，特别是针对离散、组合的最优化。

5、Buchberger算法——一种数学算法，可将其视为针对单变量最大公约数求解的欧几里得算法和线性系统中高斯消元法的泛化。

6、数据压缩——采取特定编码方案，使用更少的字节数(或是其他信息承载单元)对信息编码的过程，又叫来源编码。

7、Diffie-Hellman密钥交换算法——一种加密协议，允许双方在事先不了解对方的情况下，在不安全的通信信道中，共同建立共享密钥。该密钥以后可与一个对称密码一起，加密后续通讯。

8、Dijkstra算法——针对没有负值权重边的有向图，计算其中的单一起点最短算法。

9、离散微分算法(Discrete differentiation)。