这种分析方法也称为“T 测试”, 可将所拥有的数据与假设进行比较。它还可以预测可能做出的决策将如何影响您的业务。T 测试可以比较两个变量, 以找到相关性, 并根据结果做出决策。例如, 实际业务中可能会假设更多的工作时间相当于更高的生产率。在实施延长工作时间之前, 重要的是要确保有真正的效果, 以避免造成不好的反作用。

3.蒙特卡洛模拟

作为计算不可预知变量对特定因子影响的最常用方法之一, 蒙特卡罗模拟使用概率建模来帮助预测风险和不确定性。为了测试假设或场景, 蒙特卡洛模拟将使用随机数和数据, 根据任何结果对任何情况进行各种可能的结果进行分析。这是一个非常有用的数据分析方法，可以跨越多个领域应用，包括项目管理、财务、工程、物流等等。通过测试各种可能性，可以了解随机变量如何影响您的计划和项目。

4.内容分析

这种方法有助于了解定性数据中出现的总体主题。使用词云图颜色编码特定主题和想法等技术有助于分析文本数据，以找到最常见的线程。在处理用户反馈、访谈数据、开放式调查等数据时，内容分析可以很好地工作。这有助于确定需要改进的最重要领域。

5.叙事分析

叙事分析主要包含五个要素，即行动(act)、场景(scene)、行动者(agent)、能动性(agency)和目的(purpose)。这种分析侧重于故事和想法在整个公司的沟通方式，可以帮助你更好地了解组织文化。这可能包括解释员工对其工作的感受、客户对组织的看法以及如何查看运营流程。它在考虑改变企业文化或规划新的营销策略时非常有用。

没有统计分析的黄金标准，也没有绝对正确的方法。选择的方法应始终反映收集的数据以及要提取的解决方案类型。匹配正确的数据和分析有助于发现更好的方案，以优化企业的业务，对企业业务进行数字化变革。

数据挖掘中实用分析方法有哪些?

刘老师数据分析师

1.基于历史的MBR分析

基于历史(Memory-Based Reasoning)的MBR分析方法最主要的概念是用已知的案例(case)来预测未来案例的一些属性(attribute)，通常找寻最相似的案例来做比较。

MBR中有两个主要的要素，分别为距离函数(distance function)与结合函数(combination function)。距离函数的用意在找出最相似的案例;结合函数则将相似案例的属性结合起来，以供预测之用。

MBR的优点是它容许各种型态的数据，这些数据不需服从某些假设。另一个优点是其具备学习能力，它能藉由旧案例的学习来获取关于新案例的知识。较令人诟病的是它需要大量的历史数据，有足够的历史数据方能做良好的预测。此外记忆基础推理法在处理上亦较为费时，不易发现最佳的距离函数与结合函数。其可应用的范围包括欺骗行为的侦测、客户反应预测、医学诊疗、反应的归类等方面。

2.购物篮分析

购物篮分析(Market Basket Analysis)最主要的目的在于找出什么样的东西应该放在一起商业上的应用在藉由顾客的购买行为来了解是什么样的顾客以及这些顾客为什么买这些产品，找出相关的联想(association)规则，企业藉由这些规则的挖掘获得利益与建立竞争优势。举例来说，零售店可藉由此分析改变置物架上的商品排列或是设计吸引客户的商业套餐等等。

购物篮分析基本运作过程包含下列三点：

选择正确的品项：这里所指的正确乃是针对企业体而言，必须要在数以百计、千计品项中选择出真正有用的品项出来。

经由对共同发生矩阵(co-occurrence matrix)的探讨挖掘出联想规则。

克服实际上的限制：所选择的品项愈多，计算所耗费的资源与时间愈久(呈现指数递增)，此时必须运用一些技术以降低资源与时间的损耗。

购物篮分析技术可以应用在下列问题上：针对信用卡购物，能够预测未来顾客可能购买什么。对于电信与金融服务业而言，经由购物篮分析能够设计不同的服务组合以扩大利润。保险业能藉由购物篮分析侦测出可能不寻常的投保组合并作预防。对病人而言，在疗程的组合上，购物篮分析能作为是否这些疗程组合会导致并发症的判断依据。

3.决策树

决策树(Decision Trees)在解决归类与预测上有着极强的能力，它以法则的方式表达，而这些法则则以一连串的问题表示出来，经由不断询问问题最终能导出所需的结果。典型的决策树顶端是一个树根，底部有许多的树叶，它将纪录分解成不同的子集，每个子集中的字段可能都包含一个简单的法则。此外，决策树可能有着不同的外型，例如二元树、三元树或混和的决策树型态。

4.遗传算法

遗传算法(Genetic Algorithm)学习细胞演化的过程，细胞间可经由不断的选择、复制、交配、突变产生更佳的新细胞。基因算法的运作方式也很类似，它必须预先建立好一个模式，再经由一连串类似产生新细胞过程的运作，利用适合函数(fitness function)决定所产生的后代是否与这个模式吻合，最后仅有最吻合的结果能够存活，这个程序一直运作直到此函数收敛到最佳解。基因算法在群集 (cluster)问题上有不错的表现，一般可用来辅助记忆基础推理法与类神经网络的应用。

5.聚类分析

聚类分析(Cluster Detection)这个技术涵盖范围相当广泛，包含基因算法、类神经网络、统计学中的群集分析都有这个功能。它的目标为找出数据中以前未知的相似群体，在许许多多的分析中，刚开始都运用到群集侦测技术，以作为研究的开端。