问答详情

统计学基础知识有哪些?

3860次观看
标签: 统计学 统计学基础知识
老师回答

1. 数学分析

本科统计学不学高等代数(至少中财是)学的是数学分析,数学分析注重理论推导过程,对于很多数学原理的理解很有帮助。虽然统计和数学不一样,但是统计需要数学。微积分知识是后续学习概率论的基础,概率论是整个统计学专业学习的基石,对于微积分的要求比较高,一定要熟练掌握。

2.高等代数

高等代数比线性代数难,内容更多,线性代数较为简单,本人本科学的是高等代数,涉及到的原理推导和知识更多,线性代数只是涉及到代数最基础的知识,对于后续学习概率论与数理统计课程的帮助不如高等代数明显。

3.概率论与数理统计

统计学必须学习的课程,各个高校选取的教材不一样,本人本科学的是卯时松版的课本,同时参考过浙江大学版的教材,卯时松版教材较难,对于深入理解概率论与数理统计帮助很大,很多原理性的东西可以掌握,课后习题难度较大。

免费直播

    相关推荐
    数据挖掘常用的方法有哪些?
    刘老师 数据分析师

    1、分类

    分类是找出数据库中的一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到摸个给定的类别中。可以应用到涉及到应用分类、趋势预测中,如淘宝商铺将用户在一段时间内的购买情况划分成不同的类,根据情况向用户推荐关联类的商品,从而增加商铺的销售量。

    主要的分类方法:决策树、KNN 法 (K-Nearest Neighbor)、SVM 法、VSM 法、Bayes 法、神经网络等。

    2、聚类

    聚类指事先并不知道任何样本的类别标号,按照对象的相似性和差异性,把一组对象划分成若干类,并且每个类里面对象之间的相似度较高,不同类里面对象之间相似度较低或差异明显。我们并不关心某一类是什么,我们需要实现的目标只是把相似的东西聚到一起,聚类是一种无监督学习。

    聚类的方法(算法):主要的聚类算法可以划分为如下几类,划分方法、层次方法、基于密度的方法、基于网格的方法、基于模型的方法。每一类中都存在着得到广泛应用的算法, 划分方法中有 k-means 聚类算法、层次方法中有凝聚型层次聚类算法、基于模型方法中有神经网络聚类算法。

    3、回归分析

    回归分析是一个统计预测模型,用以描述和评估因变量与一个或多个自变量之间的关系;反映的是事务数据库中属性值在时间上的特征,产生一个将数据项映射到一个实值预测变量的函数,发现变量或属性间的依赖关系。

    回归分析的应用:回归分析方法被广泛地用于解释市场占有率、销售额、品牌偏好及市场营销效果。它可以应用到市场营销的各个方面,如客户寻求、保持和预防客户流失活动、产品生命周期分析、销售趋势预测及有针对性的促销活动等。

    回归分析的主要研究问题:数据序列的趋势特征、数据序列的预测、数据间的相关关系等。

    4、关联规则

    关联规则是隐藏在数据项之间的关联或相互关系,即可以根据一个数据项的出现推导出其他数据项的出现。关联规则是描述数据库中数据项之间所存在的关系的规则。

    5、神经网络方法

    神经网络作为一种先进的人工智能技术,因其自身自行处理、分布存储和高度容错等特性非常适合处理非线性的问题,以及那些以模糊、不完整、不严密的知识或数据为特征的问题,它的这一特点十分适合解决数据挖掘的问题。

    6、Web数据挖掘

    web数据挖掘是一项综合性技术,指Web从文档结构和使用的集合C中发现隐含的模式P,如果将C看做是输入,P 看做是输出,那么Web 挖掘过程就可以看做是从输入到输出的一个映射过程。

    7、特征分析

    特征分析是从数据库中的一组数据中提取出关于这些数据的特征式,这些特征式表达了该数据集的总体特征。

    8、偏差分析

    偏差是数据集中的小比例对象。通常,偏差对象被称为离群点、例外、野点等。偏差分析就是发现与大部分其他对象不同的对象。

    数据分析惯用的5种思维方法是什么?
    刘老师 数据分析师

    一、对比法

    对比法就是用两组或两组以上的数据进行比较,是最通用的方法。

    我们知道孤立的数据没有意义,有对比才有差异。一些直接描述事物的变量,如长度、数量、高度、宽度等。通过对比得到比率数据,增速、效率、效益等指标,这才是数据分析时常用的。

    比如用于在时间维度上的同比和环比、增长率、定基比,与竞争对手的对比、类别之间的对比、特征和属性对比等。对比法可以发现数据变化规律,使用频繁,经常和其他方法搭配使用。

    二、象限法

    通过对两种及以上维度的划分,运用坐标的方式表达出想要的价值。由价值直接转变为策略,从而进行一些落地的推动。象限法是一种策略驱动的思维,常于产品分析、市场分析、客户管理、商品管理等。

    三、二八法/帕累托分析

    二八法也可以叫帕累托法则,源于经典的二八法则。比如在个人财富上可以说世界上20%的人掌握着80%的财富。而在数据分析中,则可以理解为20%的数据产生了80%的效果需要围绕这20%的数据进行挖掘。往往在使用二八法则的时候和排名有关系,排在前20%的才算是有效数据。二八法是抓重点分析,适用于任何行业。找到重点,发现其特征,然后可以思考如何让其余的80%向这20%转化,提高效果。

    一般地,会用在产品分类上,去测量并构建ABC模型。比如某零售企业有500个SKU以及这些SKU对应的销售额,那么哪些SKU是重要的呢,这就是在业务运营中分清主次的问题。

    常见的做法是将产品SKU作为维度,并将对应的销售额作为基础度量指标,将这些销售额指标从大到小排列,并计算截止当前产品SKU的销售额累计合计占总销售额的百分比。

    百分比在 70%(含)以内,划分为 A 类。

    百分比在 70~90%(含)以内,划分为 B 类。

    百分比在 90~100%(含)以内,划分为 C 类。

    以上百分比也可以根据自己的实际情况调整。

    ABC分析模型,不光可以用来划分产品和销售额,还可以划分客户及客户交易额等。比如给企业贡献80%利润的客户是哪些,占比多少。假设有20%,那么在资源有限的情况下,就知道要重点维护这20%类客户。

    四、漏斗法

    漏斗法即是漏斗图,有点像倒金字塔,是一个流程化的思考方式,常用于像新用户的开发、购物转化率这些有变化和一定流程的分析中。

    五、公式法

    所谓公式法就是针对某个指标,用公式层层分解该指标的影响因素。

    举例:分析某产品的销售额较低的原因,用公式法分解:

    ①某产品销售额=销售量 X 产品单价

    ②销售量=渠道A销售量 + 渠道B销售量 + 渠道C销售量 + …

    ③渠道销售量=点击用户数 X 下单率

    ④点击用户数=曝光量 X 点击率

    第一层:找到产品销售额的影响因素。某产品销售额=销售量 X 产品单价。是销量过低还是价格设置不合理?

    第二层:找到销售量的影响因素。分析各渠道销售量,对比以往,是哪些过低了。

    第三层:分析影响渠道销售量的因素。渠道销售量=点击用户数X 下单率。是点击用户数低了,还是下单量过低。如果是下单量过低,需要看一下该渠道的广告内容针对的人群和产品实际受众符合度高不高。

    第四层:分析影响点击的因素。点击用户数=曝光量X点击率。是曝光量不够还是点击率太低,点击率低需要优化广告创意,曝光量则和投放的渠道有关。

    通过对销售额的逐层拆解,细化评估以及分析的粒度。

    公式拆解法是针对问题的层级式解析,在拆解时,对因素层层分解,层层剥尽。

    如何高效的运用网站分析工具?
    刘老师 数据分析师

    1、工具使用第一重:仅仅是页面流数据

    很多人把工具生成的代码往网站页面上一贴,认为网站的跟踪代码配置就基本完成了。但事情并没有那么简单,分析系统中生成的跟踪代码只能简单的跟踪页面流的数据,比如访问数、浏览量、流量来源等等,用户与网站的交互行为比如表单提交、订单达成是无法跟踪得到的。

    网站的跟踪代码应该要根据具体的网站业务需求来配置跟踪方案。在添加跟踪代码前需要相关的业务人员聚在一起讨论把数据跟踪需求整理出来,根据需求形成一个完成的跟踪方案,从而生成相应的跟踪代码并添加到网站中。

    很多网站甚至是一部分电商网站都只是做到了这一步,但其实这远远没有把网站跟踪系统的功能发挥出来。

    因为受限跟踪配置的内容,系统只能收集到页面流的数据,因此用户也只能简单地查看网站的访问数、页面的浏览量以及流量来源的相关数据,但用户来到了网站有没有一些非浏览量的交互行为,是否有产生订单或产生了哪些产品的订单,无从得知。因此也没有明确的指标用于指导网站优化和外部推广(仅有的跳出率是不够的)。

    2、工具使用第二重:配置了目标或电子商务跟踪

    有部分用户在页面流数据跟踪的基础上会增加目标与电子商务数据的跟踪配置,这就进入我们所说的“网站分析第二重”。

    目标与电子商务数据是衡量网站绩效的重要指标。对于会员制的电商网站来说,一个非常重要的目标就是会员数据的增加,而电子商务销售则是网站的终极目标。对这两块数据进行跟踪,我们就可以很好地衡量网站与及流量来源的转化情况。

    把目标与电子商务的数据跟踪起来后,我们就可以把转化的数据与流量来源及页面浏览行为相关联,我们就可以很好地分析网站流量来源与页面浏览行为的转化情况。从而知道从哪些流量来源过来的流量质量最高,哪些产品或页面的说服力更强可以吸引用户完成订单转化,这样我们就可以有针对性地增加那些转化率高的流量来源的流量,并对一些转化偏低的产品或页面进行优化。

    3、工具使用第三重:完善了访问行为细节的跟踪与分析

    在这个分类下你会较为注重对于用户行为细节的跟踪,从而配置相应的自定义事件跟踪。对于用户在网站上的一些行为我们可以系统性地进行跟踪,比如站内搜索、视频播放、文件下载、表单提交、404错误页面、导出链接的点击、评论提交等等行为我们都可以跟踪起来,从而更好地了解访客的访问行为以提升网站的访问体验和转化率。

    如第二重的内容所说的,你可能会把注册成功作为网站的目标,除了跟踪注册提交成功的事件外,你还可以跟踪注册的方式(是否通过第三方工具帐号进行注册)、注册提交失败的次数与及失败的原因等等。

    除了订单产生的数量,购买流程中每一步的微转化也是值得关注的,找出转化流程中的弱项和问题,想办法修复它,这对于销售的提升效果将是非常明显的。

    对于电商网站来说,用户是否有点击站内广告的行为,从而购买广告推介的产品,我们要怎么完善我们的产品推荐系统,这些都需要数据作支持。

    我们还强烈建议可以对站内搜索与搜索零结果(搜索结果的条目数量)的情况进行跟踪,从而衡量网站的产品或内容是否满足用户的搜索需求,从而增加相应的产品或内容以提升网站销售。而对于一个客服系统来说,优化好这一步,这有可能会大幅减少客服人员的工作量。

    4、工具使用第四重:基于数据的网站优化—数据驱动营销

    在前边三部分其实也应该把网站优化的工作纳入其中,但对于大多数公司来说,网站优化这一步大都做得不好或是做得不够系统。而网站优化是网站运营过程中不可或缺的一个重要环节。

    很多人做的网站分析报告仅仅是停留在报告的层面而没有形成优化行动,这就失去了网站分析的意义。根据报告中提出的有效建议,可以考虑安排进行营销活动或页面内容的优化工作。

    通过数据分析找出更优的推广渠道;同时对内容特别是着陆页面的内容进行A/B/N测试,找出最优的页面版本,这将可以有效地提升网站的转化率从而提升网站的销售!这是网站分析对于提升网站业绩的最直观体现。

    注册电脑版

    版权所有 2003-2020 广州环球青藤科技发展有限公司