数据挖掘常用算法有哪些?

环球青藤 2021/03/02 02:36

1、C4.5算法,就是决策树算法,它创造性的可以在决策过程中就进行预剪枝,并且可以处理连续的属性,也可以对不完整的数据进行处理。

2、朴素贝叶斯模型是基于概率论的原理,它的思想是对未知物体分类的时候需要求解这个未知物体出现在各个条件下的概率,那个大就属于哪一类,比如天气和田七,文章中出现中药后出现田七的概率明显高于天气。

3、SVM又叫支持向量机,英文名是Support Vector Machine,简称SVM,适合超平面分类模型。

4、KNN也叫临近算法,就是每个样本可以用它最接近的K个邻居来代表,如果几个样本距离A 的范围很近,那样本都可以归属于A。

5、AdaBoost相当与一个联合提升算法,将多个效果弱的分类器一起联合使用以达到提升效果的目的。

6、Apriori是一种挖掘关联规则的算法,通过挖掘经常出现在一起的集合来揭示之间的关系。

7、CART代表分类和回归树,建立两棵树,一棵是分类树,一棵是回归树,属于一种决策学习的方法。

8、EM算法也称为大期望算法,是求参数最大似然估计的一种方法。原理是这样的,如果想要评估参数A和参数B,在开始的状态下二者都是未知的,但是知道了A可以得到B信息,反过来也是如此,可以先赋值A然后的到B的估值,然后从Bde估值重新计算A,过程持续,直到收敛为止。

9、K-Means算法是一个聚类算法,可以理解为先设置一个中心点,然后计算与中心的距离,距离那个近,就归属于那个类别。

10、PageRank是一种类似于论文影响力的计算方式,一篇论文呗引用的次数越多即代表他的影响力越强,goole搜索引擎ed排序方法也是类似的原理,这也是goole搜索引擎更能搜到你想要的内容的原因。

关于数据挖掘常用算法有哪些,青藤小编就和您分享到这里了。如果你对大数据工程有浓厚的兴趣,希望这篇文章能够对你有所帮助。如果您还想了解更多数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。

免费直播

    精选课程 更多

    注册电脑版

    版权所有 2003-2020 广州环球青藤科技发展有限公司