数据挖掘中的分类技术

2020/09/28 20:35

数据挖掘中的分类技术

KNN（K最近邻算法）

算法核心：如果一个样本在特征空间中K个最相似的样本中的大多数属于一个类别，则该样本也属于这个类别，并具有这个类别的特征

在确定分类时只依靠最邻近的一个或几个样本的类别来决定待分样本所属类别，在做决策时只与极少数的相邻样本有关

由于KNN方法主要依靠周围有限的临近样本，而不是依靠判别类域的方法来确定样本所属类别。对于类域交叉或重叠较多的待分样本集来说，KNN方法较其他方法更合适

决策树

决策树要解决的问题是用哪些属性充当这棵树的各个节点的问题，决策树按分裂标准不同可以分为基于信息论的方法和基于最小GINI指标方法

神经网络

神经网络的学习是一个过程，并按照一定的规则（学习算法）调整各层的权值矩阵，待网络各层权值都收敛到一定值，学习过程结束

支持向量机（SVM）

尽量把样本中从更高维度看起来在一起的样本合在一起

支持向量机的目的是找到一个最优超平面，使分类间隔最大。最优超平面就是要求分类面不但能将两类正确分开，而且使分类间隔最大

在两类样本中离分类面最近且位于平行于最优超平面上的点就是支持向量，为找到最优超平面，只要找到所有的支持向量即可

对于非线形支持向量机，通常做法为把线形不可分转换成线形可分，通过一个非线形映射将低维输入空间中的数据特征映射到高维。

免费直播

精选课程更多

VBA实战速成：从零到一的突破

数据分析师 62次课共11学时

吴开斌

吴开斌

火热报名中

WPS高效数据管理

数据分析师 17次课共4学时

王忠超

王忠超

火热报名中

Fine BI 商业智能数据分析

数据分析师 27次课共6学时

王忠超

王忠超

火热报名中

【Excel 高效应用:HR 数字化管理实战】

数据分析师 30次课共3学时

王忠超

王忠超

火热报名中

Power BI 轻松入门：零基础到数据大师

数据分析师 23次课共49学时

吴开斌

吴开斌

火热报名中

Excel函数大师班：效率与精通的融合

数据分析师 62次课共62学时

吴开斌

吴开斌

火热报名中

0基础入门数据分析5天训练营

数据分析师 5次课共4学时

曹峥

张玮

11612人已报名

Power Bl 商务智能数据分析

数据分析师 37次课共10学时

王忠超

王忠超

火热报名中

Excel综合应用案例-进销存、工资管理、应收账款、员工信息人事表

数据分析师 66次课共11学时

吴开斌

吴开斌

火热报名中

Excel入门到精通

数据分析师 12次课共10学时

高老师

高老师

火热报名中

查看更多课程

相关推荐

热门推荐

最新推荐

登录｜注册｜电脑版

版权所有 2003-2020 广州环球青藤科技发展有限公司