问答详情

数据挖掘技术具有哪些特点?

752次观看
标签: 数据挖掘技术特点 数据挖掘技术
老师回答

①基于大量数据

并非说小数据量上就不可以进行挖掘,实际上大多数数据挖掘的算法都可以在小数据量上运行并得到结果。但是,一方面过小的数据量完全可以通过人工分析来总结规律,另一方面来说,小数据量常常无法反映出真实世界中的普遍特性。

②非平凡性

所谓非平凡,指的是挖掘出来的知识应该是不简单的,绝不能是类似某著名体育评论员所说的“经过我的计算,我发现了一个有趣的现象,到本场比赛结束为止,这届世界杯的进球数和失球数是一样的。非常的巧合!”那种知识。这点看起来勿庸赘言,但是很多不懂业务知识的数据挖掘新手却常常犯这种错误。

③隐含性

数据挖掘是要发现深藏在数据内部的知识,而不是那些直接浮现在数据表面的信息。常用的BI工具,例如报表和OLAP,完全可以让用户找出这些信息。

④新奇性

挖掘出来的知识应该是以前未知的,否则只不过是验证了业务专家的经验而已。只有全新的知识,才可以帮助企业获得进一步的洞察力。

⑤价值性

挖掘的结果必须能给企业带来直接的或间接的效益。有人说数据挖掘只是“屠龙之技”,看起来神乎其神,却什么用处也没有。这只是一种误解,不可否认的是在一些数据挖掘项目中,或者因为缺乏明确的业务目标,或者因为数据质量的不足,或者因为人们对改变业务流程的抵制,或者因为挖掘人员的经验不足,都会导致效果不佳甚至完全没有效果。但大量的成功案例也在证明,数据挖掘的确可以变成提升效益的利器。

免费直播

    相关推荐
    数据挖掘免费软件工具有哪些?
    刘老师 数据分析师

    1.Rapid Miner

    Rapid Miner,原名YALE又一个学习环境,是一个用于机器学习和数据挖掘实验的环境,用于研究和实际的数据挖掘任务。毫无疑问,这是世界领先的数据挖掘开源系统。该工具以Java编程语言编写,通过基于模板的框架提供高级分析。

    它使得实验可以由大量的可任意嵌套的操作符组成,这些操作符在XML文件中是详细的,并且是由快速的Miner的图形用户界面完成的。最好的是用户不需要编写代码。它已经有许多模板和其他工具,让我们可以轻松地分析数据。

    2. IBM SPSS Modeler

    IBM SPSS Modeler工具工作台最适合处理文本分析等大型项目,其可视化界面非常有价值。 它允许您在不编程的情况下生成各种数据挖掘算法。 它也可以用于异常检测、贝叶斯网络、CARMA、Cox回归以及使用多层感知器进行反向传播学习的基本神经网络。

    3.Oracle Data Mining

    Oracle。 作为“高级分析数据库”选项的一部分,Oracle数据挖掘功能允许其用户发现洞察力,进行预测并利用其Oracle数据。您可以构建模型来发现客户行为目标客户和开发概要文件。

    Oracle Data Miner GUI使数据分析师、业务分析师和数据科学家能够使用相当优雅的拖放解决方案处理数据库内的数据。 它还可以为整个企业的自动化、调度和部署创建SQL和PL / SQL脚本。

    如何高效的运用网站分析工具?
    刘老师 数据分析师

    1、工具使用第一重:仅仅是页面流数据

    很多人把工具生成的代码往网站页面上一贴,认为网站的跟踪代码配置就基本完成了。但事情并没有那么简单,分析系统中生成的跟踪代码只能简单的跟踪页面流的数据,比如访问数、浏览量、流量来源等等,用户与网站的交互行为比如表单提交、订单达成是无法跟踪得到的。

    网站的跟踪代码应该要根据具体的网站业务需求来配置跟踪方案。在添加跟踪代码前需要相关的业务人员聚在一起讨论把数据跟踪需求整理出来,根据需求形成一个完成的跟踪方案,从而生成相应的跟踪代码并添加到网站中。

    很多网站甚至是一部分电商网站都只是做到了这一步,但其实这远远没有把网站跟踪系统的功能发挥出来。

    因为受限跟踪配置的内容,系统只能收集到页面流的数据,因此用户也只能简单地查看网站的访问数、页面的浏览量以及流量来源的相关数据,但用户来到了网站有没有一些非浏览量的交互行为,是否有产生订单或产生了哪些产品的订单,无从得知。因此也没有明确的指标用于指导网站优化和外部推广(仅有的跳出率是不够的)。

    2、工具使用第二重:配置了目标或电子商务跟踪

    有部分用户在页面流数据跟踪的基础上会增加目标与电子商务数据的跟踪配置,这就进入我们所说的“网站分析第二重”。

    目标与电子商务数据是衡量网站绩效的重要指标。对于会员制的电商网站来说,一个非常重要的目标就是会员数据的增加,而电子商务销售则是网站的终极目标。对这两块数据进行跟踪,我们就可以很好地衡量网站与及流量来源的转化情况。

    把目标与电子商务的数据跟踪起来后,我们就可以把转化的数据与流量来源及页面浏览行为相关联,我们就可以很好地分析网站流量来源与页面浏览行为的转化情况。从而知道从哪些流量来源过来的流量质量最高,哪些产品或页面的说服力更强可以吸引用户完成订单转化,这样我们就可以有针对性地增加那些转化率高的流量来源的流量,并对一些转化偏低的产品或页面进行优化。

    3、工具使用第三重:完善了访问行为细节的跟踪与分析

    在这个分类下你会较为注重对于用户行为细节的跟踪,从而配置相应的自定义事件跟踪。对于用户在网站上的一些行为我们可以系统性地进行跟踪,比如站内搜索、视频播放、文件下载、表单提交、404错误页面、导出链接的点击、评论提交等等行为我们都可以跟踪起来,从而更好地了解访客的访问行为以提升网站的访问体验和转化率。

    如第二重的内容所说的,你可能会把注册成功作为网站的目标,除了跟踪注册提交成功的事件外,你还可以跟踪注册的方式(是否通过第三方工具帐号进行注册)、注册提交失败的次数与及失败的原因等等。

    除了订单产生的数量,购买流程中每一步的微转化也是值得关注的,找出转化流程中的弱项和问题,想办法修复它,这对于销售的提升效果将是非常明显的。

    对于电商网站来说,用户是否有点击站内广告的行为,从而购买广告推介的产品,我们要怎么完善我们的产品推荐系统,这些都需要数据作支持。

    我们还强烈建议可以对站内搜索与搜索零结果(搜索结果的条目数量)的情况进行跟踪,从而衡量网站的产品或内容是否满足用户的搜索需求,从而增加相应的产品或内容以提升网站销售。而对于一个客服系统来说,优化好这一步,这有可能会大幅减少客服人员的工作量。

    4、工具使用第四重:基于数据的网站优化—数据驱动营销

    在前边三部分其实也应该把网站优化的工作纳入其中,但对于大多数公司来说,网站优化这一步大都做得不好或是做得不够系统。而网站优化是网站运营过程中不可或缺的一个重要环节。

    很多人做的网站分析报告仅仅是停留在报告的层面而没有形成优化行动,这就失去了网站分析的意义。根据报告中提出的有效建议,可以考虑安排进行营销活动或页面内容的优化工作。

    通过数据分析找出更优的推广渠道;同时对内容特别是着陆页面的内容进行A/B/N测试,找出最优的页面版本,这将可以有效地提升网站的转化率从而提升网站的销售!这是网站分析对于提升网站业绩的最直观体现。

    注册电脑版

    版权所有 2003-2020 广州环球青藤科技发展有限公司