如何成为一名中级数据分析师

2020/06/24 04:21
中级数据分析师:在初级的要求基础上,要求掌握多元统计、时间序列、数据挖掘等理论知识,掌握高级数据分析方法与数据挖掘算法,能够熟练运用 SPSS Moderler、SAS、Python、R 等至少一门专业分析软件,熟悉适用 SQL 访问企业数据库,结合业务,能从海量数据提取相关信息,从不同维度进行建模分析,形成逻辑严密能够体现整体数据挖掘流程化的数据分析报告。

就业方向:政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与数据挖掘的人员

方法/步骤

数据库技术(必修):用 SQL 访问企业数据库,结合业务,能从海量数据提取相关信息,从不同维度进行建模分析,形成逻辑严密能够体现整体数据挖掘流程化的数据分析报告;简单了解关系型数据库与非关系型数据库的关系,数据库增删改查,高级查询,高级应用

实用型大数据挖掘算法、(Apriori 算法、Tanagra 工具、决策树):深入浅出数据挖掘技术。所谓“深入”,指得是从数据挖掘的原理与经典算法入手。其一是要了解算法,知道什么场景应当应用什么样的方法;其二是学习算法的经典思想,可以将它应用到其他的实际项目之中;其三是理解算法,让数据挖掘的算法能够应用到您的项目开发之中去。所谓“浅出”,指得是将数据挖掘算法的应用落实到实际的应用中。课程会通过三个不同的方面来讲解算法的应用:一是微软公司的 SQL Server 与 Excel 等工具实现的数据挖掘;二是著名开源算法的数据挖掘,如 Weka等开源工具;三是利用 Java、C#语言两种语言做演示来完成数据挖掘算法的实现。

SPSS Modeler 数据挖掘:将挖掘技术所涉及的思想、方法、参数与统计学基础联系起来,了解包括维度、数据、分析、数据流等在内的功能、参数的实际义和选择、组合等应用方法。

Python 网络爬虫技术 :掌握应用 Python 爬虫基础库;掌握使用 Python 爬虫利器;掌握使用 Scrapy 项目构建;熟练掌握 Scrapy 流化开发;熟练使用 Scrapy 拓展;掌握使用 Scrapy 与 Mysql 交互。

机器学习扩展深入(Python 语言、算法、Numpy 库、MatplotLib):两大类机器学习的方法:有监督学习和无监督学习,其中有监督学习里面,又分为分类和预测数值型数据。这些算法都是基础的算法。通过深入学习Python来实现数据挖掘下方算法。

人工智能之机器学习(扩展):了解线性回归、掌握决策树的应用、熟练使用SVM支持向量机、熟练使用聚类+贝叶斯、掌握EM-HMM-LDA-ML。

免费直播

    精选课程 更多

    注册电脑版

    版权所有 2003-2020 广州环球青藤科技发展有限公司