问答详情

大数据预处理的方法有哪些?

1295次观看
标签: 大数据预处理 大数据预处理方法
老师回答

1、数据清理

数据清理例程就是通过填写缺失值、光滑噪声数据、识别或者删除离群点,并且解决不一致性来进行“清理数据”。

2、数据集成

数据集成过程将来自多个数据源的数据集成到一起。

3、数据规约

数据规约是为了得到数据集的简化表示。数据规约包括维规约和数值规约。

4、数据变换

通过变换使用规范化、数据离散化和概念分层等方法,使得数据的挖掘可以在多个抽象层面上进行。数据变换操作是提升数据挖掘效果的附加预处理过程。

免费直播

    精选课程
    相关推荐
    大数据岗位方向都有哪些?
    刘老师 大数据工程师

    1、大数据开发工程师

    开发,建设,测试和维护架构;负责公司大数据平台的开发和维护,负责大数据平台持续集成相关工具平台的架构设计与产品开发等。

    2、数据分析师

    收集,处理和执行统计数据分析;运用工具,提取、分析、呈现数据,实现数据的商业意义,需要业务理解和工具应用能力。

    3、数据挖掘工程师

    数据建模、机器学习和算法实现;商业智能,用户体验分析,预测流失用户等;需要过硬的数学和统计学功底以外,对算法的代码实现也有很高的要求。

    4、数据架构师

    需求分析,平台选择,技术架构设计,应用设计和开发,测试和部署;高级算法设计与优化;数据相关系统设计与优化,需要平台级开发和架构设计能力。

    5、数据库开发

    设计,开发和实施基于客户需求的数据库系统,通过理想接口连接数据库和数据库工具,优化数据库系统的性能效率等。

    6、数据库管理

    数据库设计、数据迁移、数据库性能管理、数据安全管理,故障检修问题、数据备份、数据恢复等。

    7、数据科学家

    数据挖掘架构、模型标准、数据报告、数据分析方法;利用算法和模型提高数据处理效率、挖掘数据价值、实现从数据到知识的转换。

    8、数据产品经理

    把数据和业务结合起来做成数据产品;平台线提供基础平台和通用的数据工具,业务线提供更加贴近业务的分析框架和数据应用。

    注册电脑版

    版权所有 2003-2020 广州环球青藤科技发展有限公司