俗话说的好,工欲善其事,必先利其器。很多从事数据统计分析工作的朋友应该会深有感触,苦于自己80%的时间在做数据清洗,而仅仅只有20%的时间在优化模型、分析统计结果等,今天我们就来介绍下SQL数据清洗。
因此,选择高效且易用的数据清洗工具,其重要性就不言而喻,今天先简单介绍下数据清洗中最重要的工具--SQL。
SQL,Structured Query Language, 结构化查询语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统,堪称数据清洗界的神器。
SQL具有数据定义、数据操纵和数据控制:
1、SQL数据定义功能:能够定义数据库的三级模式结构,即外模式、全局模式和内模式结构。在SQL中,外模式有叫做视图(View),全局模式简称模式( Schema),内模式由系统根据数据库模式自动实现,一般无需用户过问。
2、SQL数据操纵功能:包括对基本表和视图的数据插入、删除和修改,特别是具有很强的数据查询功能。
3、SQL的数据控制功能:主要是对用户的访问权限加以控制,以保证系统的安全性。
SQL数据清洗方面特别突出,大家可以多多尝试。