数据管理框架中的元数据管理是什么?

2020/09/28 04:35
大数据时代下,凭借数据管理框架中的重要管理职能,元数据管理也越来越频繁的出现在大家的视野中。

元数据及应用也是数据仓库的重要组成部分,它是描述数据的数据(data about data),描述数据的属性信息,可以帮助我们非常方便地找到他们所关心的数据。

元数据记录了哪些信息?

数据的表结构:字段信息、分区信息、索引信息等;

数据的使用&权限:空间存储、读写记录、修改记录、权限归属、审核记录等其他信息;

数据的血缘关系信息:血缘信息简单的说就是数据的上下游关系,数据从哪里来到哪里去?我们通过血缘关系,可以了解到建立起生产这些数据的任务之间的依赖关系,进而辅助调度系统的工作调度,或者用来判断一个失败或错误的任务可能对哪些下游数据造成影响等等;而在数据排查过程中也可以帮助我们定位问题。

数据的业务属性信息:记录这张表的业务用途,各个字段的具体统计口径、业务描述、历史变迁记录、变迁原因等。这部分数据多是我们手动填写,但却能大大提升数据使用过程中的便利性。

对于元数据的概念及元数据管理的作用,这篇文章大概做了一个介绍,希望能帮到对其理解不够清晰的非业内人士。

免费直播

    精选课程 更多

    注册电脑版

    版权所有 2003-2020 广州环球青藤科技发展有限公司