刘同学的第四篇,坚持就是胜利,太棒了。

其他相关文章:

数据库中的元数据

元数据的作用

元数据概念

基于元数据驱动的ETL

Hive 元数据表结构详解

在 2009年,《大数据资产:聪明的企业怎样致胜于数据治理》一书中提到,如果基本数据不可靠,大多数企业的大数据计划或者失败,或者效果会低于预期。是什么原因造成这样的后果呢?主要是数据生命周期之中流入了脏数据。(脏数据:不正确的,丢失的部分信息,不可靠的数据。)

** 造成这种现象的原因有很多:**

  1. 数据的来源、使用、满足的业务需求、以及数据操作权限没有做到明确的界定。

  2. 数据的采集、转化,元数据的定义、数据仓库的架构没有形成一个既定的标准。

  3. 数据传输在安全性、业务逻辑流程以及数据血统并没有做到合适的界定。

在数据领域有一个流行的说法是“更好的数据意味着更好的决策”,如果我们没办法弄清楚,我们需要什么样的数据,怎么获取数据,使用者权限以及哪些数据能够满足我们的业务需要。这些问题不能搞清楚的话,我相信即使一个产品有好的想法也不会创造出它该有的价值。

**数据治理的意义:


数据治理为IT技术方案以及业务目标架起了桥梁的作用

数据治理有六大支柱:

分别是机构,策略,评估及监控,技术,宣传和政策、标准按、流程及指导方针。当然变更管理是整个数据治理的核心

数据治理的技术组成:

元数据管理、主数据管理、数据质量、数据剖析、数据分析、数据集成、数据字典、数据库管理、监控与报告等。

数据治理的原则:

简单来讲,数据治理就是要约束输入,规范输出。

理解了这么多我们现在能总结出数据治理的概念了

数据治理是一套持续改善管理机制,在这个机制内,在企业中制定了数据架构组织、数据模型、政策及体系制定、技术工具、数据标准、数据质量、影响度分析、作业流程、监督及考核等一系列标准或者是策略。

元数据后面我们也还在学习中,我们会持续更新。欢迎大家一起参加进来,共同学习,共同进步。