编辑推荐: |
本文主要介绍了数据治理各模块之间的相互关系相关内容。希望对你的学习有帮助。
本文来自于微信公众号ruby的数据漫谈,由Linda编辑、推荐。 |
|
01 数据治理体系包含哪些模块
数据治理体系包含多个重要模块,各模块协同工作,共同实现数据的有效治理和价值最大化。以下是对各模块及其主要功能的详细说明:
数据集成
功能:完成数据入湖动作,这并非简单的数据搬运,而是按照特定方法论进行的数据备份。入湖的前提是满足 6
项数据标准,即明确数据 Owner、发布数据标准、定义数据密级、明确数据源、进行数据质量评估以及元数据注册。这些标准由数据代表在入湖前梳理,并在数据治理平台上完成资产注册。
数据标准
功能:着重建立统一的数据语言,以 L1 到 L5 数据层级业务对象的定义作为数据标准的载体,并对应发布各层级的数据标准。对于实现数据标准的
IT 系统,需发布相应的数据字典并进行数据源认证。而对于尚未在 IT 系统中落地的业务对象,则需在后续开发中逐步实现数字化落地。
数据开发
功能:作为编排、调度和运维的中心,提供一站式数据解决方案,涵盖分析、设计、实施、部署及维护等环节。它能够完成数据加工、转换和质量提升等任务,有效屏蔽各种数据存储的差异,满足从数据集成、清洗
/ 转换到质量监控等全流程的数据处理需求,是数据治理实施的关键环节。
数据质量
功能:旨在确保数据满足使用要求。以数据标准为基本衡量基准,要求各业务部门对所属数据领域的质量全权负责。具体包括按业务需求设计数据质量标准、制定管控目标、遵循企业数据治理要求进行度量、制定数据质量政策及改进计划,并持续进行数据质量管控。
数据资产
功能:包含业务资产、技术资产、指标资产等。核心在于构建企业级的元数据管理中心、建立数据资产目录、打造数据搜索引擎,实现数据血缘和全景可视。通过系统化管理企业的概念、逻辑和物理数据模型,建设数据地图及血缘关系,为数据调用、服务、运营和运维提供有力的信息支撑。
数据服务
功能:在整个企业范围内统一数据服务设计和实现的规范,并对其生命周期进行管理。通过集约管理数据服务,能够有效减少数据调用和集成的开发成本,提升数据服务的效率和质量。
数据安全
功能:鉴于企业数据来源多样,包括内部和外部,必须将数据安全纳入治理范畴。依据数据安全等级定义对所有企业数据进行定级,在数据产生、传输、存储和使用过程中实施必要的安全访问控制,并对数据的
CRUD 活动记录日志,以完成安全审计,确保数据的安全性和合规性。
主数据
功能:管理企业级重要业务实体数据的一致性,包括定义与实际物理数据的一致性。首先进行企业主数据的识别,然后按照主数据规范要求对已识别的主数据进行治理和
IT 改造,从而有力支撑企业业务流和工具链的打通与串联11。
管理中心
功能:负责管理数据治理过程中的组织、流程和政策建设,同时管理公共核心的统一数据源、数据驾驶舱等。通过为不同角色的用户提供个性化的工作台,满足多样化的工作需求,保障数据治理工作的顺利开展
02 数据治理体系各个模块之间的关系
这张图展示了数据治理体系的各个模块及其之间的关系。数据治理体系主要包括数据开发、数据集成、数据标准、数据质量、主数据、数据安全、数据服务、数据资产、数据应用等模块。
以下是对这些模块之间关系的详细讲解:
1、数据集成:
数据集成模块负责数据的整合和标准化,确保数据的一致性和完整性。
数据集成模块与数据标准模块紧密相连,数据标准模块定义了数据的规范和标准,确保数据的一致性和可比性。
2、数据开发:
数据开发是整个数据治理体系的基础,负责数据的采集、清洗、转换和加载等基础工作。
数据开发模块与数据集成模块紧密相连,数据集成模块负责将不同来源的数据整合到一起,形成统一的数据视图。
3、数据标准:
数据标准模块定义了数据的规范和标准,确保数据的一致性和可比性。
数据标准模块与数据质量模块紧密相连,数据标准模块为数据质量模块提供质量标准,为数据质量的对比提供标准条件。数据质量模块负责监控和提升数据的质量,确保数据的准确性和可靠性。
数据标准也和主数据模块紧密相连,数据标准为主数据提供标准建模的基础。
数据标准也和数据开发中的数据建模紧密相连,数据标准为数据建模提供标准基础。
4、数据质量:
数据质量模块负责监控和提升数据的质量,确保数据的准确性和可靠性。
数据质量模块与主数据模块紧密相连,主数据模块负责管理企业的核心数据,确保数据的唯一性和权威性。
5、主数据:
主数据模块负责管理企业的核心数据,确保数据的唯一性和权威性。
主数据模块与数据安全模块紧密相连,数据安全模块负责保护数据的安全,防止数据泄露和篡改。
6、数据安全:
数据安全模块负责保护数据的安全,防止数据泄露和篡改。
数据安全模块与数据服务模块紧密相连,数据服务模块负责提供数据访问和使用的接口,确保数据的可用性和易用性。
数据安全模块与数据资产模块紧密相连,数据资产展示出来的资产在数据安全的框架下,包括脱敏加密后的数据展示。
数据安全模块和数据开发模块紧密相连,数据开发能够操作的数据在数据安全的框架下。
7、数据服务:
数据服务模块负责提供数据访问和使用的接口,确保数据的可用性和易用性。
数据服务模块与数据资产模块紧密相连,数据资产模块负责管理和评估企业的数据资产,确保数据的价值最大化。
8、数据资产:
数据资产模块负责管理和评估企业的数据资产,确保数据的价值最大化。
数据资产模块与数据应用模块紧密相连,数据应用模块负责将数据转化为业务价值,提升企业的竞争力。
9、数据应用:
数据应用模块负责将数据转化为业务价值,提升企业的竞争力
数据应用模块与数据运营体系模块紧密相连,数据运营体系模块负责监控和优化数据应用的效果,确保数据的价值持续提升。
通过以上模块之间的紧密联系和协同工作,数据治理体系能够确保数据的质量、安全和价值最大化,为企业提供可靠的数据支持和决策依据。
03 数据治理活动执行的合理步骤
数据治理活动是指在数据治理平台,采用数据治理功能完成数据治理的行为,以下是在数据治理平台相关模块需要完成的相关操作说明:
数据集成
1、入湖方案规范
制定数据进入数据湖的规范和流程,确保数据的有序流入。
2、批量数据接入
设计批量数据接入的方法和机制,处理大量数据的导入。
3、实时数据接入
建立实时数据接入的通道,保证数据能够及时进入数据湖。
4、全量 / 增量集成
确定数据是全量集成还是增量集成,根据业务需求选择合适的方式。
5、表 / 文件 / 整库 / 场景迁移
规划数据在不同存储形式(如表、文件、整库)和场景之间的迁移策略。
数据开发
1、数据开发规范
制定数据开发的标准和规范,确保开发过程的一致性和规范性。
2、脚本 / 作业开发
编写数据处理脚本和作业,实现数据的转换、清洗等操作。
4、数据模型制定
设计数据模型,包括概念模型、逻辑模型和物理模型,以更好地组织和存储数据。
5、统一调度
建立统一的调度机制,对数据处理作业进行合理的调度和管理。
6、作业 / 实例运维
对数据处理作业和实例进行日常的运维和管理,确保其正常运行。
数据标准
1、业务对象识别
识别业务中的关键对象,为制定数据标准提供基础。
2、数据标准制定
根据业务对象和需求,制定统一的数据标准,包括数据格式、编码等。
3、数据源认证
对数据的来源进行认证,确保数据的可靠性和合法性。
4、数据字典发布
发布数据字典,提供数据的定义和解释,方便数据的理解和使用。
数据质量
1、数据质量标准
建立数据质量的评估标准,包括准确性、完整性、一致性等方面。
2、数据质量目标
设定数据质量的目标,明确要达到的数据质量水平。
3、数据质量改进
采取措施改进数据质量,如数据清洗、纠错等操作。
4、数据质量管控
建立数据质量的管控机制,对数据质量进行持续监测和管理。
5、数据质量政策
制定数据质量相关的政策,确保数据质量工作的有效开展。
数据安全
1、数据安全等级定义
对数据进行安全等级划分,确定不同数据的安全保护级别。
2、数据安全定级
根据安全等级定义,对具体数据进行定级操作。
3、数据安全访问控制
建立数据访问控制机制,确保只有授权人员能够访问相应的数据。
4、数据安全访问日志审计
记录数据访问日志,并进行审计,及时发现和处理安全问题。
数据服务
1、统一数据服务设计规范
制定统一的数据服务设计规范,确保数据服务的一致性和易用性。
2、数据服务生命周期管理
对数据服务的整个生命周期进行管理,包括设计、开发、部署、运维等阶段。
数据治理工作开展步骤
1、规划与设计阶段
首先进行数据集成的规划,包括入湖方案、数据接入方式等。
制定数据开发规范和数据模型,为数据处理做好准备。
识别业务对象,制定数据标准,确保数据的一致性。
识别主数据对象,制定主数据标准。
2、开发与实施阶段
进行数据集成的实际操作,包括批量和实时数据接入。
按照数据开发规范进行脚本 / 作业开发和数据模型制定。
形成数据资产和主数据资产。
建立数据安全机制,如安全等级定义和访问控制。
3、质量管控与服务阶段
设定数据质量标准和目标,开展数据质量改进和管控工作。
设计和实现数据服务,进行生命周期管理。
通过数据安全访问日志审计等方式保障数据安全。
通过以上步骤,可以系统地开展数据治理工作,确保数据在整个生命周期中的质量、安全和可用性。
数据治理组织架构常见模式有以下几种:
一、集中式数据治理组织架构
特点
高度集中管理:所有的数据治理决策、标准制定、执行监督等工作都由一个专门的数据治理中心或团队负责。这个中心通常拥有最高的数据治理权力,其他部门都需要遵循其制定的数据治理规则。
统一标准和流程:能够在整个企业内快速推行统一的数据治理标准、流程和规范。例如,统一的数据分类标准、数据质量评估标准等,确保数据在全企业范围内的一致性和准确性。
资源集中调配:数据治理相关的人力、物力、财力等资源都由这个中心进行集中调配。可以根据数据治理项目的优先级和需求,合理分配资源,提高资源利用效率。
适用场景
数据敏感性高的企业:如金融机构,对数据的准确性、安全性要求极高,集中式架构便于对数据进行严格管控,防止数据泄露和错误操作。
小型企业或初创企业:业务相对简单,数据量不大,集中式管理可以快速建立起数据治理体系,避免资源分散和职责不清的问题。
二、分散式数据治理组织架构
特点
部门自主管理:各个业务部门自行负责本部门的数据治理工作,包括制定适合本部门的数据治理策略、标准和流程。例如,销售部门可以根据自身的客户数据特点制定客户数据管理规则。
高度灵活性:能够快速响应本部门的业务需求,根据业务变化及时调整数据治理方案。不同部门可以根据自身业务的发展阶段和重点,有针对性地开展数据治理工作。
专业知识深入:各部门的数据治理人员更了解本部门的数据特性和业务逻辑,能够在数据治理中更好地结合专业知识。例如,研发部门可以深入挖掘技术研发数据的价值。
适用场景
多元化业务集团:集团下各子公司或业务部门的业务差异大,数据类型和需求各不相同。分散式架构允许各部门根据自身情况进行数据治理,避免一刀切带来的不适应。
强调创新和快速反应的企业:在互联网企业等需要快速迭代产品和服务的环境中,各业务部门可以自主进行数据治理,以支持快速的业务决策和创新。
三、联邦式数据治理组织架构
特点
中央协调与部门自治相结合:在企业层面设立数据治理协调委员会或类似机构,负责制定企业总体的数据治理战略、框架和关键政策。同时,各业务部门在这个框架下,结合自身业务实际情况,制定具体的数据治理实施计划。
平衡统一性和灵活性:既保证了企业数据治理在宏观层面的一致性,又能让各部门在具体操作中保持一定的灵活性。例如,在数据安全等级的总体框架下,各部门可以根据数据敏感度进一步细化本部门的数据安全措施。
沟通与协作机制:强调各部门之间的数据治理沟通和协作。通过定期的会议、数据共享平台等方式,促进部门间的数据治理经验交流和数据共享,解决跨部门的数据治理问题。
适用场景
大型企业和跨国公司:这类企业通常有复杂的业务结构和庞大的数据量。联邦式架构可以在保证企业整体数据治理方向的同时,适应不同地域、不同业务板块的数据治理需求。
业务相互关联的企业:企业内各业务之间存在较多的数据关联和交互,联邦式架构有助于在保障整体数据治理协同性的基础上,发挥各业务部门的数据治理自主性。
|