为什么需要数据血缘治理


数据模型血缘治理的核心不是"建一张血缘图",而是从建模规范到自动采集、从健康监控到影响分析,形成一套跑得通的闭环。这篇文章会沿着 Kimball 维度建模、dbt DAG、DataHub/OpenMetadata 这条线,把字段级血缘的自动化和规模化讲清楚,顺带聊聊"数据血压管理"这个运维视角——把

数据血缘构建方案


在数据平台中,血缘(Data Lineage) 是指对数据从源头到最终消费全过程的追踪与记录。它描述了数据的“产生、处理和使用”路径,包括数据是如何被采集、转换、集成、存储以及最终被报表、分析或机器学习模型所使用的。 一、什么是数据血缘? 数据血缘可以理解为数据的家族谱系图,它回答以下关键问题: