- 分类
- 数据仓库
数据仓库为什么一定要分层?把 ODS、DWD、DWS、ADS 一次讲透
- 2026-04-22
- 4
- 0
- 0
- 24.4℃
导读 / Key Takeaways 数据仓库分层的核心,不是记住 ODS/DWD/DWS/ADS 这些缩写,而是用清晰边界管理数据资产生产过程。 ODS 负责保留原始真相,DWD 负责沉淀可复用明细,DWS 负责沉淀公共汇总,ADS 负责面向业务交付结果。 真正决定分层成败的,不是层名,而是原始层
数据仓库 vs 数据湖 vs 湖仓一体:一文看懂该选哪个
- 2026-04-13
- 18
- 0
- 0
- 25.8℃
核心答案(Answer-First):数据仓库适用于结构化数据的高性能 BI 分析场景,数据湖适用于海量原始数据的低成本存储与灵活处理,**湖仓一体(Lakehouse)**通过统一存储与计算,在同一平台上同时支持 BI 、实时计算和机器学习训练,是当前重要的发展方向之一。 一、 数据仓库、数据湖、
数据仓库-维度表开发指南
- 2026-04-07
- 44
- 0
- 0
- 28.4℃
一、什么是维度表?为什么它如此重要? 在数据仓库领域,维度表 (Dimension Table) 是星型模式的核心组成部分,用于为事实数据提供业务上下文和描述性信息。想象一下,你有一张记录销售交易的事实表,但如果没有产品、客户、时间等维度表,这些交易数据只是一堆毫无意义的数字。 维度表的核心特征 ┌
星型、雪花与星座模型架构的性能与选择
- 2026-03-24
- 18
- 0
- 1
- 27.8℃
数仓建模中的模型架构分类主要取决于 查询性能(星型) 与 数据一致性(雪花型) 的权衡。星型模型 (Star Schema) 采用去规范化(Denormalization)设计,极大减少了多表 Join的性能消耗,是现代云数据仓库中高性能 BI 分析的首选。雪花模型 (Snowflake Schem
数据仓库的起源和发展历程
- 2026-03-22
- 18
- 0
- 0
- 25.8℃
萌芽(1970s–1980s初) 早在数据仓库概念正式提出之前,企业已经面临一个核心矛盾:业务系统(OLTP)既要处理日常事务,又要支撑管理决策分析,两者需求截然不同,混用导致性能严重下降。 这一时期,MIT研究团队提出"分析系统与业务系统分离"的架构,为数据仓库奠定理论基础。 概念形成期(1980
数仓模型验证标准流程
- 2026-03-10
- 56
- 0
- 0
- 29.6℃
作为数据仓库工程师,模型开发完成后的验证核心是规范先行、全链路覆盖、业务闭环、持续监控,确保表的数据质量、性能、合规性完全符合设计与业务要求,以下是分阶段的详细验证步骤。 一、表结构与元数据规范性验证 基础中的基础,表结构不符合规范,后续数据验证均为无效工作,核心要求是与设计文档 100% 匹配,符
异常数据与边界场景验证
- 2026-03-10
- 9
- 0
- 0
- 24.9℃
核心目标:提前发现潜在 bug,确保表在极端场景下稳定运行,规避上线后线上故障。 异常值检测与校验 数值型异常值:金额、数量、时长等字段无负数、无超出合理阈值的异常值(如年龄 > 150)。 示例 SQL:select * from 目标表 where 金额字段 < 0 or 数量字段 < 0; 字
数据仓库建设流程概述
- 2026-01-21
- 23
- 0
- 0
- 26.3℃
数据仓库建设是一个系统工程,通常遵循一套标准化的流程来确保项目的成功。以下是数据仓库建设的关键流程步骤概述: 一、需求分析 项目启动与目标定义 明确目标(如提升数据质量、提高决策效率、统一管理数据等) 确定业务范围、人力、时间线和关键利益相关者 需求收集与分析🌟 与业务部门沟通,梳理关键业务问题与