Panda数据

数据仓库建模方法

数据仓库主要的建模方法是:维度建模和实体关系建模(ER建模)。其他还有ER模型的衍生模型:Data Vault 模型和Anchor 模型,但很少使用。 维度建模 概念描述: 维度建模由 Ralph Kimball 在《数据仓库工具箱》一书中提出的建模方法,其核心思想是将数据组织成事实表和维度表。 事

Panda Panda 发布于 2025-04-15

数据库三范式

第一范式(1NF) 定义:数据库表中的每一列都是不可分割的原子值,即同一列中不能包含多个值或重复属性。 核心要求: 每一列都是单一数据项,例如电话号码字段不能存储多个号码(需拆分为单独记录)。 示例: 原始表(违反1NF):

Panda Panda 发布于 2025-04-14

使用dbt构建doris数仓

目标 单位需要做一个基于doris的近实时数仓,用于数据大屏。这篇文章的目的是把基于dbt和doris的离线数仓的开发流程讲清楚。那么我们先从离线数仓的标准开发流程图开始。 离线数仓开发流程

Panda Panda 发布于 2025-04-08

初识数据仓库

一、引言 1.1 数仓的作用 现在正处在一个数据驱动决策的时代,数据仓库作为管理数据和提供数据支持的工具,在企业决策中发挥着越来越重要的作用。 提升决策效率:企业有很多业务系统,产生各种各样的数据,数据仓库能将这些分散的数据进行整合,形成统一的数据模型。分析师与决策者无需在繁杂的数据源间反复切换查询

Panda Panda 发布于 2025-03-03