数据仓库
数仓学习概览
数仓理论
调度和报警
指标系统
数据应用
数据质量
数据治理
数据安全
元数据血缘
数据采集处理
MST
数仓实战
数据平台
debezium
kafka
metabase
superset
hive
hive基础操作
hive性能优化
hive安装部署
spark
spark基础操作
spark性能优化
spark安装部署
flink
flin基础操作
flink性能优化
flink安装部署
hadoop
hadoop基础操作
hadoop性能优化
hadoop安装部署
doris
doris基础操作
doris安装配置
dolphin
datax
AI
基础知识
数据库
mysql
mysql基础操作
mysql安装部署
工具使用
excel
微信
halo
maven
docker
git
code-server
confluence
nginx
dbt
jdk
编码
java
flask
python
scrapy
其他
mac
杂项
1panel
shell
邮箱
chrome
ubuntu
关于我
1
dolphinscheduler3.2.2 standalone安装部署
2
初识数据仓库
3
数据仓库建模方法概述(维度建模、ER建模)
4
指标建设规范
5
使用python安装superset5
登录
MaoMao
累计撰写
123
篇文章
累计创建
70
个分类
累计创建
216
个标签
导航
数据仓库
数仓学习概览
数仓理论
调度和报警
指标系统
数据应用
数据质量
数据治理
数据安全
元数据血缘
数据采集处理
MST
数仓实战
数据平台
debezium
kafka
metabase
superset
hive
hive基础操作
hive性能优化
hive安装部署
spark
spark基础操作
spark性能优化
spark安装部署
flink
flin基础操作
flink性能优化
flink安装部署
hadoop
hadoop基础操作
hadoop性能优化
hadoop安装部署
doris
doris基础操作
doris安装配置
dolphin
datax
AI
基础知识
数据库
mysql
mysql基础操作
mysql安装部署
工具使用
excel
微信
halo
maven
docker
git
code-server
confluence
nginx
dbt
jdk
编码
java
flask
python
scrapy
其他
mac
杂项
1panel
shell
邮箱
chrome
ubuntu
关于我
目录
分类
数仓理论
数据仓库建设流程概述
2026-01-21
12
0
0
25.2℃
数仓理论
数据仓库建设是一个系统工程,通常遵循一套标准化的流程来确保项目的成功。以下是数据仓库建设的关键流程步骤概述: 一、需求分析 项目启动与目标定义 明确目标(如提升数据质量、提高决策效率、统一管理数据等) 确定业务范围、人力、时间线和关键利益相关者 需求收集与分析🌟 与业务部门沟通,梳理关键业务问题与
维度建模-总线矩阵
2026-01-15
10
0
0
25.0℃
数仓理论
一、总线矩阵的核心思想 总线矩阵是 Kimball 维度建模方法论的基石。它不是一个集中式的单一模型,而是一种分步、增量地构建企业数据仓库的方法,确保最终所有数据能无缝集成。 其核心是 “一致性”: 一致性维度:在不同业务过程(如销售、库存、采购)的事实表中,相同的维度(如 日期、产品、客户、门店)
维度建模-常用名词术语
2026-01-14
23
0
0
26.3℃
数仓理论
数据仓库是一个体系庞大的领域,拥有许多专业名词术语。这里系统性地梳理和解释最核心、最常用的术语。
维度建模-事实表设计
2025-06-12
55
0
0
29.5℃
数仓理论
一、引言 在数据仓库的架构体系中,事实表是承载业务核心数据、支撑数据分析的关键组件。本文将围绕事实表设计展开,从基础概念、设计原则、设计方法到分类应用,系统掌握事实表设计的核心技术,为构建高效的数据仓库奠定基础。 二、事实表的基础 事实表的定义 事实表是维度建模中的核心数据表,用于存储业务过程中产生
维度建模-维度表设计
2025-05-19
71
0
0
31.1℃
数仓理论
一、维度设计基本概念 1.1 维度与事实 在维度建模中有两个非常重要的概念:维度和事实。与业务过程相关的数值型字段称为事实,维度则是事实的环境描述。 例如在电商场景中,商品维度可包含品牌、类别、款式等维度
数据仓库建模方法概述(维度建模、ER建模)
2025-04-15
248
0
0
48.8℃
数仓理论
数据仓库主要的建模方法为:维度建模和实体关系建模(ER建模)。其他还有ER模型的衍生模型:Data Vault 模型和Anchor 模型,实际工作中很少使用。 维度建模
数据库三范式
2025-04-14
47
0
0
28.7℃
数仓理论
数据库三范式(Normalization)是关系型数据库设计的一套核心理论和准则,目的是减少数据冗余、提高数据一致性、消除数据操作异常。 三范式可总结为:原子性、完全依赖主键、不传递依赖主键。第二和第三范式类似,可以归纳为属性强依赖主键。 第一范式(1NF)
初识数据仓库
2025-03-03
266
0
0
50.6℃
数仓理论
一、引言 1.1 数仓的作用 ① 整合数据 — 汇聚多源异构数据,打破信息孤岛,形成企业统一数据视图。 ② 支撑决策 — 为 BI 报表、多维分析、KPI 监控提供稳定数据底座,让决策有据可依。 ③ 历史追溯 — 长期存储历史数据,支持趋势分析、同比环比等时序类业务洞察。 ④ 保障质量 — 数据入仓
弹
通知
通知
本通知将在
null
秒后自动消失
我知道了