数据仓库
数仓学习概览
数仓理论
调度和报警
指标系统
数据应用
数据质量
数据治理
数据安全
元数据血缘
数据采集处理
MST
数仓实战
数据平台
debezium
kafka
metabase
superset
hive
hive基础操作
hive性能优化
hive安装部署
spark
spark基础操作
spark性能优化
spark安装部署
flink
flin基础操作
flink性能优化
flink安装部署
hadoop
hadoop基础操作
hadoop性能优化
hadoop安装部署
doris
doris基础操作
doris安装配置
dolphin
datax
AI
基础知识
数据库
mysql
mysql基础操作
mysql安装部署
工具使用
excel
微信
halo
maven
docker
git
code-server
confluence
nginx
dbt
jdk
编码
java
flask
python
scrapy
其他
mac
杂项
1panel
shell
邮箱
chrome
ubuntu
关于我
1
dolphinscheduler3.2.2 standalone安装部署
2
初识数据仓库
3
数据仓库建模方法概述(维度建模、ER建模)
4
指标建设规范
5
使用python安装superset5
登录
MaoMao
累计撰写
123
篇文章
累计创建
70
个分类
累计创建
216
个标签
导航
数据仓库
数仓学习概览
数仓理论
调度和报警
指标系统
数据应用
数据质量
数据治理
数据安全
元数据血缘
数据采集处理
MST
数仓实战
数据平台
debezium
kafka
metabase
superset
hive
hive基础操作
hive性能优化
hive安装部署
spark
spark基础操作
spark性能优化
spark安装部署
flink
flin基础操作
flink性能优化
flink安装部署
hadoop
hadoop基础操作
hadoop性能优化
hadoop安装部署
doris
doris基础操作
doris安装配置
dolphin
datax
AI
基础知识
数据库
mysql
mysql基础操作
mysql安装部署
工具使用
excel
微信
halo
maven
docker
git
code-server
confluence
nginx
dbt
jdk
编码
java
flask
python
scrapy
其他
mac
杂项
1panel
shell
邮箱
chrome
ubuntu
关于我
目录
分类
数据仓库
连续登陆超过N天的用户
2025-11-05
20
0
0
26.0℃
MST
一、题目 现有用户登录日志表 user_login_log,包含用户ID(user_id),登录日期(login_date)。数据已经按照用户日期去重,请查出连续登录超过4天的用户ID 样例数据
指标系统
2025-08-25
30
0
0
27.0℃
指标系统
1、指标系统介绍 指标系统是一套围绕企业业务目标,对关键数据指标进行标准化定义、自动化计算、可视化展示及动态管理的数字化工具。通过整合分散的业务数据,它可以将抽象的业务场景转化为可量化的指标体系,帮助企业实时掌握运营状态、快速定位问题并支撑决策优化,是连接业务与数据的核心桥梁。 背景 下面看看指标系
指标建设规范
2025-08-06
165
0
0
40.5℃
指标系统
一、指标定义 指标是用于衡量业务目标达成程度的可量化参数,它是将抽象的业务目标转化为具体、可操作、可衡量的数值标识。在企业运营中,指标如同 “导航仪”,通过对业务数据的提炼和计算,直观展现业务的运行状态、发展趋势和存在问题。 例如,电商企业的 “销售额” 指标,能够直接反映企业的销售业绩;互联网产品
数据质量监控报警
2025-07-10
53
0
0
29.3℃
调度和报警
配置好建模任务后,如何保障任务连续性和数据质量? 比如调度任务若因系统故障、资源不足或代码错误导致失败,未配置监控时需人工巡检才能发现,可能延误数小时甚至数天,如何解决?再比如重要数据必须9点前产出,如何保证?数据是否有重复?值是否准确? 下面从数据质量监控分类(完整性、准确性、一致性、时效性)和报
常用的任务调度系统
2025-06-23
53
0
0
29.3℃
调度和报警
一、任务调度系统在数据仓库中的核心价值 在数据仓库体系中,任务调度系统扮演着 "神经中枢" 的角色,其核心作用体现在: 自动化流程控制:实现 ETL 作业、数据同步、报表生成等任务的定时触发与执行 依赖关系管理:处理任务间的上下游依赖(如必须先完成 ods 层数据加载才能执行 dws 层聚合) 资源
维度建模-事实表设计
2025-06-12
55
0
0
29.5℃
数仓理论
一、引言 在数据仓库的架构体系中,事实表是承载业务核心数据、支撑数据分析的关键组件。本文将围绕事实表设计展开,从基础概念、设计原则、设计方法到分类应用,系统掌握事实表设计的核心技术,为构建高效的数据仓库奠定基础。 二、事实表的基础 事实表的定义 事实表是维度建模中的核心数据表,用于存储业务过程中产生
维度建模-维度表设计
2025-05-19
71
0
0
31.1℃
数仓理论
一、维度设计基本概念 1.1 维度与事实 在维度建模中有两个非常重要的概念:维度和事实。与业务过程相关的数值型字段称为事实,维度则是事实的环境描述。 例如在电商场景中,商品维度可包含品牌、类别、款式等维度
数据仓库建模方法概述(维度建模、ER建模)
2025-04-15
248
0
0
48.8℃
数仓理论
数据仓库主要的建模方法为:维度建模和实体关系建模(ER建模)。其他还有ER模型的衍生模型:Data Vault 模型和Anchor 模型,实际工作中很少使用。 维度建模
数据库三范式
2025-04-14
47
0
0
28.7℃
数仓理论
数据库三范式(Normalization)是关系型数据库设计的一套核心理论和准则,目的是减少数据冗余、提高数据一致性、消除数据操作异常。 三范式可总结为:原子性、完全依赖主键、不传递依赖主键。第二和第三范式类似,可以归纳为属性强依赖主键。 第一范式(1NF)
初识数据仓库
2025-03-03
266
0
0
50.6℃
数仓理论
一、引言 1.1 数仓的作用 ① 整合数据 — 汇聚多源异构数据,打破信息孤岛,形成企业统一数据视图。 ② 支撑决策 — 为 BI 报表、多维分析、KPI 监控提供稳定数据底座,让决策有据可依。 ③ 历史追溯 — 长期存储历史数据,支持趋势分析、同比环比等时序类业务洞察。 ④ 保障质量 — 数据入仓
上一页
下一页
1
2
3
弹
通知
通知
本通知将在
null
秒后自动消失
我知道了