数据仓库
数仓学习概览
数仓理论
调度和报警
指标系统
数据应用
数据质量
数据治理
数据安全
元数据血缘
数据采集处理
MST
数仓实战
数据平台
hive
hive基础操作
hive性能优化
hive安装部署
superset
metabase
kafka
debezium
spark
spark安装部署
spark性能优化
spark基础操作
flink
flink安装部署
flink性能优化
flin基础操作
hadoop
hadoop安装部署
hadoop性能优化
hadoop基础操作
doris
doris基础操作
doris安装配置
dolphin
datax
数据库
mysql
mysql基础操作
mysql安装部署
工具使用
git
docker
maven
vscode
nginx
confluence
dbt
编码
flask
python
scrapy
操作系统
chrome
邮箱
shell
jdk
ubuntu
1
初识数据仓库
2
数据仓库建模方法概述(维度建模、ER建模)
3
dolphinscheduler standalone安装部署
4
指标建设规范
5
使用python安装superset5
登录
已删除用户
该用户已被删除。
累计撰写
88
篇文章
累计创建
61
个分类
累计创建
137
个标签
导航
数据仓库
数仓学习概览
数仓理论
调度和报警
指标系统
数据应用
数据质量
数据治理
数据安全
元数据血缘
数据采集处理
MST
数仓实战
数据平台
hive
hive基础操作
hive性能优化
hive安装部署
superset
metabase
kafka
debezium
spark
spark安装部署
spark性能优化
spark基础操作
flink
flink安装部署
flink性能优化
flin基础操作
hadoop
hadoop安装部署
hadoop性能优化
hadoop基础操作
doris
doris基础操作
doris安装配置
dolphin
datax
数据库
mysql
mysql基础操作
mysql安装部署
工具使用
git
docker
maven
vscode
nginx
confluence
dbt
编码
flask
python
scrapy
操作系统
chrome
邮箱
shell
jdk
ubuntu
目录
mysql配置binlog
2026-01-26
6
0
0
24.6℃
mysql安装部署
要在 MySQL 中配置 binlog(二进制日志),以便 Debezium 能够正确读取并捕获变更数据(CDC),需要完成以下关键配置步骤。Debezium 依赖 MySQL 的 row-based replication 模式,并要求开启 binlog。 <
debezium3.4基于kafka-connect安装部署
2026-01-26
16
0
0
25.6℃
debezium
Debezium 3.4的安装部署,其核心是作为插件集成到Apache Kafka Connect框架中来工作。根据环境,可以选择不同的部署方式。 下面的表格汇总了三种主流部署方式:
Kafka Connect分布式服务
2026-01-25
19
0
0
25.9℃
kafka
部署Kafka Connect 3.9的分布式集群,核心是配置一个由多个Worker进程组成的、能够自动协调和容错的系统。与单机模式不同,分布式模式下,集群的状态和配置都存储在Kafka内部主题中,以实现高可用。 下面的表格整理了部署的核心步骤概览:
kafka3.9.1KRaft模式集群部署
2026-01-23
25
0
0
26.5℃
kafka
Apache Kafka 3.9.1 支持 KRaft(Kafka Raft Metadata)模式,即无需依赖 ZooKeeper 的纯 Kafka 元数据管理方式。以下是 KRaft 模式下部署 Kafka 集群的详细步骤,适用于生产或测试环境。 🧩 前提条件
数据采集方案概述
2026-01-22
13
0
0
25.3℃
数据采集处理
数据采集(Data Ingestion) 是整个数据流水线的关键起点。一个稳健的采集方案直接影响后续数据的质量、时效性和可用性。以下是系统性的数据采集方案设计,涵盖核心原则、采集类型、技术选型及实施要点。 一、数据采集的核心目标 全量覆盖:确保关键数据源无遗漏。 高效稳定:支持高吞吐、低延迟、容错恢
数据仓库建设流程概述
2026-01-21
6
0
0
24.6℃
数仓理论
数据仓库建设是一个系统工程,通常遵循一套标准化的流程来确保项目的成功。以下是数据仓库建设的关键流程步骤概述: 一、需求分析 项目启动与目标定义 明确目标(如提升数据质量、提高决策效率、统一管理数据等) 确定业务范围、人力、时间线和关键利益相关者 需求收集与分析🌟 与业务部门沟通,梳理关键业务问题与
维度建模-总线矩阵
2026-01-15
7
0
0
24.7℃
数仓理论
一、总线矩阵的核心思想 总线矩阵是 Kimball 维度建模方法论的基石。它不是一个集中式的单一模型,而是一种分步、增量地构建企业数据仓库的方法,确保最终所有数据能无缝集成。 其核心是 “一致性”: 一致性维度:在不同业务过程(如销售、库存、采购)的事实表中,相同的维度(如 日期、产品、客户、门店)
维度建模-常用名词术语
2026-01-14
17
0
0
25.7℃
数仓理论
数据仓库是一个体系庞大的领域,拥有许多专业名词术语。这里系统性地梳理和解释最核心、最常用的术语。
Lambda架构概述
2026-01-12
11
0
0
25.1℃
数据采集处理
什么是 Lambda 架构? Lambda 架构是一种用于设计和实现大规模数据计算系统的架构模式,其核心目标是平衡延迟、吞吐量和容错性,以应对海量数据的实时查询和分析需求。 它诞生的背景是传统批处理系统(如 Hadoop、Hive)无法满足低延迟查询场景,而纯流处理系统又难以保证数据准确性和历史数据
Kappa架构概述
2026-01-12
9
0
0
24.9℃
数据采集处理
Kappa 架构是作为对经典的 Lambda 架构 的反思和简化而提出的。它的核心思想是:用一个统一的流处理系统来处理所有数据,无论是实时数据还是历史数据,从而消除 Lambda 架构中复杂的“批处理层”和“服务层”的双重维护。 1. Kappa 架构诞生的背景:Lambda 架构的挑战 要理解 K
上一页
下一页
1
2
3
4
5
6
7
8
9
弹