数据仓库
数仓学习概览
数仓理论
调度和报警
指标系统
数据应用
数据质量
数据治理
数据安全
元数据血缘
数据采集处理
MST
数仓实战
数据平台
debezium
kafka
metabase
superset
hive
hive基础操作
hive性能优化
hive安装部署
spark
spark基础操作
spark性能优化
spark安装部署
flink
flin基础操作
flink性能优化
flink安装部署
hadoop
hadoop基础操作
hadoop性能优化
hadoop安装部署
doris
doris基础操作
doris安装配置
dolphin
datax
AI
基础知识
数据库
mysql
mysql基础操作
mysql安装部署
工具使用
excel
微信
halo
maven
docker
git
code-server
confluence
nginx
dbt
jdk
编码
java
flask
python
scrapy
其他
mac
杂项
1panel
shell
邮箱
chrome
ubuntu
关于我
1
dolphinscheduler3.2.2 standalone安装部署
2
初识数据仓库
3
数据仓库建模方法概述(维度建模、ER建模)
4
指标建设规范
5
使用python安装superset5
登录
MaoMao
累计撰写
123
篇文章
累计创建
70
个分类
累计创建
216
个标签
导航
数据仓库
数仓学习概览
数仓理论
调度和报警
指标系统
数据应用
数据质量
数据治理
数据安全
元数据血缘
数据采集处理
MST
数仓实战
数据平台
debezium
kafka
metabase
superset
hive
hive基础操作
hive性能优化
hive安装部署
spark
spark基础操作
spark性能优化
spark安装部署
flink
flin基础操作
flink性能优化
flink安装部署
hadoop
hadoop基础操作
hadoop性能优化
hadoop安装部署
doris
doris基础操作
doris安装配置
dolphin
datax
AI
基础知识
数据库
mysql
mysql基础操作
mysql安装部署
工具使用
excel
微信
halo
maven
docker
git
code-server
confluence
nginx
dbt
jdk
编码
java
flask
python
scrapy
其他
mac
杂项
1panel
shell
邮箱
chrome
ubuntu
关于我
目录
分类
flink
Flink时间与水印全解析:彻底搞定乱序数据流
2026-03-18
11
0
0
25.1℃
flin基础操作
在实时计算领域,Flink凭借精准高效的时间处理能力和强悍的乱序数据容错能力,成为主流的流处理引擎。而时间语义(Time)和水印(Watermark),正是Flink区别于其他流处理框架的核心精髓,也是新手入门Flink最容易困惑的知识点。 很多同学刚接触Flink时,总会遇到这些问题:为什么窗口计
flink自定义水印(watermark)生成器
2026-03-18
6
0
0
24.6℃
flin基础操作
实时业务场景很复杂,乱序延迟通常不固定(比如高峰期延迟30秒,低峰期延迟5秒),可以实现WatermarkGenerator接口,自定义水印生成逻辑,比如基于周期生成、基于数据条数生成,灵活适配特殊场景。 一、核心思路(适配动态乱序延迟场景) 针对 “高峰期延迟 30 秒、低峰期延迟 5 秒” 的动
Flink Table API 实战:Kafka 实时写入 Paimon 数据湖(基于 Hive Metastore 元数据管理)
2026-03-12
4
0
0
24.4℃
flin基础操作
在湖仓一体的大数据架构趋势下,Paimon(原 Flink Table Store)凭借流批一体的特性成为数据湖建设的优选方案,而Flink作为新一代流批一体计算引擎,能高效实现实时数据的接入与处理,Hive Metastore则为跨引擎的元数据管理提供了标准化能力。本文将详细讲解如何通过 Flin
Flink DataStream读取Kafka写入Paimon(使用Hive Metastore)
2026-03-02
63
0
1
32.3℃
flin基础操作
在湖仓一体的实时数仓架构中,Paimon 凭借其流批一体、高吞吐、低延迟的存储特性,成为了数据湖建设的核心存储引擎;而Flink 作为主流的实时计算框架,与 Kafka、Paimon 的生态融合性极佳,是实现实时数据采集、处理、入湖的最优组合之一。本文将详细讲解基于 Flink DataStream
flink作业提交样例
2026-02-13
51
0
0
29.1℃
flin基础操作
flink提供两种主流提交模式(生产推荐的 Application 模式 和 共享资源的 Session 模式)。 Application Mode(应用模式):每个作业启动一个独立的 Flink 集群,作业的main方法直接运行在 YARN 的 JobManager 上。 Session Mode
flink sql读取kafka写入paimon
2026-02-04
35
0
0
27.5℃
flin基础操作
一、什么是 Flink Hive Catalog? HiveCatalog 是 Flink 提供的一种 Catalog 实现,它允许 Flink 直接读取和写入 Hive Metastore 中定义的数据库、表、分区、函数等元数据。通过 HiveCatalog:
flink依赖配置
2026-02-02
22
0
0
26.2℃
flink安装部署
flink 1.20.3下载 # 官网: wget https://dlcdn.apache.org/flink/flink-1.20.3/flink-1.20.3-bin-scala_2.12.tgz # 清华镜像: wget https://mirrors.tuna.tsinghua.edu.c
flink barrier机制
2025-11-04
8
0
0
24.8℃
flink
好的,Flink 的 Barrier(屏障) 是其**容错机制的核心**,特别是实现 分布式一致性快照 的基石。理解 Barrier 是理解 Flink 如何保证“精确一次”语义的关键。 --- ### 一、Barrier 是什么? 简单比喻: 想象一个游乐场的过山车,管理人员想在某一精确时刻为所有
弹
通知
通知
本通知将在
null
秒后自动消失
我知道了