Hadoop 3.2.4 伪分布式安装指南


环境准备 1. 系统要求 当前环境和版本: ubuntu24 hadoop-3.2.4 2. 安装必要的软件包:jdk和系统依赖 jdk可以从oracle官网下载,也可以使用linux安装openjdk,

spark内存模型


exector内存模型: spark执行器包含了堆内存、堆外内存和非堆内存三部分组成。 堆内存: 存储内存(Storage Memory): 作用:主要用

flink barrier机制

flink 

好的,Flink 的 Barrier(屏障) 是其**容错机制的核心**,特别是实现 分布式一致性快照 的基石。理解 Barrier 是理解 Flink 如何保证“精确一次”语义的关键。 --- ### 一、Barrier 是什么? 简单比喻: 想象一个游乐场的过山车,管理人员想在某一精确时刻为所有

使用python安装superset5


环境: 服务器:Ubuntu 22.04.5 LTS python:3.11.9 superset:5.0.0 操作系统依 Superset 在其元数据数据库中存储数据库连接信息。为此,我们使用 cryptography Python 库来加密连接密码,此库需要操作系统级别的依赖项。 Ubuntu

dolphinscheduler3.2.2 standalone安装部署


一、环境准备 系统要求 JDK 1.8:需配置 JAVA_HOME 环境变量 。 MySQL 8:用于持久化元数据(避免默认 H2 数据库重启丢失数据),本文使用的mysql8。 DolphinScheduler:版本:3.2.2 系统:Ubuntu 22.04 LTS