Superset连接Hiveserver2
- 2025-11-11
- 52
- 0
- 0
- 29.2℃
Superset 本身没有提供链接 Hive的想先,可以使用 PyHive 或 Impyla 这类专门的适配器库来与 HiveServer2 通信。 一:环境准备(安装连接器驱动) 首先,需要在运行 Superset 的 Python 环境中安装必要的 Python 库。 推荐使用 PyHive 方
ubuntu切换ananconda国内镜像源
- 2025-11-10
- 63
- 0
- 0
- 30.3℃
在 Ubuntu 系统中切换 Anaconda 的软件源可以显著提高包下载速度。以下是详细的步骤: 1. 查看当前 conda 配置 conda config --show-sources
conda config --show channels 2. 添加国内镜像源 方法一:
查询前2大和前2小用户并有序拼接
- 2025-11-09
- 15
- 0
- 0
- 25.5℃
一、题目 有用户账户表:包含年份,用户id和余额。请按照年份分组,取出余额前两小和前两大对应的用户id。**注意:**需要保持余额最小和最大的用户id排首位。 二、思路 1、计算每年 每个用户余额的升序排名和降序排名。升序排名前两名就是余额前两小的用户,降序排名前两名就是前两大的用户。可以使用row
查询每个学科第三名的学生的学科成绩总成绩及总排名
- 2025-11-09
- 16
- 0
- 0
- 25.6℃
一、题目 有学生成绩表,包含学生姓名、学科、成绩三个字段,请用一条SQL查询出每个学科排名第三名的学生,他的学科成绩、总成绩、以及总排名。 二、思路 第一步:计算学科排名和总成绩,可以使用rank和sum的开窗函数实现 第二步:计算总成绩排名,可以使用dense_rank实现
每年成绩都有所提升的学生
- 2025-11-09
- 17
- 0
- 0
- 25.7℃
一、题目 一张学生成绩表(student_scores),有year-学年,subject-课程,student-学生,score-分数这四个字段,请完成如下问题: 问题1:每年每门学科排名第一的学生 问题2:每年总成绩都有所提升的学生 数据如下 二、思路 问题1:每年每门学科排名第一的学生。这个问
连续点击三次以上的用户
- 2025-11-09
- 16
- 0
- 0
- 25.6℃
一、题目 有用户点击日志记录表 user_click_log,包含user_id(用户ID), click_time(点击时间),请查询出连续点击三次以上的用户数, 连续点击三次:指点击记录中同一用户连续点击,中间无其他用户点击; 二、思路 看下图总结一下规律:如果一个用户连续点击中间没有其他用户,