近30天连续登陆3天以上次数-非开窗

MST 

一、题目 有用户登录记录,已经按照日期去重。求近三十天,用户连续登录超过3天的次数,一直连续登录算一次,有间隔然后重新计算次数, 要求不能用开窗。 数据样例如下: 二、思路 这是一个连续问题:连续问题的解决思路是找到日期和升序序号差值相同的记录,相同则表示日期连续,不同则日期不连续。题目强调不能使用

各用户最长的连续登录天数-可间断

MST 

一、题目 现有各用户的登录记录表zbj_login_events如下,表中每行数据表达的信息是一个用户何时登录了平台。 现要求统计各用户最长的连续登录天数,间断一天也算作连续,例如:一个用户在1,3,5,6登录,则视为连续4天登录。 二、思路 这是

处理缺失值

MST 

一、题目 现有用户账户表,包含日期、用户id、用户余额,其中用户余额发生了缺失,需要进行补全。补全规则:如果余额为空则取之前最近不为空值进行填补。如果截止到最早日期都为空则补0; 二、思路 题目要求使用当天之前的余额进行补全,需要明确一点不是取前面一天而是取前面最近的不为空的余额。所以首先需要知道前

查询每个产品每年总销售额

MST 

一、题目 已知有表如下,记录了每个产品id、产品名称、产品销售开始日期、产品销售结束日期以及产品日均销售金额,请计算出每个产品每年的销售金额。 二、思路 要计算每个产品每年的销售金额,需要得到每年的销售明细,观察数据可以发现有销售开始和结束日期,可以借此得到每个产品每天的销售额,lateral vi

奖金瓜分问题

MST 

一、题目 在活动大促中,有玩游戏瓜分奖金环节。现有奖金池为 10000元,代表奖金池中的初始额度。用户的分数信息如下表。表中的数据代表每一个用户和其对应的得分,user_id 和 score 都不会有重复值。瓜分奖金的规则如下:按照 score 从高到低依次瓜分,每个人都能分走当前奖金池里面剩余奖金

连续登陆超过N天的用户

MST 

一、题目 现有用户登录日志表 user_login_log,包含用户ID(user_id),登录日期(login_date)。数据已经按照用户日期去重,请查出连续登录超过4天的用户ID 样例数据

指标系统


1、指标系统介绍 指标系统是一套围绕企业业务目标,对关键数据指标进行标准化定义、自动化计算、可视化展示及动态管理的数字化工具。通过整合分散的业务数据,它可以将抽象的业务场景转化为可量化的指标体系,帮助企业实时掌握运营状态、快速定位问题并支撑决策优化,是连接业务与数据的核心桥梁。 背景 下面看看指标系

指标建设规范


一、指标定义 指标是用于衡量业务目标达成程度的可量化参数,它是将抽象的业务目标转化为具体、可操作、可衡量的数值标识。在企业运营中,指标如同 “导航仪”,通过对业务数据的提炼和计算,直观展现业务的运行状态、发展趋势和存在问题。 例如,电商企业的 “销售额” 指标,能够直接反映企业的销售业绩;互联网产品

数据质量监控报警


配置好建模任务后,如何保障任务连续性和数据质量? 比如调度任务若因系统故障、资源不足或代码错误导致失败,未配置监控时需人工巡检才能发现,可能延误数小时甚至数天,如何解决?再比如重要数据必须9点前产出,如何保证?数据是否有重复?值是否准确? 下面从数据质量监控分类(完整性、准确性、一致性、时效性)和报

常用的任务调度系统


一、任务调度系统在数据仓库中的核心价值 在数据仓库体系中,任务调度系统扮演着 "神经中枢" 的角色,其核心作用体现在: 自动化流程控制:实现 ETL 作业、数据同步、报表生成等任务的定时触发与执行 依赖关系管理:处理任务间的上下游依赖(如必须先完成 ods 层数据加载才能执行 dws 层聚合) 资源