嘟嘟社区

尚硅谷大数据项目之线上问诊离线数仓


链接:https://pan.quark.cn/s/d12985c67ad0

描述:本套项目教程以线上问诊为基础业务,真实还原了线上问诊平台对于用户数据的分析和统计,并以大屏展示的方法呈现数据分析的结果。
项目共分四大部分:数仓建模原理介绍、数仓模型搭建、DolphinScheduler全流程调度、SuperSet可视化大屏展示,以线上问诊采集项目为前置基础,使用线上问诊采集项目的基础架构,将数据导入数仓中,对数据进行系统化的分析计算,最终得到指标需求结果。
项目中使用的框架包括:Hadoop、Hive、Spark、Kafka、Flume、Flink-CDC、Datax、DolphinScheduler、SuperSet等。通过本套视频教程的学习,你将彻底了解数仓建模理论体系,深入认识线上问诊平台的业务理论体系!