点播 SparkSQL极速入门  整合Kudu实现广告业务数据分析

课程时长 42小时33分钟

学习期限 12 个月 退款期限 30 天

市场价格 ¥388.00 会员价格 ¥310.00

难度级别 中级 学习人次 953 综合评分 4.2

内容实用 4.3 分

简洁易懂 4.2 分

逻辑清晰 4.0 分

  • 详情
  • 目录
  • 套餐3
  • 评价13

第1章 课程介绍&学习指南

  • 1-1 课程导学 试听
    23分钟35秒
  • 1-2 ***学前必读***(助你平稳踩坑,畅学无忧,课程学习与解决问题指南)
    19分钟28秒

第2章 为什么要学Spark

  • 2-1 课程目录
    10分钟30秒
  • 2-2 MapReduce的槽点
    27分钟23秒
  • 2-3 Spark特性详解
    16分钟47秒
  • 2-4 Spark Stack
    23分钟52秒
  • 2-5 OOTB环境的使用
    19分钟23秒
  • 2-6 JDK部署
    26分钟18秒
  • 2-7 Maven部署
    13分钟44秒
  • 2-8 IDEA部署
    28分钟14秒
  • 2-9 HDFS部署
    18分钟58秒
  • 2-10 YARN部署
    25分钟30秒
  • 2-11 Hive部署
    19分钟22秒
  • 2-12 Spark运行模式
    13分钟40秒
  • 2-13 使用IDEA和Maven开发第一个Spark应用程序
    28分钟29秒
  • 2-14 词频统计按照单词出现次数的降序排列
    22分钟29秒
  • 2-15 local模式下spark-shell的使用
    22分钟04秒
  • 2-16 local模式下使用spark-submit提交Spark应用程序
    14分钟23秒
  • 2-17 YARN模式下提交Spark应用程序
    14分钟
  • 2-18 Standalone模式下提交Spark应用程序
    15分钟06秒
  • 2-19 Hadoop和Spark生态圈对比
    16分钟44秒
  • 2-20 Hadoop与Spark对比
    12分钟23秒
  • 2-21 Spark和Hadoop的相互协作
    13分钟54秒

第3章 Spark SQL快速入门

  • 3-1 课程目录 试听
    26分钟34秒
  • 3-2 为什么需要SQL
    12分钟19秒
  • 3-3 SQL on Hadoop
    18分钟48秒
  • 3-4 详解Spark SQL是什么以及常见误区解读
    20分钟57秒
  • 3-5 Spark SQL概述
    16分钟05秒
  • 3-6 为什么要学习Spark SQL
    10分钟27秒
  • 3-7 Spark SQL架构
    20分钟37秒
  • 3-8 spark-shell使用详解
    16分钟58秒
  • 3-9 spark-sql使用详解并结合讲解Catalyst的执行过程
    14分钟25秒
  • 3-10 spark-shell启动流程分析之uname以及case匹配的使用
    26分钟56秒
  • 3-11 spark-shell启动流程分析之dirname和if的使用
    19分钟43秒
  • 3-12 spark-shell启动流程分析之传递参数详解
    15分钟08秒
  • 3-13 spark-shell启动流程分析之spark-submit
    10分钟15秒
  • 3-14 spark-sql启动流程分析
    24分钟58秒

第4章 Spark SQL API编程

  • 4-1 课程目录
    27分钟06秒
  • 4-2 认知SparkSession
    16分钟11秒
  • 4-3 了解SQLContext
    21分钟01秒
  • 4-4 认识DataFrame
    20分钟51秒
  • 4-5 DataFrame API基本使用
    20分钟53秒
  • 4-6 DataFrame中前N条的取值方式
    23分钟08秒
  • 4-7 通过实战案例学习DataFrame常用API
    25分钟37秒
  • 4-8 Dataset概述及操作
    28分钟49秒
  • 4-9 DataFrame vs Dataset
    18分钟49秒
  • 4-10 Interoperating with RDD概述
    21分钟31秒
  • 4-11 实现方式一
    26分钟18秒
  • 4-12 实现方式二
    15分钟12秒

第5章 Data Source API

  • 5-1 课程目录 试听
    27分钟31秒
  • 5-2 Data Source概述
    21分钟42秒
  • 5-3 text数据源读写案例
    12分钟29秒
  • 5-4 SaveMode的使用详解
    22分钟33秒
  • 5-5 json数据源案例
    12分钟46秒
  • 5-6 Data Source API标准写法
    13分钟51秒
  • 5-7 Parquet数据源案例
    14分钟54秒
  • 5-8 Data Source格式转换
    21分钟19秒
  • 5-9 jdbc数据源案例
    26分钟18秒
  • 5-10 通过统一配置参数管理工程中使用到的参数
    29分钟38秒

第6章 整合Hive操作及函数

  • 6-1 课程目录
    15分钟07秒
  • 6-2 Spark对接Hive的原理及实操
    11分钟13秒
  • 6-3 thriftserver&beeline的使用
    26分钟24秒
  • 6-4 使用代码连接Server
    15分钟19秒
  • 6-5 Server模式vs例行作业模式(思考题)
    13分钟43秒
  • 6-6 hive数据源案例
    24分钟44秒
  • 6-7 Spark SQL内置函数实战
    29分钟09秒
  • 6-8 Spark SQL自定义UDF实战
    24分钟04秒

第7章 Kudu入门

  • 7-1 课程目录
    26分钟13秒
  • 7-2 kudu概述&核心概念&架构
    11分钟38秒
  • 7-3 kudu部署
    17分钟26秒
  • 7-4 API操作之创建表
    10分钟20秒
  • 7-5 API操作之插入数据&删除表&数据查询
    14分钟11秒
  • 7-6 API操作之修改表数据及表名
    14分钟32秒
  • 7-7 Spark整合Kudu的读写操作
    20分钟19秒

第8章 基于Spark SQL和Kudu的广告业务项目实战(一)

  • 8-1 课程目录
    22分钟15秒
  • 8-2 广告业务背景
    28分钟11秒
  • 8-3 项目需求
    10分钟52秒
  • 8-4 项目架构及数据处理流程
    11分钟42秒
  • 8-5 日志字段说明
    12分钟02秒
  • 8-6 需求一之IP规则库解析
    10分钟37秒
  • 8-7 需求一之使用API编程完成日志ip字段解析
    25分钟56秒
  • 8-8 需求一之使用SQL方式完成日志ip字段解析
    11分钟
  • 8-9 需求一之ODS数据落地到Kudu
    22分钟58秒
  • 8-10 需求一之落地到Kudu表重构
    23分钟43秒
  • 8-11 需求二功能实现
    22分钟13秒
  • 8-12 需求一二代码结构大重构
    18分钟25秒

第9章 基于Spark SQL和Kudu的广告业务项目实战(二)

  • 9-1 课程目录
    23分钟53秒
  • 9-2 需求三之第一阶段统计功能实现
    14分钟36秒
  • 9-3 需求三之第二阶段统计功能实现
    17分钟13秒
  • 9-4 需求三之统计结果落地到Kudu
    11分钟11秒
  • 9-5 需求四功能实现
    29分钟20秒
  • 9-6 通过参数传递到Spark作业重构代码并打包
    21分钟05秒
  • 9-7 将项目运行在服务器上
    12分钟40秒
  • 9-8 定时调度提交Spark作业到服务器运行
    28分钟41秒
  • 9-9 本章节小结
    12分钟40秒

第10章 Spark调优策略

  • 10-1 课程目录
    22分钟39秒
  • 10-2 调优之资源设置
    26分钟54秒
  • 10-3 广播变量在Spark中的使用一
    17分钟05秒
  • 10-4 广播变量在Spark中是使用二
    25分钟25秒
  • 10-5 广播变量思考题(重要)
    29分钟36秒
  • 10-6 Shuffle调优
    12分钟12秒
  • 10-7 Spark与GC相关概念理解
    12分钟46秒
  • 10-8 JVM GC引起的问题调优
    17分钟47秒
  • 10-9 其他调优
    26分钟23秒

第11章 Presto初识

  • 11-1 课程目录
    18分钟29秒
  • 11-2 Presto是什么&能做什么&谁在使用它
    26分钟16秒
  • 11-3 Presto架构
    22分钟18秒
  • 11-4 Presto部署
    27分钟53秒
  • 11-5 整合MySQL Connector
    23分钟06秒
  • 11-6 整合Hive Connector
    16分钟09秒
  • 11-7 Presto整合多个Connector操作
    27分钟49秒
  • 11-8 Presto API操作
    27分钟39秒

第12章 云平台建设的思考

  • 12-1 课程目录
    22分钟19秒
  • 12-2 大数据项目和平台的差异性对比
    27分钟55秒
  • 12-3 认知云平台能为我们提供的能力
    18分钟42秒
  • 12-4 大数据云平台功能架构
    29分钟36秒
  • 12-5 数据湖架构
    18分钟13秒
  • 12-6 数据存储和计算角度剖析
    16分钟47秒
  • 12-7 资源角度剖析
    21分钟21秒
  • 12-8 兼容性角度剖析
    23分钟31秒
  • 12-9 执行引擎和运行方式适配角度剖析
    29分钟15秒
  • 12-10 Spark和Flink的选择
    25分钟35秒

第13章 (讨论群内直播内容分享)Spark3新特性

  • 13-1 Spark概述
    29分钟36秒
  • 13-2 Spark3.x新特性
    15分钟36秒
  • 13-3 DataSource API V2
    27分钟33秒
  • 13-4 动态分区裁剪
    16分钟28秒
  • 13-5 自适应查询执行
    16分钟31秒
953
13
0
0