第一天上午
|
Scala语言介绍
Scala语言安装
Scala快速入门介绍
什么Spark
Spark的简介
Spark的编译
Spark的安装
Spark安装成功测试 |
第一天下午 |
Spark原理
Spark的RDD
什么是RDD
RDD的种类
Spark的存储级别
Cache介绍
Spark的容错原理
Lineage容错
Checkpoint容错
RDD的创建
案例
|
第二天上午
|
Spark调度组件
RDD graph
作业与任务调度
DAG Scheduler
Task Scheduler
Task细节
Job的调度流程
Broadcast variables介绍
Spark的优化
Spark的生态系统
Spark与hadoop的比较
Spark的使用场景介绍 |
第二天下午 |
Spark实战一:求最大值
Spark实战二:自定义RDD(define a new RDD)
Spark实战三:RDD创建的种类(Scala、HDFS、localdisk and
inputformat)
Spark实战四:基于Spark的日志分析 |