Apache Spark 教程

Apache Spark 是专为快速计算而设计的闪电般的集群计算。它构建在 Hadoop MapReduce 之上 , 它扩展了 MapReduce 模型 , 以有效地使用更多类型的计算 , 包括交互式查询和流处理。这是一个简短的教程 , 解释了 Spark Core 编程的基础知识。

观众

本教程是为有志于使用 Spark Framework 学习大数据分析基础知识并成为 Spark 开发人员的专业人士准备的。此外 , 它对分析专业人员和 ETL 开发人员也很有用。

先决条件

在开始学习本教程之前 , 我们假设您已经接触过 Scala 编程、数据库概念和任何 Linux 操作系统版本。