Apache Pig 教程

Apache Pig 是对 MapReduce 的抽象。它是一种工具 / 平台 , 用于分析将其表示为数据流的较大数据集。猪通常与 Hadoop ; 我们可以使用 Pig 在 Hadoop 中执行所有数据操作。

观众

本教程适用于所有在 Hadoop 上工作的专业人士 , 他们希望执行 MapReduce 操作而不必在 Java 中键入复杂代码。

先决条件

为了充分利用本教程 , 您应该对 Hadoop 和 HDFS 命令的基础知识有很好的了解。如果您擅长 SQL , 它肯定会有所帮助。