Hive 教程

Hive 是一个在 Hadoop 中处理结构化数据的数据仓库基础设施工具。它驻留在 Hadoop 之上 , 总结大数据 , 并使查询和分析变得容易。

这是一个简短的教程 , 介绍了如何将 Apache Hive HiveQL 与 Hadoop 分布式文件系统结合使用。本教程可以成为您成功使用 Hive 的 Hadoop 开发人员的第一步。

观众

本教程是为有志于使用 Hadoop 框架从事大数据分析的专业人士准备的。 ETL 开发人员和一般分析的专业人士也可以使用本教程来取得良好的效果。

先决条件

在继续本教程之前 , 您需要了解 Core Java 、 SQL 的数据库概念、 Hadoop 文件系统以及任何 Linux 操作系统版本的基本知识。