Skip to content

快速部署Hive

为什么要讲Hive的部署呢?有三个原因:

  1. 通过亲自部署Hive,同学们可以对Hive有一个直观的感受

  2. 本地部署Hive后就可以上手学习Hive的使用,很多学习者都是苦于没有实操的环境而放弃的

  3. 最重要的一个原因就是在后续的教程中可能会使用到Hive环境,为后面的学习做好铺垫

本文重点为同学们介绍如何在本地快速部署Hive环境。

环境准备

本文演示采用Windows系统。

基于Docker部署Hive,需要安装Docker Desktop。

再次强烈建议同学们学习Docker的使用,真的不要太方便啊。

开始部署Hive

  1. 启动Docker Desktop

  1. 在顶部搜索框搜索hive,认准Hive的logo,选择apache/hive镜像,Tag默认4.0.0,点击Pull拉取镜像

  1. 在Images镜像列表页查看apache/hive镜像,点击Run启动容器

  1. 完善容器的信息,点击Run运行

Container name:容器名可以自行修改

Host port:容器暴露端口号可以保持与容器内端口号一致

Environment variables:环境变量Variable为:SERVICE_NAME,VALUE为:hiveserver2。环境变量变量名和值必须与本图例一样。

  1. 在Containers容器列表页查看已经创建好的容器并运行

  1. 访问Web UIhttp://localhost:10002,验证Hive服务有没有正常启动

  1. 使用DBeaver连接Hive

注意,此处使用的端口号是10000

至此,我们就可以在DBeaver中体验并使用Hive了。

进阶

同学们可能已经对Mysql有了一定的了解,以为SQL都是一样的就以为不需要学习Hive了。实际的情况则是SQL确实十分相似,但是在使用Hive的过程中你会真正接触到大数据领域常用的一些概念,比如分区、窗口函数等。建议刚接触大数据领域的同学通过Hive打好基础。

如果想要进一步学习Hive,可以关注:遇码,回复hive,获取官方文档。

遇码MeetCoding 开源技术社区