快速部署Hive
为什么要讲Hive的部署呢?有三个原因:
通过亲自部署Hive,同学们可以对Hive有一个直观的感受
本地部署Hive后就可以上手学习Hive的使用,很多学习者都是苦于没有实操的环境而放弃的
最重要的一个原因就是在后续的教程中可能会使用到Hive环境,为后面的学习做好铺垫
本文重点为同学们介绍如何在本地快速部署Hive环境。
环境准备
本文演示采用Windows系统。
基于Docker部署Hive,需要安装Docker Desktop。
再次强烈建议同学们学习Docker的使用,真的不要太方便啊。
开始部署Hive
- 启动Docker Desktop
- 在顶部搜索框搜索hive,认准Hive的logo,选择
apache/hive
镜像,Tag默认4.0.0
,点击Pull
拉取镜像
- 在Images镜像列表页查看
apache/hive
镜像,点击Run
启动容器
- 完善容器的信息,点击
Run
运行
Container name:容器名可以自行修改
Host port:容器暴露端口号可以保持与容器内端口号一致
Environment variables:环境变量Variable为:SERVICE_NAME,VALUE为:hiveserver2。环境变量变量名和值必须与本图例一样。
- 在Containers容器列表页查看已经创建好的容器并运行
- 访问Web UI
http://localhost:10002
,验证Hive服务有没有正常启动
- 使用DBeaver连接Hive
注意,此处使用的端口号是10000
至此,我们就可以在DBeaver中体验并使用Hive了。
进阶
同学们可能已经对Mysql有了一定的了解,以为SQL都是一样的就以为不需要学习Hive了。实际的情况则是SQL确实十分相似,但是在使用Hive的过程中你会真正接触到大数据领域常用的一些概念,比如分区、窗口函数等。建议刚接触大数据领域的同学通过Hive打好基础。
如果想要进一步学习Hive,可以关注:遇码,回复hive,获取官方文档。