Skip to content

认识MinIO —— 一种高性能、S3兼容的对象存储

MinIO简直太完美了,强烈推荐。

现代开源分布式大数据产品往往都依赖于Hadoop的HDFS文件系统,对于初学者来说学习起来稍微有一点吃力。

数据湖技术如今成为香饽饽,hudi、icebege、paimon等数据湖常用格式也都依赖于HDFS文件系统。很长时间我一直在思考如何让初学者可以非常轻松的开始学习这些前沿技术,而不是折腾这种产品的部署,以至于最后半途而废。

这是对象存储就是一个很好的选择,比如阿里云的OSS、亚马逊的S3等都非常好用,大家不用再关心部署就可以立即使用。然而这些产品都是商业产品,如果使用首选要注册账号等,甚至还会产生一定的费用。对于初学者而言这确实不太友好。

那么有没有开源、免费的对象存储服务呢?答案是肯定的,就是我苦苦寻找了良久的MinIO。

什么是MinIO

MinIO 是一个高性能的、S3 兼容的分布式对象存储系统。 它专为大规模 AI/ML、数据湖和数据库工作负载而构建。并且它是由软件定义的存储,不需要购买任何专有硬件,就可以在云上和普通硬件上拥有分布式对象存储。并且 100% 开源,主要许可证是 GNU AGPL v3。

MinIO 的不同之处在于它从一开始就被设计为私有/混合云对象存储的标准。 因为 MinIO 是专门为对象而构建的,所以单层架构可以毫不妥协地实现所有必要的功能。 结果是一个同时具有高性能、可扩展性和轻量级的云原生对象服务器。

MinIO的特色

简单

简单性是百万兆次级数据基础设施的基础 - 无论是在技术上还是在操作上。MinIO使用和部署非常简单,没有其他对象存储可以让您在最快的时间内实现下载到生产环境的部署。

高性能

MinIO 是世界上最快的对象存储,没有之一。在 32 个 NVMe 驱动器节点和 100Gbe 网络上发布的 GET/PUT 结果超过 325 GiB/秒和 165 GiB/秒。

Kubernetes云原生

通过原生 Kubernetes 运营商集成,MinIO 支持公共云、私有云和边缘云上所有主要的 Kubernetes 发行版。

AI准备

MinIO是为人工智能而构建的,并且可以与每种主要的人工智能/机器学习技术无缝配合使用。从预测模型到生成式人工智能(GenAI),MinIO提供了性能和可伸缩性,以推动企业级人工智能的发展。

MinIO的优势

主动,主动复制

对象存储的主动、多站点复制是任务关键型生产环境的关键要求。MinIO是目前唯一提供它的供应商。MinIO 提供存储桶级粒度,并支持同步和近同步复制,具体取决于架构选择和数据变化率。

加密

在对象存储领域,需要强大的加密才能在谈判桌上占有一席之地。MinIO 通过最高级别的加密以及广泛的优化提供更多功能,几乎消除了通常与存储加密操作相关的开销。

自动化数据管理界面

MinIO提供了一套选项来涵盖数据驱动型企业中的每个角色,例如图形用户界面(GUI),命令行界面(CLI)和应用程序编程接口(API)。MinIO 的数据管理接口可互换运行,以提供精细、高性能和可扩展的对象存储管理。

亚马逊云 S3 兼容性

S3兼容性是云原生应用程序的硬性要求。MinIO 毫不妥协地坚持 API,拥有数以万计的用户(包括商业用户和社区用户),MinIO 的 S3 实施是世界上测试和实施最广泛的 AWS S3 替代方案。

MinIO到底有多受欢迎呢,MinIO已经成为全球增长最快的对象存储系统

进阶

MinIO有很多应用场景,我在此不做过多讨论。但是如果你也对数据湖相关的技术有着浓厚的兴趣,想要快速体验,建议您熟练掌握MinIO的使用,它将大大提高我们的学习效率。想要了解更多关于MinIO,关注:遇码,回复minio,获取官方文档。

遇码MeetCoding 开源技术社区