Skip to content

5分钟带你了解Apache Doris

事情的起因是这样的

首先感谢大家和我互动,我尽量虚心接受大家的建议,尽量考虑到不同阶段的读者,尽量为大家提供更多原创内容。

之前有写过《一个神奇的开源大数据必备工具——实时数仓Apache Doris》,专门介绍了Doris。又写了《基于Flink CDC实现Mysql实时同步到Doris系列教程》,在我心里可能就想当然的以为我的每一位读者都已经知道什么是Doris了。是我没有考虑到每天都有很多新的读者关注我,他们都是第一次看到我的内容,我的每一篇内容都应该考虑到每一位读者的接受度。所以以后我尽量可以把相关内容写清楚或者通过链接的方式方便新的读者查看。

为了满足大家的求知欲,我也主打一个听劝,本文再啰嗦一遍,重新介绍一下什么是Doris。

什么是Doris

Apache Doris 是一款基于 MPP 架构的高性能、实时的分析型数据库,以高效、简单、统一的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。

换句话说,Doris是一款免费、开源、易用且查询速度非常快的数据库,完全可以满足大数据分析场景,这也是我为什么会推荐大家体验Doris。

Apache Doris

Doris的前世今生

  • Doris 最早是诞生于百度广告报表业务的 Palo 项目
  • 2017 年正式对外开源
  • 2018 年 7 月由百度捐赠给 Apache 基金会进行孵化,之后在 Apache 导师的指导下由孵化器项目管理委员会成员进行孵化和运营。
  • 2022 年 6 月,Apache Doris 成功从 Apache 孵化器毕业,正式成为 Apache 顶级项目(Top-Level Project,TLP)。

目前 Apache Doris 社区已经聚集了来自不同行业数百家企业的 600 余位贡献者,并且每月活跃贡献者人数也超过 120 位。

谁在使用Doris

  • 中大型企业

全球超过4000家中大型企业在生产环境中使用Doris。在中国市值或估值排行前 50 的互联网公司中,有超过 80% 长期使用 Apache Doris,包括百度、美团、小米、京东、字节跳动、阿里巴巴、腾讯、网易、快手、微博等

  • 重要行业

金融、消费、电信、工业制造、能源、医疗、政务等领域也有着丰富的应用。金融行业可谓技术产品的炼金石、风向标。

  • 云厂商

阿里云、华为云、天翼云、腾讯云、百度云、火山引擎等都在提供托管的 Apache Doris 的云服务。也就是说我们不需要自己部署,直接购买云服务就可以直接使用。

Doris整体架构

Doris 采用 MySQL 协议,高度兼容 MySQL 语法,支持标准 SQL,用户可以通过各类客户端工具来访问 Doris,并支持与 BI 工具的无缝对接。

Doris架构图

Doris架构也非常简单,只有两类进程:

  • Frontend(FE)

主要负责用户请求的接入、查询解析规划、元数据的管理、节点管理相关工作

  • Backend(BE)

主要负责数据存储、查询计划的执行

需要注意的是,这两类进程都是可以横向扩展的,单集群可以支持到数百台机器,数十 PB 的存储容量。并且这两类进程通过一致性协议来保证服务的高可用和数据的高可靠。这种高度集成的架构设计极大地降低了一款分布式系统的运维成本。

至此,用简短的篇幅为大家介绍了什么是Doris,希望可以帮助到大家。

进阶

了解了什么是Doris,也学会了如何快速部署Doris,接你下来你是否想要继续学习Doris的用法呢?你可以关注:遇码,回复doris,获取Doris官方文档。

遇码MeetCoding 开源技术社区