认识StarRocks
大数据量需要实时查询已经成为很多企业面临的一个难题,为了帮助大家解决这一难题,前面有给大家详细介绍Doris,有兴趣的话可以查看相关内容:
《免费、开源:五分钟带你了解什么是Doris》
那么这时就会有同学要发出灵魂拷问了,Doris难道是唯一选择吗?答案是否定的。我们经常说一山不容二虎,但是在商业领域来讲,一家独大谈何容易。
本文将为大家介绍Doris的竟品——新一代极速全场景MPP数据库StarRocks。
什么是StarRocks
StarRocks 是新一代极速全场景 MPP (Massively Parallel Processing) 数据库。
StarRocks 的愿景是能够让用户的数据分析变得更加简单和敏捷。 用户无需经过复杂的预处理,就可以用 StarRocks 来支持多种数据分析场景的极速分析。
StarRocks 兼容 MySQL 协议,支持标准 SQL 语法,易于对接使用,全系统无外部依赖,高可用,易于运维管理。StarRocks 还兼容多种主流 BI 产品,包括 Tableau、Power BI、FineBI 和 Smartbi。
StarRocks 能很好地支持实时数据分析,并能实现对实时更新数据的高效查询。
StarRocks适用哪些场景
StarRocks 可以满足企业级用户的多种分析需求,包括 OLAP (Online Analytical Processing) 多维分析、定制报表、实时数据分析和 Ad-hoc 数据分析等。
OLAP 多维分析
利用 StarRocks 的 MPP 框架和向量化执行引擎,用户可以灵活的选择雪花模型,星型模型,宽表模型或者预聚合模型。适用于灵活配置的多维分析报表,业务场景包括:
用户行为分析
用户画像、标签分析、圈人
高维业务指标报表
自助式报表平台
业务问题探查分析
跨主题业务分析
财务报表
系统监控分析
实时数据仓库
StarRocks 设计和实现了主键表,能够实时更新数据并极速查询,可以秒级同步 TP (Transaction Processing) 数据库的变化,构建实时数仓,业务场景包括:
电商大促数据分析
物流行业的运单分析
金融行业绩效分析、指标计算
直播质量分析
广告投放分析
管理驾驶舱
探针分析APM(Application Performance Management)
高并发查询
StarRocks 通过良好的数据分布特性,灵活的索引以及物化视图等特性,可以解决面向用户侧的分析场景,业务场景包括:
广告主报表分析
零售行业渠道人员分析
SaaS 行业面向用户分析报表
Dashboard 多页面分析
统一分析
通过使用一套系统解决多维分析、高并发查询、预计算、实时分析查询等场景,降低系统复杂度和多技术栈开发与维护成本。
使用 StarRocks 统一管理数据湖和数据仓库,将高并发和实时性要求很高的业务放在 StarRocks 中分析,也可以使用 External Catalog 和外部表进行数据湖上的分析。
StarRocks初体验
使用docker,只需要一行命令我们就可以快速体验StarRocks了
docker run -p 9030:9030 -p 8030:8030 -p 8040:8040 -itd \
--name quickstart starrocks/allin1-ubuntu
此处需要用到docker,没有安装docker的同学建议学习一下,日后会非常方便。由于一些不可言说的原因,可能需要科学上网才能访问,请同学们自行解决。
由于镜像比较大,首次下载镜像会比较慢,同学们要耐心等待哦。
容器启动以后,访问StarRocks的Web UIhttp://localhost:8030/
,用户名root
,密码为空。
登录成功后可以查看相关信息。
与Doris不同的是,StarRocks提供的Web UI界面无法直接查询数据,查询数据则需要用Mysql客户端。
此处以DBeaver为例连接StarRocks,成功后就可以像使用Mysql数据一样来使用StarRocks了。
进阶
不管是Doris还是StarRocks,都可以很好的解决大数据场景下实时数据分析难的问题。从学习的角度而言,我们只需要优先选择一个就可以,不断从入门到进阶;从生产环境应用而言,我们可以对两款产品做充分调研之后,选择更加适合自身业务的产品。
想要了解更多有关StarRocks的具体内容,你可以关注:遇码,回复starrocks,获取StarRocks官方文档。