让快更快,火山引擎ByteHouse为ClickHouse提速
2023-09-01 06:04:03 来源:中关村在线
近日,火山引擎数智平台VeDI与DataFun联合举办以“OLAP计算引擎”为主题的直播活动,来自火山引擎数智平台VeDI的产品专家从技术选型、能力分析、性能优化以及应用场景落地多个角度,介绍火山引擎ByteHouse如何基于ClickHouse实现实时计算能力升级。
据介绍,火山引擎ByteHouse来源于字节跳动多年内部沉淀。由于场景越来越丰富以及数据分析需求增长,业务对于实时数仓的要求也越来越高。首先是数据体量大以及不断增长的问题。早在2019 年,字节内部每天新增的数据量就达到了100TB。其次,在海量数据基础上,由于数据类型多样(包括批式数据和流式数据)、查询需求多样、交互式分析复杂,数据引擎需要具备灵活性。目前,行业Redis、 SparkSQL 等开源方案可以从不同角度满足上述两个需求,但是维护多个开源数据库将导致成本高,选择一款可以避免成本无限扩展的计算引擎成为字节数据研发首要考虑的问题。
(资料图片仅供参考)
ClickHouse性能高、灵活性强,且主要依赖磁盘、成本相对可控,成为字节跳动内部计算引擎的首选。但原生 ClickHouse 能力难以支持 upset 、实时数据更新等一些场景,在很多层面有局限性,例如:
· 单表性能强劲,但多表能力局限,且对标准 SQL 兼容性低。
· 缺乏成熟运维管理工具,运维复杂程度高。
· ClickHouse 为 MPP 架构(存算一体架构),性能强,但横向扩容成本非常高、数据隔离性差。
ByteHouse产品专家在直播中介绍到,“为了解决以上问题,我们主要从4个方向进行优化,让OLAP引擎能力、性能、运维、架构进一步升级。”
第一,丰富的自研表引擎,实现OLAP引擎能力进化。 ByteHouse 弥补了ClickHouse表引擎的不足,并衍生出全新的表引擎,包括使高可用表引擎、实时数据引擎、Unique 引擎、Bitmap 引擎。以Unique 引擎为例,它解决了社区版 ReplacingMergeTree 实时更新延迟问题,真正做到实时 upset。
第二,新增优化器、字典、索引支持能力,实现OLAP引擎性能进化。ClickHouse在多表场景中性能存在缺陷,而ByteHouse 通过自研CBO 和 RBO(基于代价和基于规则的优化器),支持了多层嵌套的下推、Join 子查询的下推、Join-Reorder、Bucket Join、Runtime Filter 等优化器特性,做到 TPC-DS 的性能可以达到 99 条sql100%覆盖,极大提升多表场景下的性能。另外,ByteHouse还支持了全局字典以及更多索引,如 Bitmap index,让查询效率更快。
第三, 自动化、可视化,实现OLAP引擎运维进化。ByteHouse 提供标准化运维、集群健康度检测、问题发生时的诊断工具,帮助运维人员提高效率。例如,集群健康度的检测工具,类似于集群的实时巡检,能够报告当前集群状态、出现了什么问题、问题如何解决,最大程度把问题前置化,降低运维风险。从效果上看, 18000 个节点只需要不到 10 个运维人员来支持。
第四, 存算分离,实现OLAP引擎架构进化。ByteHouse推出了 MPP 2. 0 即存算分离架构。一方面, 存算分离可以更好实现资源隔离,每一个计算任务都会提交到不同的计算资源中,做到用户之间互不影响,还能灵活扩容、缩容存储计算资源;另一方面,存算分离能做到真正云原生(Cloud native),ByteHouse 存储层既支持 HDFS,也支持 S3 对象或者其他的对象存储,实现云原生部署。
目前,ByteHouse已经在行为分析、精准营销、实时监控等业务场景中落地。以实时监控为例,很多互联网APP有线上运营活动、直播电商等业务,数据实时性格外重要。数据从生产到展现在大屏上,延迟往往要控制在分钟级甚至秒级以内。而ByteHouse高吞吐性能、查询性能,使数据从输入端到输出端的流程达到秒级。在数据保障层面,ByteHouse 也能精细到Exactly Once 的语义,保证数据不丢失、不重复,最终达到数据高效存储、准确查询。(作者:吴卓港)
关键词:
[责任编辑:]
相关阅读
- (2023-09-01)让快更快,火山引擎ByteHouse为ClickHouse提速
- (2023-09-01)【世界说】暴力执法、随意枪杀、抹煞历史……美非裔无妄之灾数不胜数 美媒:“种族主义才是美国最致命的恐怖主义之一”
- (2023-09-01)方太:专注创新科技“长期主义”,引领厨电行业高质量发展
- (2023-09-01)气温高达46.6℃!高温预警又来!美国南部遭遇大范围热浪袭击
- (2023-09-01)00后姑娘从北京骑摩托来浙江上学 “读万卷书 行万里路”!
- (2023-09-01)男篮进军巴黎希望渺茫:日本大逆转委内瑞拉 一只脚迈进奥运大门
- (2023-09-01)通道:学前检查116所学校,为校园擦亮“平安”底色
- (2023-09-01)武汉青山公安持续打造融合效能警务
- (2023-09-01)思念她的句子 思念她的语句
- (2023-09-01)这个暑期,他的12家影院能赚七八百万元!电影正在拉动消费
- (2023-09-01)存量房贷利率下调靴子落地,银行体系净息差会受多大影响?
- (2023-09-01)电子连接器业务稳步发展 珠城科技上半年净利同比增长12%
- (2023-09-01)科技财报观丨360二季度营收25.37亿元 安全业务占比超25%
- (2023-09-01)小众旅游文案?
- (2023-09-01)东京真实房价?
- (2023-09-01)东莞+1!广东已有五地官宣“认房不认贷”
- (2023-09-01)原来久坐人会变丑是真的:不要再久坐了
- (2023-09-01)洋房启动!957队伍解说杯拿下首胜 队长直接与队员约线下团建庆祝
- (2023-09-01)15岁女生经常被同龄男同学信息骚扰,甚至用我的照片做视频做背景
- (2023-09-01)《不朽者传奇》PC版性能表现分析:奇葩的谜之优化
- (2023-09-01)死缓是不是可以不死(死缓不会死吗)
- (2023-09-01)毕节纳雍:3000米排水沟扮靓村庄“颜值”
- (2023-09-01)一个暑假跑了900万次,香港人“挤爆”深圳!深圳本地人大受震撼:“差点以为我到了香港”
- (2023-09-01)补阳虚补脾肾的菜 大厨推荐冬天吃这种肉
- (2023-09-01)北向资金净卖出超40亿元
- (2023-09-01)远东控股国际(00036)公布中期业绩,股东应占亏损1280万港元 同比增16%
- (2023-09-01)受台风影响,深圳机场将暂停航班运行
- (2023-09-01)建设银行:依法有序推进降低存量首套住房商业性个人住房贷款利率工作
- (2023-09-01)5个项目签署投资意向书 河南郑州继续扩大资本“朋友圈”
- (2023-09-01)一点灵犀/本港如何竞逐“馀量经济”?\李灵修