首页
学习
活动
专区
工具
TVP
发布

ClickHouse

专栏作者
47
文章
54213
阅读量
16
订阅数
Impala 内存梳理1
Arena 别名参考LevelDB设计, BufferPool 我理解主要是进行按照不同Page大小,缓存不同PerSizeList连续空间..
jasong
2024-03-05
1280
ClickHouse opt 2 QueryPlan::buildQueryPipeline
参考https://bbs.huaweicloud.com/blogs/314808
jasong
2023-11-05
3031
离在线一体 引擎一体化 云原生
OLAP 是一个很卷的赛道,创业公司也众多。在本文中,笔者基于 10+ 年的大数据与数据仓库的工作经验,就目前的主流趋势:离在线一体化、引擎一体化、云原生化等写一些思考,抛砖引玉,希望能与各位共同探讨。
jasong
2023-09-09
2580
腾讯云数据仓库 全新更名TCHouse
欢迎体验试用 /product/tchousex
jasong
2023-09-07
4110
ByConity(ByteHouse) CascadesOptimizer 初探 1
查询过程主要有 class InterpreterSelectQueryUseOptimizer : public IInterpreter 初始化和执行
jasong
2023-08-31
4190
MPP Join RuntimeFilter
RuntimeFIlter: 多用于两表Join 时, 通过减少大表返回行的,减少网络传输、减少数据量、 进而加速Join过程的一种方法
jasong
2023-08-30
2080
Spark RDD -> Stage Task
RDD分为两种: Transformation 转换算子, Action 动作算子
jasong
2023-07-21
1741
c++ string_view
https://www.geeksforgeeks.org/class-stdstring_view-in-cpp-17/
jasong
2023-06-26
2880
列存数据库 Code Generation & Vectorized Model
现在个人只是储备来看,向量化跟以上是都可以兼容的,所有引擎是可以简单都理解为是Valcano Model 的变种吧
jasong
2023-05-14
8730
ClickHouse 基础参数优化
靠谱 users.xml profile M(UInt64, replication_alter_partitions_sync, 1, "Wait for actions to manipulate the partitions. 0 - do not wait, 1 - wait for execution only of itself, 2 - wait for everyone.", 0) \M(Int64, replication_wait_for_inactive_replica_timeout
jasong
2023-04-24
1.1K0
ClickHouse Replicated 高效迁移方案
-config.xml 新增src zookeeper 'src_cluster'
jasong
2023-03-21
9690
Bytes KB MB TB PB..
1KB = 1024 Bytes = 2^10 Bytes = (1L << 10) Bytes
jasong
2023-02-28
1K0
parquet 文件解析
首先parquet 分为数据区域和索引区域, 如图,至于 索引区域为何放到文件末尾大家可以思考下
jasong
2023-02-13
7350
mpp query optimization
声明:本文基本为多篇文章组合而成,仅供参考!(主要参考https://developer.aliyun.com/article/789901?spm=a2c6h.12873581.technical-
jasong
2022-11-24
1.4K0
impala be query plan 3 prepare->open->close
为特定查询创建的所有后端执行状态的中心类(例如:各个片段实例的FragmentInstanceStates)。此类包含或使可访问状态在片段实例之间共享;相反,片段实例特定的状态收集在FragmentInstanceState中。QueryState的生存期由引用计数决定。代表查询执行并访问其任何状态的任何线程都必须获取对相应QueryState的引用,并至少在该访问期间保持该引用。通过QueryExecMgr::Get-/ReleaseQueryState()或QueryState::ScopedRef(后者用于仅限于单个函数或块范围的引用)获取和发布引用。只要引用计数大于0,查询的所有控制结构(包含在该类中或可通过该类访问,如FragmentInstanceStates)都保证是活动的。
jasong
2022-09-28
5520
Impala be query plan2 - AdmissionController
AdmissionController 用于根据在一个或多个资源池中配置的可用集群资源限制请求(例如查询、DML)。请求将被允许立即执行、排队等待稍后执行或拒绝(立即或排队后)。资源池可以配置为具有最大并发查询数、最大集群范围内存、最大队列大小、每个查询的最大和最小每主机内存限制,并设置mem_limit查询选项是否会被前面提到的最大/最小每主机限制限制限制。如果执行的查询太多或可用内存不足,查询将排队。一旦队列达到最大队列大小,传入的查询将被拒绝。队列中的请求将在可配置的超时后超时。
jasong
2022-09-28
3170
Impala fe query plan
Be->Coordinator(Fe->be)->Be Executor->Coordinator
jasong
2022-09-27
4830
clickhouse 存算分离,云原生
开源列式数据库ClickHouse以极致的性能、超高的性价比获得了广泛好评。在PB级查询分析场景下ClickHouse是最佳解决方案之一。开源ClickHouse集群采用SHARED-NOTHING架构,增加计算节点非常容易。
jasong
2022-09-16
2.6K0
clickhouse 扩容 缩容 数据重分布 resharding
本文为您介绍通过控制台进行 ClickHouse 集群数据重分布的能力。目前云数据仓库 ClickHouse 已经支持通过水平扩容增加集群节点,提高集群的计算和存储能力,但是 ClickHouse 集群上的数据集无法自动均衡分布,需要人工干预才能确保数据均衡,这一直是 ClickHouse 使用和运维上的一大痛点。云数据仓库 ClickHouse 的数据重分布功能提供了白屏化的方式,支持 Part 或 Resharding 的模式对数据进行集群均衡。
jasong
2022-09-16
2.3K1
ClickHouse 集群迁移,你确认会吗
clickhouse 迁移的方案有很多,但是因为迁移稳单相对较少,很多人望而却步,这里为大家介绍3种方案
jasong
2022-09-16
1.4K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com