当前位置：主页 > 查看内容

Cassandra 性能压测及调优实战

发布时间：2021-05-17 00:00| 有位朋友查看

简介：一、性能压测?? 一压测工具 ——ycsb 优势 ? 使用比较简单 ? 支持多种开源数据库 redis mongo cassandra hbase ? 方便对不同数据库做性能对比市面上有很多压测工具这里主要选择了ycsb这一款压测工具。选择它的原因很简单因为它的使用上比较简单并且它支……

一、性能压测??

一压测工具 ——ycsb

优势

? 使用比较简单

? 支持多种开源数据库 redis mongo cassandra hbase

? 方便对不同数据库做性能对比

市面上有很多压测工具这里主要选择了ycsb这一款压测工具。选择它的原因很简单因为它的使用上比较简单并且它支持多种开源数据库像redis mongo cassandra hbase? 所以你一旦掌握了它就可以对多种数据库进行压测并且方便对不同数据库做性能对比这样可以选择对你最适合的数据库它支持对多种数据库进行压测如果你下载的完整压缩包的话会比较大。

cassandra专用压缩包

下载

Wget https://github.com/brianfrankcooper/YCSB/releases/download/0.15.0/ycsb-cassandra-binding-0.15.0.tar.gz

tar -xvf ycsb-0.15.0.tar.gz

cd ycsb-0.15.0

二目录结构

?bin?——执行文件目录

?lib?——依赖jar?包

?workloads?——压测模型定义文件

压缩之后进到它的目录下面可以看到它的目录结构主要有三个目录分别是bin lib workloads? bin目录主要是执行文件目录而lib主要是依赖的jar目录像这个包它由于只支持cassandra的压测所以它的lib包下面的jar非常的少而我们的重点关注在于workloads的这一个目录。

在这一个目录里面你可以看到他预先存在一些定义好的压测模型你可以根据他提供的这种默认的压测模型进行略微的修改很快的得到你需要的一个压测模型。

一定义压测模型

文档地址 https://github.com/brianfrankcooper/YCSB/wiki/Core-Properties

?recordcount?—— 定义压测初始数据量尽可能匹配实际数据

量

?operationcount?—— 压测过程中执行的读写次数建议运行

半小时级别以上

?fieldcount?—— 字段数

?fieldlength?—— 字段长度 fieldlength fieldcount?决定一

行的大小

?readallfields?—— 是否读所有字段

?readproportion updateproportion insertproportion ?

scanproportion?—— 定义读写比例可以纯读纯写或者读

写混合比例可调

10w?数据量 10w?次纯读每行10?个字段每个字段200 bytes?大小

一次正确的压测首先最重要的是你需要定义你的压测模型首先你需要定义你初始的数据量这个数据量最好是匹配你实际的数据量比如你有异议的数据你在压测的时候你就需要准备1亿的数据如果你只准备了1万或者10万的数据压出来的性能和你实际的性能会相差甚远。你在压测过程中需要执行的一个读写次数还有一个比较重要的就是因为以表结构来举例子的话表是有很多行组成的每一行它其实有多个列每列它其实会有一个大小你需要定义你的字段数以及每个字段的长度这样去匹配实际业务模型才能得到一个比较准确的压测。

一建表

//?副本数设置和实际生产保持一致副本数会影响数据大小也会影响读写性能。

//?副本数不一样压测出来的结果会非常不同

create keyspace ycsb WITH replication { class : NetworkTopologyStrategy , cn-shanghai-g : 2};

create table ycsb.usertable (

y_id varchar primary key,?

field0 varchar,?

field1 varchar,?

field2 varchar,?

field3 varchar,?

field4 varchar,?

field5 varchar,?

field6 varchar,?

field7 varchar,?

field8 varchar,?

field9 varchar);

我们需要对我们的?数据库做一个初始化 ycsb这一款压缩工具它默认的命名空间是 ycsb 然后它默认的压缩表是usertable 所以通过这两条命令你可以直接创建出他所需要的namespace和table表。这里面需要注意的是在创建namespace的时候需要指定一个副本数这一个副本数也会影响整体的一个数据大小同时会影响读写性能。所以在设置压测的副本数的时候和实际应用保持一致是最好的。

二构造测试数据

./bin/ycsb load cassandra2-cql -s -threads 20 -P workloads/read

注意事项

? 通过内网访问进行压测

? 用来压测的ecs?规格不宜太小

? 构造数据的性能可以看做纯写入下的db?性能通过调整线程数逼近

db?的写入性能上限

? 测试数据量一定要逼近真实数据量大小否则 cache?命中率不一样

测试读的时候响应会截然不同

? 构造测试数据一定要持续一段时间这样才能观察到db?后台任务

运行对写入性能的影响

你在构造你的压测数据的时候你数据量一定要足够大然后一定要持续一段时间因为任何一款数据库它都存在一些周期运行的任务或者说一些后台的任务如果你持续的时间比如说只有一分钟很可能后台的任务或者周期任务他还没有执行那么你压测出来的表现就并不是最真实的一个表现因为任何一个周期任务它其实都会抢占你的CPU资源或者说磁盘的io资源它会影响你的读写的性能完成了测试数据的构造那么通过把漏的命令改成乱命令我们就可以对你的实际的压测产品做一个压测。

一读场景性能压测

./bin/ycsb run cassandra2-cql -s -threads 20 -P workloads/read

注意事项

??读性能压测一定要持续一段时间数据库都有缓存需要等缓存命中

率比较稳定时其性能表现才比较真实

完成了测试数据的构造那么通过把load的命令改成run命令我们就可以对你的实际的压测产品做一个压测。这里其实就是一个单纯的读产品的压测在压测完成之后也能看到在这一个多场景下的性能情况。压测的时候你的应用cassandra里面的缓存其实是空的只有在持续一段时间之后你的数据库的缓存它的命中率比较稳定了压测出来的数据才是比较真实的。

二、性能调优

一 Cassandra读写原理

在进行场景介绍之前首先介绍一下Cassandra的读写原理这样方便后面讲解它的优化思路的时候大家能够更加快速的理解。

首先讲Cassandra的写请求他写请求其实非常的简单一条写请求进来之后会首先记录一条log 也就是Commit Log或者说Write Ahead Log。在Log里面记录完成之后会把它插入到内存里面对应的一个结构Memtable里面去一旦插入完成写请求就结束了。写请求这么简单它的设计导致Cassandra在写场景非常优异绝大部分使用场景下你如果正确的使用写入基本上都不会成为瓶颈。因为只涉及到一次磁盘写入和一次内存操作这一次磁盘写入其实是因为是写log的形式所以它其实就是直接append 磁盘写入的话性能是非常高的。

我们来看一下Cassandra如何完成一次读请求。每一次写入到内存Memtable 内存中的Memtable会越来越多内存放不下为了避免内存水位过高 Cassandra会周期性的把内存里面的Memtable flash到磁盘形成一个SSTable文件。那么SSTable文件逐渐增多会有周期性的任务叫Compaction 把多个SSTable文件合并成一个大的SSTable文件一条读请求进来后会对内存里面的Memtable和磁盘上的SSTable做多路归并排序然后找到你所需要的数据再返回给你。

二准备工作完善的监控

任何一次的性能调优都需要有完善的监控完善的监控是所有性能调优的出发点以及终点。

下图是Cassandra上你能看到的监控图一个完善的监控基本上需要具备CPU、内存、磁盘、网络等最基本的系统级别监控同时还需要能够看到Cassandra应用内部的状态比如读写OPS、读写响应、GC情况、Compaction情况 Cache命中率以及各线程池当前状态。

场景一写入稳定读取延迟逐渐升高

首先我来介绍场景一场景一的特点是写入稳定读取延迟逐渐升高这是一个很典型的案例之前介绍的如何处理一个读请求读请求其实是会对内存里的Memtable和磁盘上的SSTable做多路归并排序。如果说你的SSTable数量越多其实它可能涉及到的io次数就会越多而我们都知道磁盘io是很慢的所以当你的读取延迟在逐渐升高的时候你可以想到的一个可能性就是说你的文件数在越来越多 Compaction的过程被阻塞了或者太慢了导致你的文件数一直在增多。

通过nodetool??compactionstats查看pending task 通过这个数据我们可以去定位是不是你的Compaction任务太慢了或者卡住了导致有太多堆积的Compaction任务没有完成。如果是的话可以通过调整你的Compaction并发数比如说同时执行多个Compaction 或者对你的机器做升级使你拥有更富裕的CPU资源来完成你的Compaction任务起到一个优化的效果。

场景2——写少读多对响应延迟较为敏感

场景二是写入很少但读取很多对读取的响应延迟较为敏感这里需要介绍一下cassandra默认的compacion策略叫做Size-tiered compacion。在compacion执行很多次之后磁盘上的sstable会形成类似于根据大小进行分层的一种分布设计。这种默认的compacion设计有好处也有劣势每一个sstable是可能存在重叠在最坏的情况下一个读取请求进来可能需要对每一个sstable做一次seek操作才能知道当前sstable里面有没有对应的数据文件数越多涉及的IO越长延迟越长。

这时可以考虑使用另一种compacion策略叫做leveled-tiered compacion。能够把磁盘上的sstable分成若干层每一层里面的sstable相互之间没有重叠关系因为有这个保证所以一条读取请求进来之后每一层里面最多只有一个sstable纳入到归并排序当中层级次数决定涉及这一次读取请求需要处理sstable的上线导致读延迟更低也更加可控。

由于需要保证每一个层级里面的sstable相互之间不重叠所以对写放大较为严重和较多compacion任务的执行比较适合于读比较多写入比较少的场景。

场景3——写入量级特别大

场景三写入量级特别大如 IoT行业、物联网行业、滴滴轨迹记录等行业很少读取但写入量级特别大。

针对这种场景有几个优化方式:

1 方式一

·常识网络延迟磁盘写入延迟。

·通过batch insert的方式降低客户端和服务端的交互次数从而减少网络延迟的影响。

需要知道网络延迟远远高于磁盘写入延迟写入量级特别大的时候可以考虑批量写入方式来使网络延迟减少客户端和服务端的交互次数从而减少网络延迟的影响。

·Cassandra batch可以实现跨表级的事务但是性能损耗较大。

使用注意事项

·只做一张表的batch insert

·使用unlogged的batch insert

·每一个batch insert?包含的insert数建议不超过10。

2 方式二

如果前一个方式应用之后还是不能满足写入要求遇到第二个瓶颈 commit log flush?目前cassandra?是单线程做的写入量级太大的情况下会成为瓶颈。

原理是在cassandra里面默认每10秒对commit log做一次sync操作 sync操作把内存里面的commit log刷到盘里面去每次sync都会产生一次磁盘写入的峰值而这一次写录其实还没有真正写入到磁盘的介质当中会写入到磁盘的pageCache里面默认策略为周期性将pageCache中写入持久化。目前很多用户使用各大云厂商的云盘产品都有写入流量的限流策略。默认参数下面每一次写入磁盘都是一次大批量的写入会产生较大峰值很有可能触发写入流量的限流策略。

在这个情况下调节Linux内核参数:

Vm.dirty_writebark_centisecs 10

Vm.dirty_expire_centisecs 20

可以提高 pageCache下刷云盘的频率从而导致每一次刷下去的大小都会减小不容易触发限流策略导致了io Write显着的降低对于写延迟会有质的提升。

3 方式3

由于默认每10秒一次sync 如果写入量级特别大 10秒内会堆积大量commit log 需要被sync到磁盘而在cassandra的实现里面对于commit log的sync操作是单线程处理的操作。所以当sync的速度跟不上写入的速度的时候写入就被block住等待。

如上图所示含义是根据上一次sync完成的时间点和当下期望的时间点如果sync小于期望sync的时间点证明sync的速率跟不上写入的速率就会做一个等待操作降低写入的TPS让sync能够追上。

所以搭建一个完整的监控系统要看waitingOnCommit监控指标发现这一瓶颈。每一个commit log都是一个单独文件云cassandra通过文件级别并发做sync提升了sync环节的处理效率解决了这一问题。

4 方式4

为了数据可靠性往往建议设置多个副本。多副本的场景下接受节点往往会生成一个副本同时向其他节点发送请求生成足够的副本数。每个节点和集群所有其他节点之间会维护一个队列来保存节点之间通信的消息。

举例:3副本 10wtps写入会产生20w内部消息通信副本数越多内部消息通信放大越严重当量级过高时 cassandra默认的队列实现会产生严重的锁冲突导致性能下降。通过iprofiler的jvm性能工具可以方便的监测锁冲突的严重情况。

在这个场景下面可以通过降低副本数达到减少内部通信的量级规避问题。或者增加节点数因为节点数增加了变相的节点之间的队列数就增加了每一个队列的负载相对就会减少从而达到降低锁冲突的效果但是这两个措施都需要业务改造并且都有对应的成本。比如副本数降低数据可靠性就降低了或者集群节点数增加运维成本就会增加增加的是整个经济成本。

云cassandra通过实现了一个高性能的无锁队列参考开源的实现disruptor 性能非常棒替换了cassandra默认的队列实现大幅提升了这一场量下的性能上限。

场景4——读响应时间长磁盘IO重

读响应时间比较长 io比较重这里有一个通用的使用误区在cassandra之前的版本如果使用了压缩它默认的大小是64k 某种程度上是合理的因为压缩它是需要针对一个指定的大小进行一个压缩才能达到一个比较理想的压缩率磁盘的存储成本才能够降低但是默认的64k还是太大所以在社区讨论已经建议调整为16k 在新版版本里默认的压缩的快大小就是16k 同时这个大小可以满足实现比较理想的一个压缩率好处就是io会显著的降低。

所以当block的大小设置的太大的时候磁盘io会增加特别多通过alert表属型进行调整之后做一个major compaction 才能使调整真正的生效。

除了调整block的大小之外磁盘io重就是因为cache的命中没有命中到走到磁盘产生磁盘io 可以通过nodetool info工具看到对应如chunk cache和key cache的大小以及对应的命中率。通过cache如果实例上有较富余的内存资源可以调整chunk cache和key cache的大小从而去提升cache的命中率这样落到磁盘上的io就会显著地减少降低io 从而读响应时间会更加的快。

如果场景是80%的读请求集中在20%的row上面可以考虑开启row cache功能它默认是关闭的因为它会带来内存的压力开启便会有比较好的一个效果。

key cache、chunk cache和row cache三个cache的大小是没有一个最佳的比例的根据实际情况去调整三个cache的大小关系调整完后以监控数据为准监控数据实际效果好的就是最佳的一个大小比例。

这也是一个完善的监控是很重要的就是它不仅能够发现问题还能去验证优化效果是否达到了预期优化措施是否有效果。

场景5——读响应毛刺较高

读响应毛刺很高较高的概率是由于gc导致的如较长的full gc或者很频繁的full gc 首先就需要排查cassandra是否存在内存泄漏其次去参考jvm的GC调参最佳实践调参GC相关的参数也能实现GC的优化。

考虑使用cassandra自带的Speculative特性其工作原理就是客户端向服务端的一个节点发送了请求根据自己设置的一个域值在超过这个阈值之后如果请求还没有得到相应的话会向第二个节点发送一个请求这时候是针对一个请求发送了两次请求到服务端这两次请求任何一次请求优先返回之后都算成功生效。

思路就是一个集群内可能周期性的会有一些慢节点通过这个阈值来判断是否请求到了一个慢节点如果是就换一个节点从而规避掉慢节点避免请求一直被卡住如果阈值设置的过小会产生较多的额外请求会增加整个集群的负载和压力需要根据监控去不断的调整的阈值找到一个比较合适的点。

三性能调优总结

性能调优

第一一定要有监控有监控才能去做分析去评估优化的效果监控是所有性能优化的出发点和终点。

第二熟练掌握相关的工具如jprofile是一个比较好的监控GC或内存泄漏的一个工具。

自带的nodetool 其实会暴露内部的一些情况如线程池的使用状况但也可比较好排查性能瓶颈位于哪一个环节需要对原理有一定的理解才能去分析可以采取的措施以及说当前处于瓶颈的会涉及到的环节哪些环节可能成为的性能瓶颈。

优化的时候可以考虑从业务改造上去进行规避也可以考虑从源码级别去做性能的优化思路比较灵活。

本文转自网络，原文链接：https://developer.aliyun.com/article/784102
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：倒排索引、文档值、存储和原文 下一篇：因你不同，2021 阿里云开发者大会重磅开启 @ 所有开发者！

随机推荐

怎样才能成为一名合格的微服务构架师？

阿里巴巴、腾讯、支付宝、网易、IBM、谷歌、京东、百度、滴滴等一线互联网公司...
构建前瞻性应用架构的优秀实践

【51CTO.com快译】不知道您是否听说过软件架构师最讨厌意大利面这个梗?它是指软...
DataWorks 2021-03 产品月刊

本月DataWorks产品月刊为您带来产品活动 1.参与阿里云DataWorks问卷调研 (Aliyu...
2020年大数据给企业带来的5大好处

大数据市场如今正在呈爆炸式增长。根据调研机构Markets and Markets公司的调查，...
百度开放离线人脸识别SDK，活体识别率超

人脸识别是目前商业应用最成熟、最广泛的人工智能技术之一，成为开发者、企业接...
删除镜像_镜像服务 IMS_用户指南_管理私

操作场景您可以删除不需要的私有镜像。删除私有镜像后，将无法找回，请谨慎操...
一日一技：你怎么总是搞不清反斜杠的问题

大家在开发Python的过程中，一定会遇到很多反斜杠的问题，很多人被反斜杠的数量...
数据分析师必备的6项技能

【51CTO.com快译】数据分析是对数据进行判断、细化、更改和建模的过程，目的是...
长沙营智：PolarDB助力长沙营智提速资讯

公司介绍长沙营智信息技术有限公司旗下易撰网，2017年10月份上线以来，基于数据...
稻香小镇新建数字农业基地

案例背景永安稻香小镇的体验式数字农业基地是余杭街道依托“阿里以西10分钟”的...

Cassandra 性能压测及调优实战

推荐图文

TRTC Web端仿腾讯会议麦克风静音检测

跨境医疗走向后疫情时代：门槛提高、专业化、平台化

使用顶层await简化JS代码

网络视频服务器的优势

Flink on Zeppelin 系列之：Yarn Application 模式

在Python中搭建币价树形图

随机推荐

怎样才能成为一名合格的微服务构架师？

构建前瞻性应用架构的优秀实践

DataWorks 2021-03 产品月刊

2020年大数据给企业带来的5大好处

百度开放离线人脸识别SDK，活体识别率超

删除镜像_镜像服务 IMS_用户指南_管理私

一日一技：你怎么总是搞不清反斜杠的问题

数据分析师必备的6项技能

长沙营智：PolarDB助力长沙营智提速资讯

稻香小镇新建数字农业基地

关于我们