当前位置：主页 > 查看内容

Beyond the Cache ——阿里云Tair云内存数据库场景解读

发布时间：2021-06-10 00:00| 有位朋友查看

简介：作者黄鹏程马格一、Tair背景介绍一什么是阿里云Tair云原生内存数据库阿里云Tair云原生内存数据库线上名字为阿里云数据库Redis企业版又称阿里云Tair 从2009年开始正式承载集团业务是一款历经磨练的企业级产品。它完全兼容Redis的数据结构和通讯协议……

作者黄鹏程马格

一、Tair背景介绍

一什么是阿里云Tair云原生内存数据库

阿里云Tair云原生内存数据库线上名字为阿里云数据库Redis企业版又称阿里云Tair 从2009年开始正式承载集团业务是一款历经磨练的企业级产品。它完全兼容Redis的数据结构和通讯协议包括API接口并且在内部逐步打磨的过程中基于Tair研发云上托管云内存数据库。

如上图所示 Tair产品分为三个类型从性能到性价比有不同的产品排布下面用1.0X表示开源的Redis的性能与价格从性能和价格上与三个类型的Tair产品进行对比。

Tair性能增强型
性能约为开源Redis的两倍支持多种常见数据结构在天猫/淘宝/高德/优酷中大规模使用并拥有任意时间点恢复/全球分布式/热点散列等特性。

Tair持久内存型
基于Intel傲腾持久内存做的数据库后文会重点阐述其特点。

Tair容量存储型
直接对标社区Pika等开源存储型Redis产品。然后因为我们会用阿里云的高效的高效云盘所以说整个的功能和性能都会比Pika强很多。

如上图所示从内存存储方面 Tair三个类型的产品适应不同的场景。

Tair性能增强型

1 数据读写频繁要求低延迟支持大连接

2 成本相对不敏感以满足业务性能需求为主。

Tair持久内存型

1 数据读写较频繁延迟要求可稍微放宽存储数据量有一定较大容量要求

2 成本控制较之热数据要求更高。

Tair容量存储型

1 数据读写密集程度低延迟要求不高整体存储容量要求高

2 成本是最大考量因素。

二阿里云Tair面向业务的数据结构让业务创新更容易

在业务方面阿里云Tair与基于传统Redis存在许多不一样的地方阿里云Tair业务结构如下所示。

除此之外阿里云Tair有以下优点

1 高性能

性能增强型流量上涨淡然处之性能是开源Redis的2倍。

2 持久化

持久内存型数据可靠方便业务使用不再担心数据丢失。 RPO 0

3 低成本

多种存储介质选择最优性价比性价比高于ECS自建。

4 丰富数据模型

在社区Redis上提供了更多面向应用的数据结构应用开发更简便。

5 企业级能力

全球多活数据闪回混合多云热点散列。

三阿里云Tair历史

上图为Tair的发展历史。从Tair1.0开始团队就孵化出了云Redis社区版和云Memcache 这是线上社区托管的两个版本。

在Tair1.0的时候就会整个孵化出来 2.0逐步上云 3.0会孵化出来一款叫GDB的产品是一款线上的图数据库。

再往下是Tair Redis企业版/Tair 3.0 集团和云上是同一个版本有很多种形态来支持用户在各种业务场景下的需求。

二、Tair功能介绍

一做一个不丢数据的内存数据库—Tair持久内存型

我们希望做一个不丢数据的数据库做法是通过新硬件和新软件来进行。

1.新硬件

引入英特尔? 傲腾? 数据中心级持久内存
与DRAM内存相近的性能表现而且其大容量和非易失性的特性还可帮助系统获得更优的可用性
它相比于DRAM内存的成本和容量优势也可帮助客户有效地降低总拥有成本。

上图为存储介质图速度延迟从上到下逐步增大相反容量逐步减少成本逐步降低。Storage Class Memory处于中间性价比较高。

2.新软件

模式选择

新软件的开发模式方案有两种分别是内存模式 Memory Mode 与应用程序直接访问模式 App Direct Mode 。

在内存模式下应用和OS将其视为易失性内存池虽对应用透明但掉电即失因此不采用。

在应用程序直接访问模式下持久内存和 DRAM充当独立内存资源通过构建符合Redis协议和数据结构的软件利用两块存储资源构建兼容Redis、具备命令级持久化能力的内存数据库。

全新的挑战

我们选择重新写兼容Redis的东西而不是在Redis基础上进行更改是因为新软件有着全新的挑战

1 替代原有的内存分配器同时要保证内存分配器元数据的持久化

2 Redis数据结构与索引的持久化要保持一致性

3 持久内存和易失内存如何协同工作让整个数据库高性能工作同时还具备强大的持久化能力。

3 产品化能力

上文结合软硬件的能力阐述了如何去构建持久化内存的形态下面可以看一下所带来的成果。

消除aofrewrite与fsync的无Fork设计服务更顺滑 P95延时较之内存版Redis更低更稳定
读写性能吞吐为内存版Redis的90%以上。

原生命令级持久化能力操作写入即持久化
缓存主存合一成为可能成本更低架构更优雅。

4.应用场景

应用场景主要分为如下两种。

场景一大数据量、高性能、成本的综合选型考虑

机器学习平台、推荐系统等计算数据对性能和容量的要求很高
全内存又使得成本压力巨大
可采用Tair持久内存型以有效降低成本并能够保持高性能运行
同时用户也无需为降本而综合使用其他数据存储有效地平衡了系统复杂度与成本。

场景二用作持久化数据存储

游戏、直播、数据分析中大数据结果集对外提供查询服务等场景可以使用
可采用Tair持久内存型作为数据最终的存储
对比缓存主存的两层架构数据同样可靠
性价比更高代码更简化架构更优雅。

二做一个具备时光机能力的数据库--数据闪回

我们希望这个内存数据库具备有时光机能力。时光机能力表示可以将数据恢复到过去指定的任何时间点也称为数据闪回它有如下两大特点

七天内任意时间点的数据恢复

1 Backup/Restore的终极形态

2 支持按秒级的数据恢复可支持到按条

3 防止删库跑路场景

4 Clone Switching 随时回切

根据按照指定Key或者Key Glob Pattern进行原地数据部分恢复

1 灵活应对部分数据异常

2 其余未指定数据不变化

3 游戏数据回档实现

三做一个全球多地写入的数据库--全球多活

1.基本概念

我们希望数据库能够多地写入把多地的内存数据库进行多活操作用户可以在多地访问与写入我们帮用户做数据按序同步。

2. 三地六向同步

全区全服同时在线解决漫游 roaming 和DNS漂移问题。
数据本地访问 locally data access 的流畅性。
单元化独立部署区域容灾按需调度。
数据的高可靠和性能提升。

3. 低时延SLA保障

推送模式 Push Latency T1 (binlog落盘时延) T2 (Replicator发现时延) T3 (Apply时延)

1 整体看 T1 T2 稳定在10ms 最差100ms T3基本上时延是网络RTT。

2 忙时下不敏感 replicator具备独立的资源点到点同步通道带宽稳定。

适合写入量大对平均时延要求高的客户。
目前全球分布式缓存只能做3地6向。
适合跨域多活及单元化业务阿里内部经验。
Tair全球同步时延测试白皮书

https://help.aliyun.com/document_detail/199010.html

4. Session场景

Session的容灾至关重要

随着业务扩展 session访问压力几何级数增长。
对抖动敏感远距离访问体验差。
单元化部署全球化部署。
除去容灾跨域备份还要能就近读写跨域双活多活。

5. 游戏场景

架构特点玩家可就近接入本身逻辑就近计算数据读取基本不存在数据一致性问题灵活调整分布式节点。

可以灵活跨地域部署数据通过Tair同步延迟根据网络速度决定通常在100ms以下。

场景聊天室弹幕信息同步跨服对战全球道具商城。

6.出行场景

Tair也在高德地图中深度使用并解决了出行场景的一些问题。

使用前导航时地理位置信息推送问题

DNS漂移是一个边界效应通常大概影响边界上5%-7%的用户。
在导航中跨越边界时会大量出现交叉访问不同数据区的场景业务逻辑复杂可靠性低用户体验差。

使用后高德交通三地六向同步 Tair only

Redis-enterprise跨域多活提供百万OPS每秒的数据同步。
交通在三地都可高速写入/访问极高性能的优势提供流畅的用户体验。
用户可以灵活的在SDK层控制读写比例等。

四做一个有计算的内存数据库

1. TairCPC高精度计数

TairCPC是一种数据的压缩算法 sketches 的内存实现可以利用很小的空间对采样数据做高性能的计算适合在实时和流式计算场景下做高性能的风控和安全场景。

主要特性

1 内存占用低

2 增量读写 IO最小化

3 毫秒级高性能去重

4 超高去重精度

5 误差率稳定收敛

适用场景

1 想以较低的内存实现对海量数据的去重计算

2 容忍一定的四舍五入的误差率

3 适用于实时计算的滚窗和滑窗去重。

2. TairTS时序数据处理

TairTS是基于Redis Module开发的时序数据结构提供低时延高并发的内存读写访问以及快速的过滤聚合查询功能。将存储与计算集于一身极大地简化用户处理时序数据的流程结合Tair持久内存型单集群最大规模可达65T。

主要特性

1 TairTS相对于TSDB类传统时序数据库可提供更快的写入性能并提供数10倍的查询性能。

2 针对小规模数据场景 TairTS可将批量查询与聚合计算集成到单条命令中减少网络交互实现毫秒级响应。

3 针对大规模数据场景可利用索引命令将大规模数据分批查询与聚合实现秒级响应。

适用场景

1 监控数据的存储与计算

2 车联网、工业互联网实时IOT数据处理

3 APM秒级监控等

三、面向未来

最后谈一下未来面对的事情关注云产品的人可能都知道存储计算分离我们希望在这基础上能再进行一层分离。将内存也分离出来做一个大的内存存储池。希望我们的再分离一层就是把内存也分离出来因为现在可能是一个大的存储池为用户提供更加弹性的服务。

本文转自网络，原文链接：https://developer.aliyun.com/article/784620
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：20 岁发表 SCI 的学霸，梦想用算法改变世界 下一篇：大型企业多账号管理“安全心法”

随机推荐

技术扫盲：关于低代码编程的可持续性交付

本文转载自微信公众号「bugstack虫洞栈」，作者小傅哥。转载本文请联系bugstack...
溢价域名的续费价格如何

溢价域名的续费价格如何？通常来说，因为溢价域名的价值高于普通域名，所以溢...
TIOBE 3月榜单：新功能将加入，C语言仍高

TIOBE 公布了 2021 年 3 月的编程语言排行榜。本月 TIOBE 指数没有什么有趣的变...
一日一技：巧用or关键字实现多重条件判断

在Python开发过程中，我们难免会遇到多重条件判断的情况的情况，此时除了用很多...
没有数据的数据科学？请尽早聘用数据工程

本文转载自公众号读芯术(ID：AI_Discovery)。这一刻你正在应对什么挑战?这位前...
Java编程内功-数据结构与算法「赫夫曼树

基本介绍给定 n 个权值作为 n 个叶子节点，构造一颗二叉树，若该树的带权路径长...
鸿蒙内核源码分析(汇编汇总篇) | 鸿蒙所

想了解更多内容，请访问： 51CTO和华为官方战略合作共建的鸿蒙技术社区 https://...
互联网创业第一步，从他花3500美元买了个

近几年，互联网行业蓬勃发展，在互联网浪潮的冲击下，互联网创业已成为一种比较...
NVIDIA GPU Operator分析一：NVIDIA驱动

背景我们知道如果在Kubernetes中支持GPU设备调度需要做如下的工作节点上安装...
为何Spark在编程界越来越吃香？Spark将成

前言统计科学家使用交互式的统计工具(比如R)来回答数据中的问题，获得全景的认...

Beyond the Cache ——阿里云Tair云内存数据库场景解读

推荐图文

智能数据构建与管理平台Dataphin的前世今生：缘起

大数据时代，必须做好这3大布局：才能抢占新的造富

C4D 学习笔记

云服务器调整实例配置询价 - API 文档

国内首款基于.NET Core平台的大数据可视化分析工具

云安全的现代方法

随机推荐

技术扫盲：关于低代码编程的可持续性交付

溢价域名的续费价格如何

TIOBE 3月榜单：新功能将加入，C语言仍高

一日一技：巧用or关键字实现多重条件判断

没有数据的数据科学？请尽早聘用数据工程

Java编程内功-数据结构与算法「赫夫曼树

鸿蒙内核源码分析(汇编汇总篇) | 鸿蒙所

互联网创业第一步，从他花3500美元买了个

NVIDIA GPU Operator分析一：NVIDIA驱动

为何Spark在编程界越来越吃香？Spark将成

关于我们