塑云科技：基于 KafKa+Tablestore+MaxCompute 完成物联网系统技

公司简介

塑云科技作为一支创业团队，专注于氢能燃料电池生态链的运营支撑，当前主要的业务组成为新能源车整车实时运营监控分析，加氢站实时运营监控分析，车辆安全运营支撑。

业务痛点

原有系统存在的问题如下：

系统架构中未对OLAP和OLTP系统的范围进行清晰界定，使用JAVA程序对表格存储的表定时进行任务统计，代码复杂并且性能极差并且影响到服务器上其他OLTP系统的正常运行。
存储的解析后的报文数据，未针对表格存储的计价规则进行针对性优化，一个大JSON串中冗余的KEY过多，KEY的长度超长（平均30个字符串）。
表格存储（阿里云Tablestore）按照公司进行分表设计，存在单个实例下表数量超过表格存储限制（64表）的风险。
表格存储以车月作为分区键，单个分区（30G）过大，超过表格存储建议的1G推荐大小。
表格存储单车的分区连续分布未做散列，不能在物理机器层面最优并发性能。
没有针对最核心的读取场景（按天按车查询报文）进行编码层面的优化。

当前业务系统面临的主要挑战：

高频数据的实时解析、存储、分析。拿整车实时运营监控分析来讲，每辆车以每秒1K的原始报文上报，要求做到秒级延迟的解析应答以及入库。同时需要针对解析后的每车每秒33K的报文进行快速查询以及后继的分析。
考虑到未来车辆接入的量，需要在考虑性能的基础上以最经济的方式进行系统设计。
按照每车每秒33K的解析后报文，每车每月预计生成30G的报文数据（车辆按照每天运行10小时计算）。

解决方案

在做系统优化之前，首先要做的就是架构层面的梳理，对产品中需要使用到的中间件产品的适用范围进行了明确的界定。数据在各个环节的流转进行明确的定义如下：

这里主要的改进：

引入KAFKA 作为多个环节异步解耦的基础支撑，提升对终端的报文快速回复。
引入MaxCompute 作为OLAP系统的基础支撑。将复杂的业务分析转交给MaxCompute 来处理。
针对表格存储的计价原则，对表格存储的模型进行了重构。

上云价值

MaxCompute 作为阿里云强大的数据分析利器，因为之前的经历相对比较熟悉。所以在这次的改造中特别针对性能、成本、可运维等方面做了较多的改进。

性能和成本：
- 根据数据的使用频度将数据切分为在线、离线、归档三类。车辆终端上报的报文数据作为归档数据选择OSS的归档存储。在线数据设定N 月的生命周期，主要包括报文解析之后需要实时查询的数据，离线数据主要包括基于解析的报文数据进行离线分析统计之后形成的各类中间结果、报表数据。
- 针对数据的使用场景界定数据类型之后，这里主要考虑离线数据使用OSS 还是 MaxCompute（ODPS）或者是表格存储来存储的问题。三类产品的存储计算成本对比如下：
  表格中已经考虑了通过压缩的方式存储表格存储减少计价存储的情况。MaxCompute 的计价是按照实际压缩存储之后的容量计算。MaxCompute 官方文档介绍的是 5:1 的压缩比，而我们的数据因为本身的特点，实测可以到7~8 ：1 的压缩比，所以最后数据方案反倒是MaxCompute 直接存储离线数据性价比最高。同时也符合数据靠近计算的原则。
  
  经过测试使用表格存储外部表作为数据载体的计算性能一般。当前MaxCompute 对表格存储的外部表的Map Reduce 计算直觉觉得是基于表格存储的分片，并且缺少分区的概念，每次都是基于全表扫描，这点可以从MaxCompute 的任务详情可以观测出来。
运维能力：
技术选型确定以后，需要考虑如何利用MaxCompute 为业务提供可靠、稳定数据服务。这里特别需要强调的是数仓的建模、数据集成、工作运维的使用。数据集成主要这方面主要体现MYSQL 跟MaxCompute 的双向同步，，主要是设计上需要考虑到数据的重复同步的设计即可。关于工作运维则是更多地体现在对任务的运行状况的监控以及重跑的支持。

数仓的建模主要考虑的还是成本和模型的复用。首先针对海量、质量不高的底层数据进行分层建模。保证上层的业务模型只依赖中间结果。这里带来的直接效益就是计算成本的大幅下降。其次是中间模型为系统补数带来更快的性能，毕竟因为一些业务或者数据的原因需要重跑部分报表，这个时候如果需要重新扫描原始数据的时候，首先就是费钱,其次就是耗时。

在离线统计分析的重构完成之后，系统充分利用MaxCompute 的并行计算能力，并且借助其强大的函数尤其是窗口函数的支持，我们实现比较不错的分析能力，客户的一个核心部件的数据统计分析，之前一个专业的工作人员分析一个部分需要耗时一天，还容易出错。借助平台的分析能力，可以在10分钟内计算完将近1000 个部件的数据分析工作。类似下面的曲线图分析每次数据波动期间的均值，之前几乎无法人工计算，即便是JAVA编码也是一个非常复杂的编码工作，通过平台的支持，系统处理得游刃有余。

塑云科技：基于 KafKa+Tablestore+MaxCompute 完成物联网系统技

公司简介

业务痛点

解决方案

上云价值

相关产品

推荐图文

最系统的大数据技术盘点，学会一半就是数据大牛

针对SREs和DevOps的十大开源项目

一个空间可以放几个网站

哪些云服务器可以开私服

都说软件架构要分层、分模块，具体应该怎么做之一

使用Spark2x实现车联网车主驾驶行为分析_MapReduce

随机推荐

云服务器查询实例管理终端地址 - API 文

众安保险CTO康德胜：云上保险与众不同 |

我从读源码中收获到了什么？阅读源码那点

如何设置镜像的网卡多队列属性？_镜像服

什么是高防服务器？怎么租用？

初始化数据盘_弹性云服务器 ECS_快速入门

伸缩策略介绍_弹性伸缩 AS_用户指南_伸缩

百信银行正式开业！启用域名aibank.com上

平台经济反垄断指南发布，大数据杀熟行为

厉害了！祝贺PolarDB喜提科技进步一等奖

关于我们