前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一亿次交易零故障,从 TencentOS 看金融领域的技术革新

一亿次交易零故障,从 TencentOS 看金融领域的技术革新

作者头像
腾讯 架构师
发布2023-01-30 16:42:46
4780
发布2023-01-30 16:42:46
举报
文章被收录于专栏:技术运维分享技术运维分享

一、项目简介

数字化转型的浪潮下,金融业系统原先的模式,已经无法满足「以客户为中心」的业务快速创新的需要。伴随新技术不断出现,快速部署和迭代,多业务同步开发和上线成为趋势,对核心系统的整体升级改造亟待开展。

2020 年 12 月,腾讯中标某知名银行的核心交易系统项目,涉及基础硬件、操作系统、中间件、数据库、云平台 5 大领域全栈式国产化创新。

腾讯团队与该银行通过多次 POC(Proof of Concept,概念验证),开展深度技术交流,协助规划数据库标准,从 TencentOS 操作系统到 TDSQL 数据库,提供完整的创新解决方案,支撑该银行核心系统持续稳定运行,最终在投产平台日均交易量超 1 亿笔的基础上,做到了 0 故障。

二、解决方案

TencentOS Server 是腾讯研发的服务器 Linux 发行版,提供了专门的功能特性和性能优化,能为服务器实例中的应用程序提供稳定、安全和高性能的运行环境。TDSQL 是腾讯自研的国产化「金融级」数据库,整个过程投入超过 600 人,中国十大银行中的七家都应用了 TDSQL。

TencentOS 与 TDSQL 是天生的一对好搭档。TDSQL 的研发和测试平台基于腾讯自研的 TencentOS 服务器,TencentOS 针对 TDSQL 也做了较多定制和优化,比如网络,I/O,CPU 调度等方面的优化,为 TDSQL 的稳定高效运行提供了强有力的保障。

在调研了该银行的技术需求与基础后,TencentOS 操作系统团队提供了定制的镜像和便捷的 OS 部署系统,针对该银行数据中心使用的场景定制了分区方案,对系统数据安全提供了强有力支持。

在网络部署场景,通过获取定制镜像实现全自动快速部署,大大节约了系统安装的时间,并且无需额外的系统配置修改,做到开箱即用的效果。

三、技术细节

以阵列监控系统为例,在项目中,该银行首次引入和使用了 NVME 设备,为了提高数据的安全性和存取的吞吐量,NVME 磁盘又通过 RAID 来进行统一管理和呈现。因为 TDSQL 对磁盘的 IOPS 以及容量有较高要求,在 TDSQL 项目实际部署过程中,使用了由 Tencent OS 提供的软 RAID 功能。相比于 NVME 硬件阵列卡,软 RAID 能够对 NVME 提供更好的支持以及更佳的性能体验。

针对该银行的 NVME 软 RAID 项目,TencentOS 团队为客户详细分析了内核中 RAID10 的实现原理,提供了软 RAID 性能测试数据以及资源开销情况,同时还提供了一个全方位的监控工具来监控软 RAID 以及 NVME 设备是否正常工作。

从 PCI 层面,监控 NVME 设备是否有掉盘以及降速行为,针对故障盘提供自动化的点灯能力;从设备自身状态方面,扫描设备的 smart 日志判断设备的使用寿命是否将近、是否温度过高、是否有运行时错误以及警告等;系统层面,扫描内核的系统日志查看是否有 NVME 相关报错;性能方面,实时采集 NVME 磁盘的性能数据、分析是否有慢盘以及磁盘夯事件发生。针对 RAID 阵列,监控并采集阵列状态、分析磁盘阵列是否有降级以及错误发生。

TDSQL 数据库与 TencentOS 操作系统的融合,实现了技术方案的完整闭环。项目开展后, TencentOS 团队提供了长期一站式技术支持服务,高效、快速地解决遇到的问题,为该银行的核心业务稳定运行保驾护航。

四、实践价值

TDSQL 搭载 TencentOS 相比社区其他操作系统的性能,在数据库 TPCC 指标测试中有 7-8%的提升,在相同测试方法和磁盘硬件条件下,系统 IO 性能提升 30-60%。

在 TencentOS 与 TDSQL 的技术组合推动下,该银行从集中式到分布式扩展实现高扩展,数据库可视化管理,实现运维监控高度自动化,在安全、稳定和体验方面实现了极大提升,解决数字化转型难题:

  • 核心系统的持续稳定运行,实现 0 故障
  • 基于 NVMe 的软 RAID 方案顺利上线,效果符合预期
  • 阵列监控系统持续监控阵列状态,阵列持续稳定
  • TencentOS 与 TDSQL 的兼容性、稳定性、性能表现更好

项目还通过中国人民银行颁布的《分布式数据库技术金融应用规范安全技术要求》,满足国产化和信创能力要求,满足 5、4、3 级灾备和高可用方案满足业务连续性要求。

小结

操作系统和数据库同为底层基础软件,二者交互频繁,关系密切,需要高度协作支持。TencentOS + TDSQL 的组合,实现操作系统和数据库的快速拉通对齐,避免了由于跨厂商而导致的冗长的信息传递,能够更加高效、快速地解决问题。

TencentOS 蕴含了腾讯在操作系统领域超过 10 年的技术积累,基于 TencentOS 衍生的社区版——OpenCloudOS,集社区之力,针对云原生场景和需求,进行了深度的重构设计,供开发者和中小企业免费使用。TencentOS 和 OpenCloudOS 用户态和 CentOS 同源兼容,相比原生内核稳定性提高 70%、典型场景性能提升 50%,满足用户对 CentOS 替代的需求。

国产化战略下,操作系统等基础软件获得了国家与 IT 产业的重视,其中,互联网企业自研操作系统,正在成为金融领域技术变革的重要力量。依托OpenCloudOS社区的源动力和TDSQL 的高效协作,TencentOS 未来可期。

添加小助手好友(微信号:OpenCloudOS),加入社区用户群,了解更多 OpenCloudOS 与 TencentOS 技术细节。

本文参与?腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-11-25,如有侵权请联系?cloudcommunity@tencent.com 删除

本文分享自 腾讯架构师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与?腾讯云自媒体分享计划? ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com