当前位置：主页 > 查看内容

数据迁移到MySQL的性能测试

发布时间：2021-07-22 00:00| 有位朋友查看

简介：今天对一套环境的数据从SQL Server迁移到MySQL,中间涉及诸多的架构改进，我们主要说一下数据迁移的一些基本思路，以下是一个开始，会在后面不断的迭代改进一些方案。整体来说，迁移的数据量听起来不是很多，大概是300G左右。整体的步骤是： 1）数据从SQL S……

今天对一套环境的数据从SQL Server迁移到MySQL,中间涉及诸多的架构改进，我们主要说一下数据迁移的一些基本思路，以下是一个开始，会在后面不断的迭代改进一些方案。

整体来说，迁移的数据量听起来不是很多，大概是300G左右。

整体的步骤是：

1）数据从SQL Server导出为csv文件

2）数据流转到MySQL中间服务器上

因为文件较大，比如有的文件有几十G，单次导入会直接抛错，所以需要做下切分，比如按照1000万的数据维度切分。

3）数据切分

数据会被切分成相对规整的分片，比如按照1000万的基准，一个4亿数据量的文件会被切分为近40个500M的文件

4）因为切分后的文件太多，所以在导入前需要把这些任务划分为几个组

5）导入的时候，是按照并发进程的方式，因为数据库后端已经做了分片，所以就不需要调用是开启太多的线程了。

6）数据通过中间件导入，数据落盘在多个分片节点上，物理分片是4个，每个物理分片上有4个逻辑分片，即一共有16个逻辑分片。

数据流程图如下：

从目前的测试来看，如果是4个物理分片，通过中间件使用load data的方式，速度基本在80万每秒。和单机的20万相比，效率和性能是很明显的。

从目前的数据迁移来看，还是存在一些使用风险，一来转储数据为csv文件的时间较长，中间还涉及数据流转和数据切分，等到数据真正导入的时候，流量和性能的损耗已经很高了。

目前的测试，有些分片节点的负载高达30以上，算是充分利用了服务器资源。

按照目前的基本数据情况，导入近70亿数据需要2个小时左右，而这个过程还不包括中间环节的衔接和数据流转，实际的时间会在近5个小时，从数据迁移窗口来算，这个时间明显是不符合需求的，如果把时间控制在1个小时，有没有更好的方法？

本文转载自网络，原文链接：https://mp.weixin.qq.com/s/nXWUkaCSblKZGKpafUv-Jg
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：MySQL常用工具选择和建议 下一篇：MySQL中Update修改数据与原数据相同会再次执行吗？

随机推荐

获近亿元战略融资，觉非科技领跑车路协同

今日国内领先的智能数据服务运营商觉非科技完成近亿元A轮融资。本轮融资由和高资...
【图像计数】基于matlab硬币计数【含Matl

一、简介本设计为硬币图像识别统计装置通过数码相机获取平铺无重叠堆积的硬币的...
MVC、MVP和MVVM分别是什么_动力节点Java

一、MVC MVC模式的意思是，软件可以分成三个部分。视图（View）：用户界面。控...
程序员误区，缓存一定能提升程序效率么？

大家好，今天我们来简单的聊一聊缓存问题。什么是缓存呢?它在系统设计中是在一个...
水杯的测试用例

从功能测试、性能测试、界面测试、安全性测试、易用性、兼容性测试、震动测试七...
【算法】扑克发牌算法实现

首先给扑克牌中每张牌设定一个编号，下面算法实现的编号规则如下： u 红桃按照从...
Git 常用命令清单(整理且详细)

git工作区，暂存区，版本库之间的关系：我们建立的项目文件夹就是工作区，在初...
微软泄露Windows10新UI！Windows10任务栏

我们知道微软将会在今年给Windows10更换全新设计的UI，让Windows10的界面更加整...
jsp中page指令用法详解

本文实例讲述了jsp中page指令用法。分享给大家供大家参考。具体如下：一、JSP ...
Window十二问（快扶我起来，我还能问）

前言关于Window，你了解多少呢?看看下面这些问题你都能答上来吗。如果你遇到这...

数据迁移到MySQL的性能测试

推荐图文

ajax jquery校验用户是否已经注册演示代码

第一个项目：D触发器，DFRB1C。

原生js实现表格循环滚动

解决安装Pycharm后在C盘下生成大文件的问题

asp 过滤非法字符函数

高效管理http连接的方法

随机推荐

获近亿元战略融资，觉非科技领跑车路协同

【图像计数】基于matlab硬币计数【含Matl

MVC、MVP和MVVM分别是什么_动力节点Java

程序员误区，缓存一定能提升程序效率么？

水杯的测试用例

【算法】扑克发牌算法实现

Git 常用命令清单(整理且详细)

微软泄露Windows10新UI！Windows10任务栏

jsp中page指令用法详解

Window十二问（快扶我起来，我还能问）

关于我们