Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon MySQL中跨区域复制的存储含义是什么


MySQL中跨区域复制的存储含义是什么


MySQL中的跨区域复制涉及将位于一个地理区域的主要数据库实例复制和维护数据到位于不同区域中的一个或多个复制品实例。该设置提供了巨大的好处,例如灾难恢复,改进的读取可伸缩性,减少全球分布式应用程序的延迟以及在停机时间最少的区域之间迁移数据的能力。但是,从多个角度来看,跨区域的复制也对存储具有重大影响。

核心存储含义源于以下事实:数据必须在至少两个单独的物理位置中冗余地存在,通常跨越相当大的距离。这种冗余从根本上增加了存储要求,因为主要数据库中的每一个更改都均在另一个区域的复制数据库上传输,存储和应用。与单个数据中心或相对包含数据传输和存储影响的区域内的本地复制不同,跨区域复制涉及将数据库的完整副本及其在地理上远程基础结构上进行更新,这通常需要额外的存储成本。

在MySQL跨区域复制中,主服务器写入所有发生的所有更改的二进制日志(BINLOG)记录。这些Binlogs异步传输到副本服务器。然后,复制服务器重新播放日志事件,以在远程站点上维护数据库的相同副本。从存储角度来看,以下关键含义出现:

1。全部副本的数据存储增加:每个跨区域复制品都需要存储容量足以保留整个数据集或要复制数据的子集。这意味着,如果主要MySQL数据库实例为500 GB,则其他区域中的每个复制品也需要至少500 GB的存储容量才能容纳副本。如果在负载平衡或故障转移的区域之间存在多个复制品,则将乘以总存储足迹。

2。二进制日志和复制元数据的存储:主要实例必须维护跟踪更改的二进制日志,并且这些二进制日志进一步消耗了存储空间。根据配置的保留持续时间(要允许复制品赶上或以进行时间恢复),BINLOGS的存储空间可以显着积累。远程副本还保留继电器日志,这些中继日志在将其应用于数据库之前暂时存储更改。

3。存储成本和定价差异:云提供商,例如用于MySQL或Amazon Aurora MySQL的Amazon RDS,通常在每个区域中分别收取存储费用。由于复制品及其数据位于不同的物理位置,因此每个副本都会产生自己的存储成本。此外,随着数据中心之间的变更数据传播,区域间数据传输成本适用。这些累积成本可能是非平凡的财务考虑。

4。压缩和数据减少技术的影响:为了减轻存储要求,某些系统实现了二进制日志的压缩和过滤。例如,选择性复制特定数据库或表可减少副本上的数据卷。二进制日志的压缩会减少网络传输带宽和存储,但在压缩和减压过程中以添加的CPU开销为代价。

5。存储可用性和性能注意事项:复制品必须提供可以处理通过实时或接近实时应用复制更改而生成的I/O负载的存储。表现较低或尺寸不足的存储可能导致复制滞后,这可能会导致整个区域的数据不一致。因此,存储类型(例如SSD与HDD),吞吐量和IOPS性能特征的选择直接影响复制效率和数据新鲜度。

6。备份和恢复存储开销:在跨区域复制设置中,通常在主和复制实例上同时进行备份,以确保数据持久性。维护备份本身需要额外的存储资源。如果将复制品用作灾难恢复的故障转移目标,则必须提供存储以适应恢复需求和快照。

7.数据量增长放大:由于插入,更新和模式变化,主要数据库随着时间的推移而增长,因此所有复制品都必须相应地扩展其存储空间。缩放复制品存储时的任何效率低下或延迟都可以造成瓶颈或风险数据丢失,尤其是在故障转移情况下。

8。复制延迟和存储同步:因为跨区域的数据复制是异步的,复制的副本滞后。区域的距离越远,数据在运输量和分期存储(例如继电器日志)中的时间越长。扩展日志存储会增加存储的积累,并需要有效的日志管理策略安全清除或存档较旧的日志。

9。安全和合规性存储的影响:在某些情况下,在所有区域的静止数据中,法律或法规要求授权加密。加密存储的副本为管理存储增加了另一层复杂性,包括由于加密元数据而导致的存储尺寸增加以及对兼容存储解决方案的要求。

10。多主管跨区域复制存储:如果体系结构使用跨区域(例如主机)的多主管复制,则存储含义会增加,因为写冲突和最终的一致性机制可能会导致重复或孤立的数据,需要其他存储管理策略。

在解决这些存储含义的操作最佳实践方面,数据库管理员经常:

- 跨区域的右尺寸存储空间,以满足当前和预计的数据量。
- 采用复制过滤器(复制桌,复制 - 符号桌,复制式贴上餐桌参数),以最大程度地减少不必要的数据复制,从而减少开销的存储空间。
- 使用压缩的Binlogs和继电器日志来优化存储效率。
- 监视复制滞后和储存消耗,以主动调整存储配置。
- 针对二进制日志实施保留政策,使灾难恢复需求与存储成本和消费之间。
- 利用云原生功能,例如自动备份,快照和多动物配置,以提高耐用性而无需过多的存储使用情况。

总而言之,MySQL中的跨区域复制大大增加了存储要求,这是由于多个区域中的完整数据重复,附加的二进制和继电器日志存储以及备份,所有这些都归功于区域成本差异和转移费用。有效的存储管理和优化策略对于维持绩效,控制成本并确保可靠的灾难恢复和MySQL部署的全球可扩展性至关重要。对存储含义的详细理解为能力计划和基础架构决策提供了不可或缺的基础架构决策,而不可或缺地实施MySQL跨区域复制体系结构。

此概述捕获了在管理多个地理区域复制的MySQL数据库时出现的全部存储注意事项。