Поперечная репликация в MySQL включает копирование и поддержание данных из первичного экземпляра базы данных, расположенного в одной географической области, до одного или нескольких экземпляров реплики, расположенных в разных регионах. Эта настройка предлагает значительные преимущества, такие как аварийное восстановление, улучшение масштабируемости чтения, снижение задержки для глобально распределенных приложений и возможность переносить данные между регионами с минимальным временем простоя. Однако перекрестная репликация также имеет существенные последствия для хранения с разных точек зрения.
Основное значение для хранения связано с тем фактом, что данные должны существовать избыточно, по крайней мере, в двух отдельных физических местах, часто охватывая значительные расстояния. Это избыточность в корне увеличивает требования хранения, поскольку каждое изменение, сделанное в первичной базе данных, передается, хранится и применяется в базе данных реплик в другом регионе. В отличие от локальной репликации в одном центре обработки данных или регионе, где передача данных и воздействие на хранение относительно содержатся, репликация межрегиона включает в себя обязательство хранения полных копий базы данных и ее обновлений о географически удаленной инфраструктуре, которая обычно влечет за собой дополнительные затраты на хранение.
В перекрестной репликации MySQL первичный сервер записывает записи бинарного журнала (binlog) всех происходящих изменений. Эти бинлоги передаются асинхронно на серверы реплик. Затем серверы реплик воспроизводят события журнала, чтобы поддерживать идентичные копии базы данных на удаленных сайтах. С точки зрения хранения, появляются следующие ключевые последствия:
1. Повышенное хранилище данных для полных копий: каждая реплика поперечного региона требует емкости хранения, достаточной для удержания всего набора данных или подмножества реплицируемых данных. Это означает, что если основной экземпляр базы данных MySQL составляет 500 ГБ, каждая копия в других регионах также требует не менее 500 ГБ емкости для хранения для размещения копии. Если в регионах существует несколько реплик для балансировки нагрузки или аварийного переключения, это умножает общую площадь хранения.
2. Хранение для двоичных журналов и метаданных репликации: основной экземпляр должен поддерживать двоичные журналы, которые отслеживают изменения, и эти бинарные журналы дополнительно потребляют пространство для хранения. В зависимости от настройки продолжительности удержания (чтобы реплики наверстать упущенное или для восстановления в определенном времени), хранилище для Binlogs может накапливаться значительно. Удаленные реплики также сохраняют журналы реле, которые временно хранят изменения, полученные до применения их в базе данных.
3. Затраты на хранение и различия в ценах: облачные поставщики, такие как Amazon RDS для MySQL или Amazon Aurora MySQL, обычно взимаются за хранение отдельно в каждом регионе. Поскольку реплики и их данные находятся в отдельных физических местах, каждая из них несет собственные затраты на хранение. Более того, затраты на передачу данных межрегионы применяются по мере того, как данные изменений проходят между центрами обработки данных. Эти накопленные затраты могут быть нетривиальным финансовым рассмотрением.
4. Влияние методов сжатия и сокращения данных: Для смягчения требований хранения некоторые системы реализуют сжатие и фильтрацию бинарных журналов. Например, селективно репликация конкретных баз данных или таблиц уменьшает объем данных в репликах. Сжатие двоичных журналов уменьшает пропускную способность передачи сети и хранение, но за счет добавленных накладных расходов ЦП во время процессов сжатия и декомпрессии.
5. Доступность хранилища и соображения производительности: реплики должны предоставить хранилище, которое может обрабатывать нагрузку ввода/вывода, генерируемую путем применения изменений репликации в режиме реального времени или почти в реальном времени. Нижний эффективность или недостаточное количество хранения может привести к отставанию в репликации, что может привести к несоответствию данных в разных регионах. Таким образом, выбор типа хранения (например, SSD против HDD), пропускной способности и характеристик производительности IOPS напрямую влияют на эффективность репликации и свежесть данных.
6. Резервное копирование и хранение восстановления: в настройке репликации перекрестной регионы резервное копирование часто принимается как на первичных, так и на экземплярах реплики, чтобы обеспечить долговечность данных. Поддержание резервных копий сами требует дополнительных ресурсов хранения. Если реплики используются в качестве целевых показателей аварийного аварийного восстановления, необходимо предоставить хранилище для удовлетворения потребностей восстановления и снимков.
7. Усиление роста объема данных: по мере того, как основная база данных растет с течением времени из -за вставки, обновлений и изменений схемы, все реплики должны соответствующим образом масштабировать их хранилище. Любая неэффективность или задержки в масштабировании хранилища реплики могут создавать узкие места или потери данных о рисках, особенно во время сценариев отказа от пролона.
8. Задержка репликации и синхронизация хранения: потому что репликация данных по регионам является асинхронным, реплики отстают от первичной. Чем дальше от регионов, тем дольше данные остаются в транзите и в постановке хранения, таких как журналы реле. Расширенное хранилище для журналов увеличивает накопление хранения и требует эффективных политик управления журналами для безопасной очистки или архивирования старых журналов.
9. Последствия для хранения безопасности и соответствия: в некоторых случаях юридические или регулирующие требования мандат зашифрование данных в состоянии покоя во всех регионах. Шифрование хранимых копий добавляет еще один уровень сложности к управлению хранением, включая потенциальное увеличение размера хранения из -за метаданных шифрования и требований для совместимых решений для хранения.
10. Хранение репликации по перекрестной регионе с несколькими мастерами: если архитектура использует репликацию нескольких мастеров в разных регионах (таких как мастер-мастер), последствия для хранения увеличиваются, поскольку конфликты записи и возможные механизмы согласованности могут привести к дублированным или осироте, требующим дополнительных стратегий управления хранением.
С точки зрения передовых практик для решения этих последствий для хранения, администраторы базы данных часто:
- хранилище правого размера в регионах для соответствия текущим и прогнозируемым объемам данных.
-Используйте фильтры репликации (реплицирование-do-stable, реплицирующийся-ингнор-стол, параметры репликации-Wild-do-таблица), чтобы минимизировать ненужную репликацию данных и тем самым уменьшить накладные расходы на хранение.
- Используйте сжатые бинлоги и журналы реле для оптимизации эффективности хранения.
- Мониторинг задержки репликации и потребления хранилища тщательно для устойчивой корректировки хранилища.
- Реализовать политики хранения для бинарных журналов, которые балансируют потребности в аварийном восстановлении с затратами на хранение и потреблением.
-Используют облачные функции, такие как автоматические резервные копии, снимки и мульти-AZ-конфигурации, чтобы повысить долговечность без чрезмерного использования хранения.
Таким образом, репликация перекрестной региона в MySQL существенно увеличивает требования к хранению из-за полного дублирования данных в нескольких регионах, дополнительных бинарных и ретрансляционных хранения и резервных копий, что составляет региональные различия в стоимости и сборы за передачу. Эффективные стратегии управления хранением и оптимизации имеют решающее значение для поддержания производительности, контроля затрат и обеспечения надежного аварийного восстановления и глобальной масштабируемости развертываний MySQL. Это подробное понимание последствий для хранения информирует о планировании потенциала и решениях инфраструктуры, неотъемлемой частью успешной реализации архитектур репликации репликации MySQL.
Этот обзор отражает полный спектр соображений хранения, которые возникают при управлении базами данных MySQL, реплицированными в нескольких географических регионах.