Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Kakšne so posledice za shranjevanje med replikacijo navzkrižne regije v MySQL


Kakšne so posledice za shranjevanje med replikacijo navzkrižne regije v MySQL


Navzkrižna replikacija v MySQL vključuje kopiranje in vzdrževanje podatkov iz primera primarne baze podatkov, ki se nahaja v enem geografskem območju do enega ali več primerkov replik, ki se nahajajo v različnih regijah. Ta nastavitev ponuja pomembne prednosti, kot so obnovitev po nesrečah, izboljšana razširljivost branja, zmanjšana zamuda za globalno porazdeljene aplikacije in sposobnost selitve podatkov med regijami z minimalnim izpadom. Vendar pa medregijska replikacija prav tako vsebuje velike posledice za shranjevanje z več perspektiv.

Posledice jedra shranjevanja izhajajo iz dejstva, da morajo podatki na vsaj dveh ločenih fizičnih lokacijah, ki se pogosto zatečejo, veliko razdalj. Ta odpuščanje bistveno poveča zahteve po shranjevanju, saj se vsaka sprememba v primarni bazi podatkov prenaša, shranjuje in uporablja v bazi replike v drugi regiji. Za razliko od lokalne replikacije v enem podatkovnem centru ali regiji, kjer sta relativno vsebovana vpliv prenosa in shranjevanja podatkov, je navzkrižna podvajanje zavzema za shranjevanje popolnih kopij baze podatkov in njegovih posodobitev geografsko oddaljene infrastrukture, ki običajno vključujejo dodatne stroške shranjevanja.

V replikaciji MySQL navzkrižne regije primarni strežnik zapiše binarni dnevnik (Binlog) zapise o vseh spremembah. Ti binlogi se asinhrono prenašajo na replika strežnike. Strežniki replike nato predvajajo dogodke dnevnika, da ohranijo enake kopije baze podatkov na oddaljenih mestih. Z vidika pomnilnika se pojavijo naslednje ključne posledice:

1. Povečano shranjevanje podatkov za popolne kopije: Vsaka replika medregije zahteva, da zadostuje zmogljivost za shranjevanje, ki zadrževa celoten nabor podatkov ali podskupino podatkov, ki se ponovijo. To pomeni, da če je primarni primerek baze podatkov MySQL 500 GB, vsaka replika v drugih regijah potrebuje tudi vsaj 500 GB zmogljivosti za shranjevanje za nastanitev kopije. Če obstaja več replik v regijah za uravnoteženje ali preklop obremenitve, to pomnoži skupni odtis pomnilnika.

2. Shranjevanje za binarne dnevnike in metapodatke za podvajanje: Primarni primerek mora vzdrževati binarne dnevnike, ki spremljajo spremembe, ti binarni dnevniki pa še dodatno porabijo prostor za shranjevanje. Odvisno od konfiguriranega trajanja zadrževanja (da se omogoči, da se replike dohitijo ali za obnovitev v času v času), se lahko shranjevanje za Binlogs znatno kopiči. Oddaljene replike ohranijo tudi rele dnevnike, ki začasno shranijo spremembe, prejete, preden jih uporabijo v bazo podatkov.

3. Stroški shranjevanja in razlike v cenah: ponudniki oblakov, kot sta Amazon RDS za MySQL ali Amazon Aurora MySQL, običajno za shranjevanje v vsaki regiji zaračunajo za shranjevanje. Ker replike in njihovi podatki prebivajo na ločenih fizičnih lokacijah, vsaka povzroči lastne stroške skladiščenja. Poleg tega veljajo stroški prenosa podatkov med regijami, ko podatki o spremembah potujejo med podatkovnimi centri. Ti akumulacijski stroški so lahko ne trivialni finančni premislek.

4. Vpliv tehnik stiskanja in zmanjševanja podatkov: Za ublažitev zahtev po shranjevanju nekateri sistemi izvajajo stiskanje in filtriranje binarnih dnevnikov. Na primer, selektivno ponovitev določenih baz podatkov ali tabel zmanjšuje glasnost podatkov na replikah. Stiskanje binarnih dnevnikov zmanjšuje pasovno širino in shranjevanje omrežnega prenosa, vendar s stroški dodanega CPU -ja med postopki stiskanja in dekompresije.

5. Razpoložljivost za shranjevanje in razmislek o zmogljivosti: Replike morajo zagotoviti shranjevanje, ki lahko obvlada obremenitev V/I, ustvarjene z uporabo sprememb podvajanja v realnem času ali v bližini. Nižje uspešno ali premajhno shranjevanje lahko privede do zaostajanja pri razmnoževanju, kar lahko povzroči neskladnost podatkov v regijah. Zato izbira vrste shranjevanja (npr. SSD v primerjavi s HDD), značilnosti zmogljivosti pretoka in IOPS neposredno vplivajo na učinkovitost podvajanja in svežino podatkov.

6. Varnostno kopiranje in obnovitev za shranjevanje: V nastavitvi replikacije medregije se varnostne kopije pogosto sprejemajo tako v primarnih kot v primerih, da se zagotovi trajnost podatkov. Ohranjanje varnostnih kopij zahteva dodatne vire za shranjevanje. Če se replike uporabljajo kot preklopne cilje za obnovitev nesreč, je treba shranjevanje predvideti, da ustrezajo potrebe po obnovi in ​​posnetki.

7. Ojačevanje rasti volumna podatkov: Ker se primarna baza podatkov sčasoma raste zaradi vstavkov, posodobitev in sprememb shem, morajo vse replike ustrezno spremeniti njihovo shranjevanje. Vsaka neučinkovitost ali zamude pri skaliranju pomnilnika replike lahko ustvarijo ozka grla ali tvegajo izgubo podatkov, zlasti med scenariji preklopa.

8. Zakasnitev replikacije in sinhronizacija shranjevanja: Ker je podvajanje podatkov v regijah asinhrono, replike zaostajajo za primarnim. Daljši ko so regije, daljši podatki ostanejo v tranzitu in v shranjevanju shranjevanja, kot so relejski dnevniki. Razširjeno shranjevanje dnevnikov poveča kopičenje pomnilnika in zahteva učinkovite politike upravljanja dnevnikov za varno čiščenje ali arhiviranje starejših dnevnikov.

9. Posledice za varnost in skladnost: V nekaterih primerih pravne ali regulativne zahteve navajajo šifriranje podatkov v mirovanju v vseh regijah. Šifriranje shranjenih replik dodaja še eno plast zapletenosti pri upravljanju pomnilnika, vključno s potencialnim povečanjem velikosti pomnilnika zaradi šifrirnih metapodatkov in zahtev za združljive rešitve za shranjevanje.

10. Shranjevanje podvajanja z več matičnimi regijami: Če arhitektura uporablja podvajanje z več mojstri v regijah (na primer mojster mojster), se posledice za shranjevanje povečujejo, ker lahko konflikti in morebitni mehanizmi doslednosti privedejo do podvojenih ali osirotenih podatkov, ki zahtevajo dodatne strategije upravljanja shranjevanja.

Glede na najboljše operativne prakse za reševanje teh posledic za shranjevanje, skrbniki baz podatkov pogosto:

- Shranjevanje v desni velikosti po regijah, da se zadovolji s trenutnimi in predvidenimi količinami podatkov.
-Uporabite filtre za razmnoževanje (ponovitev-tabela, ponovitev-ignore-tabela, ponovitev-will-will-Do-tabela parametri), da zmanjšate nepotrebno podvajanje podatkov in s tem zmanjšate pomnilniško stroške.
- Za optimizacijo učinkovitosti shranjevanja uporabite stisnjene binlog in releje.
- Tesno spremljajte zaostajanje podvajanja in porabo pomnilnika, da se proaktivno prilagodi shranjevanje.
- Izvedite politike zadrževanja za binarne dnevnike, ki uravnotežijo potrebe po katastrofi s stroški skladiščenja in porabo.
-Vzpostavite funkcije v oblaku, kot so avtomatizirane varnostne kopije, posnetke in več-az konfiguracije za izboljšanje trajnosti brez prekomerne uporabe shranjevanja.

Če povzamemo, podvajanje medregije v MySQL znatno poveča zahteve po shranjevanju zaradi popolnega podvajanja podatkov v več regijah, dodatnega binarnega in relejskega skladiščenja ter varnostnih kopij, ki jih vse dopolnjujejo regionalne razlike v stroških in pristojbine za prenos. Učinkovite strategije upravljanja shranjevanja in optimizacije so ključne za ohranjanje uspešnosti, stroškov nadzora in zagotavljanje zanesljivega obnavljanja nesreč in globalne razširljivosti uvajanja MySQL. To podrobno razumevanje posledic za shranjevanje sporoča načrtovanje zmogljivosti in odločitve o infrastrukturi, ki so sestavni del uspešnega izvajanja arhitekture podreditve MySQL navzkrižne regije.

Ta pregled zajema celoten spekter premislekov o shranjevanju, ki se pojavljajo pri upravljanju baz podatkov MySQL, ki so ponovljene v več geografskih regijah.