Zálohovanie vo virtuálnom prostredí 1 – teória zálohovania

Rozhodol som sa napísať sériu článkov o zálohovaní vo virtuálnom prostredí. Prvá časť bude teoretická, kde objasním teóriu zálohovania a používané pojmy.

Prečo je potrebné dáta zálohovať? Dôvodov je viac. Môže dôjsť ku poškodeniu HW, zmazaniu alebo prepísaniu súborov a adresárov alebo to vyžaduje legislatíva. Každopádne je zálohovať produkčné prostredie nutnosť.

 

RPO a RTO sú dva parametre na základe ktorých sa navrhuje spôsob zálohovania.

  • RPO – recovery point objective – je parameter, ktorý určuje koľko dát sme ochotný „stratiť“. V prípade, že zálohujeme 1x denne o 23:00 a ku zmazaniu dát dôjde o 15:00, potom je RPO 16 hodín.
  • RTO – recovery time objective – je čas, za ktorý dokážeme obnoviť dáta. Môže to byť obnova zmazaného adresára alebo aj nahodenie celého serveru.

Pri RPO aj RTO platí, že čím menší čas požadujeme, tým viac to bude stáť. Ináč povedané ak môžeme stratiť maximálne 1 hodinu práce a obnova servera by nemala byť dlhšia ako 2 hodiny, je potrebné k tomu zakúpiť aj zodpovedajúci HW aj SW.

 

Zálohovanie môžeme rozdeliť na backup, archiváciu, replikáciu a snapshoty.

  • Backup – umožňuje relatívne rýchlu obnovu dát v prípade poškodenia v produkcii. Dáta sú väčšinou uložené v rovnakej štruktúre, ako produkčné dáta.
  • Archivácia – umožňuje odloženie dát na dlhú dobu, teda nielen mesiace ale aj roky. Dáta sú väčšinou uložené v inej štruktúre, ako produkčné dáta a sú katalogizované. Často sa používa technológia WORM – write once, read many.
  • Replikácia – môže byť synchrónna alebo asynchrónna. Replikácia kopíruje dáta v natívnej podobe na druhé zariadenie. Dáta sú teda na oboch zariadeniach rovnaké a v prípade výpadku na jednej strane sú ihneď dostupné na strane druhej.
  • Snapshoty – zachovávajú dáta v stave, akom boli keď bol urobený snapshot. Väčšina snapshotových technológií používa blokový Copy on first write. Je to rýchly spôsob zálohy a obnovy dát.

Pre najmenšie RTO a RPO sa používa replikácia. Tento spôsob zálohovania je ale spravidla najdrahší a udrží len aktuálny stav dát alebo len niekoľko posledných kópii dát. Snapshoty sa tiež používajú pre zálohovanie v kratšom časovom úseku, keďže majú nejakú réžiu. Preto sa v prípade replikácie a snapshotov používa aj backup, ktorý udrží dáta v dlhšom časovom úseku.

 

Kompresia a deduplikácia sú technológie, ktoré zefektívňujú možnosti zálohovania.

  • Kompresia – zmenšuje veľkosť dát, ktoré sú uložené na zálohovacie médium.
  • Deduplikácia – je technológia, ktorá rozdelí zálohované dáta na bloky a na zálohovacie médium uloží len jednu kópiu každého bloku. Pomocou tohto postupu sa rapídne zmenší veľkosť dát na zálohovacom médiu. Deduplikácia môže prebiehať na zdroji alebo na cieli.

Technológie ako deduplikácia a kompresia znižujú náklady na zálohovacie médium a často zmenšia čas potrebný na zálohovanie.

 

Najčastejšie používané zálohovacie média v dnešnej dobe sú pásky a harddisky.

  • Páska – na rozmerovo malé médium vie zazálohovať veľké množstvo dát a je prenositeľná – čo umožňuje odniesť dáta na inú lokalitu alebo dať ju do trezoru. Na druhú stranu záloha aj obnova je pomalšia, pásky je treba katalogizovať a ťažko sa na nich vyhľadávajú dáta.
  • Harddisky – môže sa jednať o server, NAS alebo špeciálne zariadenie uspôsobené ako zálohovací ciel. Záloha aj obnova je rýchla a môže sa využiť deduplikácia. V dnešnej dobe majú disky vysokú kapacitu, takže je možné vytvoriť veľký priestor pre zálohovanie. Väčšinou sa ale nedajú jednoducho prenášať na inú lokalitu.

 

Týmto uzatváram prvý článok, ktorý bol plný teórie o ktorú sa budem opierať v ďalších častiach série o zálohovaní.

One thought on “Zálohovanie vo virtuálnom prostredí 1 – teória zálohovania

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *

Táto webová stránka používa Akismet na redukciu spamu. Získajte viac informácií o tom, ako sú vaše údaje z komentárov spracovávané.