Deduplikace: Úspora místa jen jedním z řady benefitů

Vladimír Kyša | 18.11.2011 | Hardware, Podniková infrastruktura | Žádné komentáře

Víte jak technologie deduplikace funguje a jaké jsou její druhy? A také že nasazení deduplikace má i řadu dalších efektů než jen úsporu místa na discích?

Křivka nárůstu dat začíná mít exponenciální charakter a jedním ze způsobů, jak proti tomto trendu bojovat je právě nasazení deduplikace. Výrobci úložišť se snaží držet krok s tímto trendem pravidelným zvyšováním kapacit disků. Páskové jednotky, které byly po dlouhou dobu synonymem pro úložná zálohovací zařízení, jsou nyní stále častěji nahrazovány pevnými disky, neboť již nabízí porovnatelnou a nebo dokonce i nižší cenovou úroveň při větším komfortu dostupnosti a spolehlivosti zálohovaných dat.

Technologie deduplikace je stále zatím v začátcích svého rozmachu a podle informací agentury Gartner ji v první polovině letošního roku využívalo jen méně než 10 % firem. V horizontu čtyř let to ale má být až 80 % organizací. Tento dynamický trend výrazně připomíná i éru virtualizaci, která začala před několika roky a dnes jsme již v bodě, kdy si bez virtualizace nedokážeme představit běžný provoz podnikového IT. Analytici Gartneru dále předpokládají, že během následujících let deduplikace pronikne i na primární úložiště a nebude jen doménou zálohování.

Co je přesně deduplikace?

Deduplikace dat se dá analogicky přirovnat ke kompresi, kdy se algoritmus snaží najít shodné bloky dat a nahradit je jen odkazem na jediný výskyt, což vede k následné úspoře místa na disku. Na rozdíl od jednoduché komprese, která se obvykle provádí jen na jednom souboru, se při deduplikaci hledají stejné bloky napříč všemi soubory v rámci jednoho klienta nebo u vyspělejších technologií napříč všemi klienty. Deduplikace se může odehrávat nejen na částech, ale i na úrovni celých souborů. Ty mohou vzniknout jako náhodná či úmyslná kopie a ze zkušenosti se dá říci, že takto duplicitních bývá asi 10 % uložených dat. Pokud zjemníme granularitu pohledu, můžeme deduplikovat po částech souborů, takzvaných subsouborech a to buď s fixním krokem nebo s variabilním krokem.

Právě deduplikace s variabilním krokem je dnes asi nejatraktivnější způsob deduplikace, která při zálohování může průměrně ušetřit až 92 % úložného prostoru.

Efektivitu deduplikačního procesu výrazně ovlivňuje charakter dat a délka období po které data zálohujeme a je charakterizovaná deduplikačním poměrem. Zálohování databází nebo třeba prostředí VMware, kde dochází jen k částečným změnám a většina zálohovaných souborů je shodná s těmi z minulé zálohy, je pak pro deduplikační technologii úplně ideální.

Deduplikace na zdroji nebo na cíli?

Deduplikace může při zálohování probíhat na dvou možných místech. Deduplikace na cíli se realizuje v úložišti dat, tedy až po přenosu po síti. Naopak při zálohování na zdroji vyřadí systém duplicitní části souborů ještě dřív, než jsou odeslané na zálohování, což omezí množství dat posílaných přes síť a šetří se tak přenosové pásmo sítě.

Vzniká tím poměrně zajímavý efekt. Kromě výrazného snižování množství uložených dat (což od deduplikačního řešení očekáváme víceméně automaticky) to vede i ke zmenšování zálohovacích oken, a to většinou z desítek hodin na desítky minut nebo z hodin na minuty.

Součástí řešení může být i globální deduplikace. Ta probíhá na úrovni všech dat v prostředí společnosti, nejen na úrovni jednoho klienta. Systém přenese kompletně data při první záloze. Následně se pak při dalších zálohách díky deduplikaci na zdroji přenášejí jen změny. Jde o optimální metodu pro rozsáhlá virtuální prostředí, centrální zálohování vzdálených poboček a nebo centrální zálohování velkého počtu koncových zařízení (PC, notebooky).

Provoz deduplikačních úložných zařízení přináší firmám kromě výrazné úspory ukládaných dat (a s tím spojených finančních benefitů) a zkracování zálohovacího okna i další výhody. V serverovně budou mít méně úložných systémů a mnohem více místa, klesá i požadavky na příkon elektrické energie, snižují se nároky na chlazení a méně hardwaru obecně znamená i menší chybovost a poruchovost.

Deduplikační úložná zařízení jednoduše umožní budování konceptu disaster recovery, protože deduplikovaná data je možné jednoduše replikovat a dostat je na libovolné místo s nenáročnou konektivitou, například pro ochranu proti povodni, požáru a jiným katastrofám.

Autor pracuje jako produktový specialista divize BRS (Backup Recovery Systems) společnosti EMC pro ČR, Slovensko a Maďarsko.

Zdroj: Infoware.sk

Zanechte komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *


jedna + = sedm

Můžete používat následující HTML značky a atributy: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Copyright © ICT manažer | ISSN 1805-5486 | SEO optimalizace a přizpůsobení SEO-care.cz