Možnosti deduplikace v úložných systémech rostou

Ján Harman | 31.05.2013 | Podniková infrastruktura, Software | Žádné komentáře

Deduplikace je pojem, který výrazně rezonuje v dnešním světě úložných systémů. Přitom nejde o úplnou novinku – tato technologie je na trhu již několik let. V dnešní době může mít její využití reálný efekt na snížení TCO (celkových nákladů na vlastnictví) a zlepšení ROI (návratnosti investice). Uvedeme několik typických příkladů využití deduplikace.

Zálohování

Zálohování je nejtradičnější (a první komerčně dostupný) způsob využití deduplikace. Používají se dva způsoby, které se liší časovým rámcem zpracování zálohovaných dat. In-line zpracování deduplikuje data přímo při přístupu na zdroj, zpracování post-processing pak deduplikuje již uložená data.

In-line vyžaduje výrazně větší výpočetní výkon, aby byla dosažitelná takoá úroveň deduplikace jako při zpracování post-processing. V začátcích komerčního využití se primárně využívána metoda post-processingu, ale v dnešní době, kdy vícejádrové procesory poskytují masivní výpočetní výkon za rozumnou cenu, se primárně využívá metodika in-line.

Využití deduplikace má smysl především při zálohování dat s vysokou mírou datové redundance. Jedno z nejefektivnějších využití je zálohování virtualizovaného prostředí, kde jednotlivé klonované virtuální stroje mají výrazný společný obsah. Při zálohování takového prostředí může míra deduplikace dosáhnout poměru až 50:1.

Deduplikace na úrovni primárního storage

Dnes většina světových výrobců úložných systémů nabízí i možnost deduplikace přímo na úrovni primárního storage, kde můžeme definovat různé přístupy k této funkcionalitě:

a) Deduplikace klonů a snapshotů – logická volba, kde primární data jsou v čisté formě a řešení nemá dopad na výkon storage (ve smyslu operací V / V).

b) Post-processing – data se ukládají na storage v čisté formě a deduplikace nastává až později, typicky v době, kdy primární storage není naplno vytížen. Tato metoda funguje lépe, než to zní, typicky dosahují tato řešení výkonnost nededuplikovaného storage a zbytečně neplýtvá výkonem na deduplikaci dočasných dat vytvářených během běhu aplikací.

c) In-line – několik světových výrobců dodává na trh i úložná zařízení s on-line deduplikací dat, s parametry, které splňují požadavky na primární storage a přitom umožňují využívat výhod deduplikace. Zřejmě tato technika je cestou, kterou se bude ubírat další vývoj, zejména proto, že již není problém nabízet storage zařízení s masivním interním výpočetním výkonem a masivním objemem paměti RAM nebo SSD.

Jiným pohledem na tuto problematiku je řešení otázky, kde se deduplikační proces provádí:

1. Deduplikace u zdroje – dochází k ní na zdroji (typicky na serveru nebo klientovi). Přístup založený na zdroji má za následek menší množství dat posílaných po síti pro zálohování, což může vést ke zkrácení času potřebného k zálohování.

2. Deduplikace na cíli – data se nejprve uloží a poté deduplikují (následný proces).

Každá z těchto metod má své pro a proti. Deduplikace v následném procesu může vyústit do rychlejšího zálohování, průběžná zase znamená, že data se mohou replikovat okamžitě po ukončení zálohování.

Hlavní přínosy

Na závěr si shrňme hlavní přínosy deduplikace a její současné možnosti:

1. Storage nebo zálohovací zařízení může být osazeno řádově nižší kapacitou.
2. Spotřeba elektrické energie a energie na chlazení je výrazně nižší.
3. Použití ověřené technologie.
4. Široký výběr řešení od renomovaných výrobců.
5. Možnosti průběžného vylepšování technologie vzhledem k jejímu „softwarovému“ původu, z toho vyplývající rychlé zlepšování vlastností a doplňování funkcionalit.
6. Deduplikace může být dnes již nativní vlastností každého řešení, ať už zálohovacího, nebo primárního storage, a určitě je způsobem, jak snížit náklady na provoz a také pořizovací náklady řešení.

Autor je ředitelem oddělení infokomunikačních technologií ve společnosti DATALAN.

Zdroj: Infoware.sk

Zanechte komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *


čtyři + šest =

Můžete používat následující HTML značky a atributy: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Copyright © ICT manažer | ISSN 1805-5486 | SEO optimalizace a přizpůsobení SEO-care.cz