Sofistikovaná archivace podnikových dat

Tomáš Vencelík | 14.12.2012 | Ostatní, Software | Žádné komentáře

Každé podnikání generuje rok co rok více dat, které je třeba uchovávat pro případné další použití. Při výběru optimálního archivačního řešení se uplatňuje několik kritérií, nejdůležitější jsou náklady na uložení jednotkového množství dat a jejich dostupnost v požadovaném čase. Konfigurace úložného řešení musí pochopitelně zohledňovat způsob práce s konkrétními typy dat.

Životní cyklus údajů

Jednotlivé informace, případně dokumenty mají svůj životní cyklus, který začíná okamžikem vzniku a končí definitivním vymazáním. V případě důležitých údajů může jít i o časový horizont několika desetiletí. Logickým důsledkem několikaleté provozu IT systému je velké množství dat, se kterými se již aktivně nepracuje, ale stále mohou být cenným podkladem pro různé statistiky, analýzy a prognózy. První měsíce si informační systém dokáže s rostoucím objemem dat zpravidla poradit bez jakýchkoliv problémů a většina údajů je aktuálních.

Neustále rostoucí objem skladovaných dat však postupně způsobuje celkové zpomalení systému a prodlužuje doby přístupu. Údaje, které v určitém období obsahovaly klíčové informace, se postupně stávají zátěží i přesto, že stále mohou být za určitých podmínek sporadicky požadované. Na každodenní firemní operativu jsou ale již nepotřebné. Nemluvě o narůstání redundance, pokud se všechny operativně údaje stále zálohují.

Proto je důležité vhodně načasovat přesun dat z operativní oblasti úložiště do archivu. Z pohledu životního cyklu to znamená ukončení aktivní fáze, kde se již nevyžaduje rychlý přístup, spíše vystupují do popředí otázky nákladů spojených s archivací. Přesun může být proveden explicitně na pokyn administrátora nebo automaticky podle toho, jak se k údajům přistupuje.

Úložným řešením stále dominují pásky

Pásky, které nedávno oslavili šedesáté narozeniny, jsou z hlediska ceny za uložený terabajt stále minimálně o jeden řád levnější než jiná řešení, a proto jsou dodnes klíčovým komponentem infrastruktury pro zálohování a archivaci dat. Výhodou pásek je navíc to, že s rostoucí kapacitou jejich cena klesá.

Na druhou stranu jsou pásky zároveň nejpomalejší, takže se hodí více na dlouhodobou archivaci než na údaje, ke kterým potřebujeme mít operativní přístup. Zatímco v případě méně používaných nebo dokonce archivovaných dat není doba přístupu kritická, takže hlavním kritériem jsou náklady, při často používaných údajích dominuje operativní přístup. Z takového jednoduchého ekonomického rozboru vyplývá nutnost kategorizace údajů a používání kombinovaných řešení.

Sofistikované kombinované řešení

V minulosti administrátoři museli více či méně pracně konfigurovat, které údaje budou kam uloženy. Moderní storage tuto úlohu stále více automatizují a stále více se snaží přiblížit takzvanému „storage ideálu“, kde by se úložné řešení navenek jevilo jako připojená černá skříňka, do které se data ukládají a v případě potřeby zase vybírají, přičemž veškerou inteligenci spojenou s co nejefektivnějším ukládáním dat tak, aby údaje byly v požadovaném čase k dispozici, zařídí už software storage.

Takové řešení obsahuje více typů médií pro ukládání dat, přičemž data jsou do nich automaticky směrována podle toho, v jakém režimu se právě používají. Ta data, ke kterým se bude s největší pravděpodobností přistupovat v horizontu několik minut, je nejvýhodnější mít na drahém, ale extrémně rychlém polovodičovém úložišti typu SSD, operativní údaje pak na běžných discích a informace, u kterých v nejbližších hodinách či dnech přístup nepředpokládáme, na nejlevnějších páskách. Na nižší úrovni granularity lze operativně přesouvat data mezi Fibre Channel nebo vysokootáčkovými disky SAS 2.0 a mnohem levnějšími a pomalými disky SATA, určenými pro data, které systém v daném okamžiku vyhodnotí jako méně používané.

V praxi to funguje tak, že na základě analýzy aktuální poptávky po údajích se soubory a databáze inteligentně přesouvají mezi jednotlivými typy úložných médií. Tyto děje probíhají automaticky bez zásahu administrátora, případně na základě předem definovaného cyklu, který respektuje životní cyklus daného typu dat – vše s cílem dosáhnout co nejlepší dostupnosti intenzivně používaných údajů. Uvedený proces je obousměrný, takže údaje, ke kterým se v daném čase přistupuje málo nebo vůbec, se pak přesouvají na pomalé a levné disky SATA, případně na pásky.

Orchestrace informačních systémů a úložiště

Sofistikované úložiště, které dokáží více či méně automaticky přesouvat data mezi různými typy médií, sice do značné míry řeší efektivní ukládání dat, ale při striktním rozdělení na operativní data a archiv je důležitá i spolupráce podnikového softwaru, hlavně systémů ERP. U dobře navrženém řešení na operativu a archivaci uživatel při vyhledávání údajů, které jsou uloženy v archivu, nejenže nemusí opustit prostředí systému ERP, ale to, že fyzicky vyhledává v archivu, ani nepostřehne.

Závěr

Kritérií pro porovnávání výhod a nevýhod pásek a disků je velké množství. Vzhledem k současným „green“ trendům v IT, motivovaným nejen snahou o ochranu životního prostředí, ale hlavně vysokými cenami energií, uvedeme jen jeden zásadní fakt: páska je o 99 procent energeticky úspornější než disk. Proto je potřeba při budování datových center zvažovat, které informace budou pro operativní použití a musí být na discích a které údaje jsou archivní a mohou být na energeticky úsporných páskách.

Význam úložných řešení v blízké budoucnosti posílí i takzvaná bezdiskovou virtualizace. V současnosti jsou servery přesto, že se na nich stále více provozuje virtualizované prostředí, konstruovány stále podle klasické koncepce. Na virtualizaci jsou však nezbytné pouze tři položky: CPU, RAM a I / O. Fyzické disky na serverech však teoreticky nejsou potřeba. Hypervizor může startovat z interní paměti flash nebo z disku SSD a obrazy virtuálních disků mohou být na storage.

Autor pracuje jako Storage Sales Leader ve společnosti Oracle.

Zdroj: Infoware.sk

Zanechte komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *


devět + sedm =

Můžete používat následující HTML značky a atributy: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Copyright © ICT manažer | ISSN 1805-5486 | SEO optimalizace a přizpůsobení SEO-care.cz