Stáhněte si kompletní aktuální číslo EMC Magazinu.

Transkript

Stáhněte si kompletní aktuální číslo EMC Magazinu.
Zár̆í / 2011
Zveme vás na
EMCDay!
22. září 2011, Hotel Diplomat, Praha
Registrujte se již dnes
na czech.emc.com/emcday
Editorial
E = mc
2
Přihlásit se k nejslavnější rovnici dějin fyziky je vlastně pěkná drzost.
Einsteinův vzorec říká, že v každém kousku hmoty je ukryto nepředstavitelné
množství energie. Dnes z ní dovedeme využít jen zlomek zlomku. A vědci
říkají, že nikdy nedosáhneme na celek.
Vydává:
EMC Czech Republic s. r. o.
Grafická úprava a sazba:
IDG Czech Republic, a. s.
To neznamená, že bychom se měli přestat snažit. Každé malé zlepšení může
přinést veliký užitek.
Tisk:
OMIKRON s. r. o.
O nevyužitém potenciálu se vždy dá uvažovat jako o příležitosti. Je pozoruhodné, jak málo lidí to dělá. S dnešním světem IT je to hodně podobné jako
s energií skrytou ve hmotě. Skrytá síla je obrovská, ale její velká část spí.
Víte o ní, ale nedovedete ji využít.
Autory neoznačených příspěvků
jsou Petr Koubský a pracovníci
společností EMC a IDG.
Přihlásit se k té rovnici je možná drzost, ale my jsme si na to troufli už dávno.
Znovu a znovu potvrzujeme, že právem. EMC již 32 let pomáhá uživatelům
získat z podnikových informačních systémů maximum. I proto jsme se rozhodli představit se vám, našim zákazníkům, cestou tradiční, a přece novou. Zveme vás na setkání nazvané EMC Day, které proběhne
22. září 2011 a na němž budete mít možnost poznat nás i jinak, než jste
dosud byli zvyklí.
Kontakt:
V parku 2335/20
148 00 Praha 4-Chodov
Česká republika
Tel.: +42 2 720 89 410
Fax: +42 2 720 89 411
E-mail: [email protected]
Web: www.emc.com
Ve spolupráci s časopisem
COMPUTERWORLD ve vydavatelství
IDG Czech Republic, a. s.
Ukládání dat
Svět se mění
nenápadně
Dějí se věci, o nichž víte,
ale nepřemýšlíte o nich.
J
edné z nich se říká datová exploze. Samozřejmě jste o ní
slyšeli už mnohokrát. Do roku 2010 bylo na světě vytvořeno
celkem 1,25 ZB dat. ZB znamená zettabajt a je to miliarda
terabajtů, neboli dvě na sedmdesátou bajtů. Analytická firma IDC
extrapolací dosavadního trendu spočítala, že v roce 2020 to bude
35,2 ZB. Neboli: zdvojnásobení ani ne za dva roky.
Informatika se totiž také změnila, a to ve více ohledech najednou.
Máme výkonnější a levnější hardware. Máme všudypřítomné
a rychlé datové připojení. A máme úplně nové způsoby použití IT
počínaje zabudovanými senzory ve zdech budov a konče Facebookem.
To všechno generuje data, hodně dat. Máme mobilní telefony,
kamery, navigace, používáme sociální sítě. Posíláme si e-maily
a SMS. Stále častěji používáme RFID čipy namísto čárového kódu.
Přibývá oborů a činností, kde se pracuje s dříve nevídanými
datovými objemy – od filmových a postprodukčních studií po nemocnice, kde se vyhodnocují CT skeny. Celá moderní biologie
a genetika se proměnily v počítačovou vědu řešící složité úlohy
s velkými daty. Velký boom prožívá analýza obsahu sociálních
sítí a vůbec datamining v internetu. Datová centra firem jako
Google a Facebook patří k největším továrnám na světě. Čeho
jsme svědky?
1.
Kdysi, v počítačovém dávnověku, měla většina dat
strukturovanou podobu. Nacházela se v databázích,
tedy v tabulkách, tudíž spolu s každým údajem byl uložen jeho význam. Číslo v pátém sloupci a třetím řádku znamenalo
výsledky prodeje výrobku číslo tři (a který to je, to se poznalo
z jiné tabulky – z číselníku) za měsíc květen. Tohle dávno není
pravda. Dnes výrazně převládají nestrukturovaná data: textové
soubory, e-maily, obrázky, zvukové nahrávky, videa. Je jich čtyřikrát víc než strukturovaných a tento poměr dál roste.
2.
Prozatím většinu dat vytvářejí lidé – buď přímo, nebo
prostřednictvím softwaru, který z dat dělá jiná data.
Brzy se však rovnováha přehoupne a většina našich
primárních dat bude generována automaticky. Půjde o záznamy z čidel, CCTV okruhů, geolokační data mapující pohyb osob
a strojů a také metadata – data o datech, pocházející především
z webu a sociálních sítí.
4.
Počet souborů roste rychleji než množství dat –
jinými slovy, přibývá malých datových souborů. To je
opět dáno výstupy z čidel, z RFID, ukládáním
komunikace v sociálních sítích apod. Z hlediska správy dat to
není pohodlná situace.
5.
Stále větší podíl dat je fyzicky ukládán v cloudu, tedy
ve sdíleném prostoru mimo fyzický dosah uživatele.
Služby jako Amazon EC2, Google Apps či Dropbox
využívají jak individuální uživatelé, tak podniky a organizace,
kromě toho přibývá cloudových služeb orientovaných výslovně
na podnikové zákazníky. IDC odhaduje, že v roce 2020 bude třetina z oněch predikovaných 35 ZB uložena v cloudu.
6.
Donedávna platilo, že kdo data vytváří, ten je spravuje.
To změnily sociální sítě, webové a mobilní aplikace
a celý koncept cloud computingu. Stále větší podíl dat
dnes vytvářejí jednotlivci, ale odpovědnost za tato data je na firmách – provozovatelích příslušných systémů.
7.
8.
Datová záplava není někde daleko za obzorem, ale všude kolem nás. Každý jednotlivec a podnik je její
příčinou i její obětí.
Dat si začaly všímat předpisy a zákony. Existuje mnoho
povinností, jež jsou spojeny s jejich pořizováním
a ukládáním. IDC odhaduje, že dnes se právní regulace
týká asi 30 % veškerých dat, do deseti let to bude 50 %.
9.
Před několika lety by byl tento výčet daleko kratší –
chyběly by v něm cloud, webové aplikace, sociální
sítě. Během několika dalších let proto pravděpodobně
vstoupí do hry faktory, o nichž zatím nic nevíme. Nejsme za změnou, jsme uprostřed ní.
10.
Data nejsou totéž co informace.
3.
Data žijí, jsou stále v pohybu. Modifikujeme je, ukládáme, odesíláme, vybíráme z nich. Zálohujeme je
a archivujeme. Spravujeme jejich historii, zaznamenáváme vývoj verzí. Máme v nich spousty redundancí, duplicit
a skoro duplicit, což někdy může být záměr, častěji však spíš
nechtěný vedlejší efekt a zdroj problémů.
1
|
Když chceš něco, co jsi nikdy
neměl, musíš udělat něco,
co jsi nikdy neudělal. – anonym
EMC magaz in
Ukládání dat
Data jsou
prostředkem,
informace
cílem
Smyslem dat by měla být použitelná
informace. Jenže dnes se ohromné množství
dat vytváří prostě proto, že to jde. Starý
problém hledání jehly v kupce sena tak
dostává docela nový rozměr.
T
výkonu a datové kapacity – od zrychlování datových operací až
po archivaci. Software je ovšem jednotný, takže společné jsou
i systém souborů, řízení a správa těchto rozmanitých konfigurací.
váří v tvář datové záplavě
potřebujeme několik
zásadních dovedností:
• J ak získat požadovanou informaci? Jak maximálně využít
nestrukturovaná data, která jsou pro dolování informací
mnohem méně vhodná než databáze?
• Jak vědět, co máme schovávat a co ne?
Jak zvládnout archivaci, zálohování a deduplikaci dat?
• Na co data fyzicky ukládat a na čem je dlouhodobě uchovávat?
• Jak vyhovět všem zákonům a předpisům pro práci s daty?
• Jak data chránit před zneužitím a poškozením?
Není to vlastně nic nového. Jen to probíhá mnohem rychleji,
v mnohem větších objemech a s mnohem rozmanitější
surovinou než dřív.
O datových úložištích nelze nadále
uvažovat staticky
Objem dat se zdvojnásobí, jak už víme, dříve než za dva roky –
a to se neděje za devatero horami, ale všude, tedy také u vás
v podniku. Musíte brát v úvahu i krátkodobý výhled provozu
podnikové informatiky. Nejde jen o potřebnou kapacitu, ale také
o rychlost, výkon, řiditelnost a náklady. Pokud se při zdvojnásobení objemu dat zdvojnásobí i tyto parametry, je situace špatná
a neudržitelná.
Aby se to nestalo, je třeba sáhnout po nových technologiích, jež
jsou postaveny s ohledem na dnešní i zítřejší požadavky. Jejich
základem je software umožňující řídit clusterová datová úložiště.
Klíčem k jejich škálovatelnosti je virtualizace a pružné rozložení
okamžité zátěže.
Jde o stejný princip, jaký se uplatňuje již delší dobu u serverů. Při
správě dat však jde o mimořádně náročnou problematiku. EMC
disponuje unikátním řešením zabudovaným do produktové řady
Isilon.
Ta umožňuje zvolit téměř libovolnou hardwarovou konfiguraci,
takže může sloužit pro různé účely v závislosti na kombinaci
2
Isilon, stejně jako produktová řada Atmos, dobře poslouží hlavně
při práci s velkými a rychle rostoucími objemy nestrukturovaných
dat – v oblasti zpracování vizuálních médií, v lékařských a biologických aplikacích, při práci s geolokačními daty.
Základní řady datových úložišť VNX a VMAX jsou zase užitečným
řešením optimalizovaným pro klasické aplikace typu ERP, ať už
jde o systémy SAP, Oracle či Microsoft, i pro souborové systémy
Windows, Linuxu či Mac OS. Zásadní je opět software pro práci
s datovým obsahem – jeho správu, zálohování, archivaci a deduplikaci.
Zálohovací zařízení produktových řad Data Domain a Avamar
se dodávají ve dvou provedeních: jako funkční celek hardwaru
a softwaru či jako čistě softwarové virtuální zařízení.
Princip deduplikace je velmi jednoduchý: ve výchozích datech
se najdou všechny shodné úseky a nahradí se odkazy. Každý
z původně duplicitních úseků je tedy v cílových datech uložen jen
jednou a doplněn odkazem – informací, kam všude patří. Jednoduchý princip samozřejmě neznamená jednoduchou realizaci –
takto přímočarý algoritmus by byl mimo jiné neúnosně pomalý.
Místo celých bloků dat se proto pracuje s jejich otisky (hash).
Účinnost se popisuje deduplikačním poměrem: např. 10 : 1 znamená, že objem dat po deduplikaci poklesl na desetinu.
Ukážu vám, proč úvahy o levné
pracovní síle tak snadno vedou
k chybám. Když si například
chcete koupit mercedes, je německá pracovní
síla pro ten účel ta nejlevnější na světě.
– Tyler Cowen, americký ekonom
|
EMC magaz in
Ukládání dat
Soubory
Pro webové aplikace,
dlouhodobé úložiště
Atmos
Pro HPC, multimédia,
extrémní kapacity
Isilon
Menší firmy
Nestrukturovaná
data
Ukládat
VNX
Střední podniky
Symmetrix VMAXe
Systémy
v korporátním
prostředí
Symmetrix VMAX
Data
Objekty
Centera
S certifikací
Archivovat
S maximální efektivitou
DataDomain
S deduplikací v cíli
Zálohovat
S deduplikací na zdroji
Avamar
Data jsou údaje, používané pro popis nějakého jevu nebo vlastnosti pozorovaného objektu. Informaci tvoří kódovaná data, která
lze vysílat, přijímat, uchovávat a zpracovávat technickými prostředky. Množství informace je rozdíl mezi neurčitostí (entropií)
informace (nebo stavu) před a po zprávě.
Zdroj: Wikipedie (upraveno)
VMAXe – Osmipatrový dort v kapesním balení
Často se v praxi setkáváme s tím, že i menší firmy potřebují
výkon a funkcionality standardně potřebné v korporátním
prostředí. Pro tyto situace vytvořila společnost EMC klon svých
podnikových úložišť pod produktovým jménem Symmetrix
VMAXe.
Zejména technologie FAST (Fully Automated Storage Tiering),
která přesouvá data v různých tierech tak, aby rozložení zátěže
maximálně korelovalo s možnostmi fyzické vrstvy úložiště,
přináší zásadní úspory v investicích do zmiňovaných technologií.
Architektura
Řešení VMAXe už v základní konfiguraci obsahuje následující
softwarové komponenty:
VMAXe v sobě obsahuje standardní architekturu korporátních
úložišť Symmetrix VMAX, tzv. Virtual Matrix, která umožňuje
vzájemné propojení všech klíčových prvků v úložišti a přizpůsobení aktuální zátěži.
Základem je tzv. VMAX engine, který v sobě integruje front-endovou funkcionalitu, globální paměť i back-endové propojení
datových prvků. Diskové pole VMAXe může obsahovat až čtyři
enginy, čímž poskytne výkon dostatečný pro většinu typů I/O
zátěže, které může IT provoz ve střední firmě generovat.
Shodná architektura s úložištěm korporátní úrovně je klíčová
pro bezkonkurenční škálovatelnost – v konfiguraci je možné
začínat už s 24 harddisky a pokračovat víceméně plynule až
po maximální počet 960 s celkovou kapacitou 1,3 PB.
Softwarová výbava
To, co dělá z produktu VMAXe pravé řešení, je software. V současnosti se disková pole zejména odlišují pokročilými funkcemi, které umožňují efektivní využívání nakupované kapacity.
3
|
• E
nginuity pro VMAXe s možností virtual provisioningu
a integrovanou funkcí RecoverPoint Splitter.
• 100% virtual provisioning, který umožňuje nabízet
klientským operačním systémům více kapacity, než je
v úložišti fyzicky nainstalováno, a efektivně tak využívat
prostory, které jsou sice alokovány, ale nevyužívány.
• RecoverPoint Splitter, jenž nahrazuje nákladná externí
zařízení nebo speciální karty v hostitelských počítačích.
• Symmetrix FAST, který automaticky přesouvá data
na odpovídající vrstvu v úložišti, což dovoluje snížit celkové
náklady a vylepšit měřené parametry, jako jsou rychlost
odezvy či množství obsluhovaných I/O operací.
• T imeFinder, což je replika lokálních dat, zvyšující
dostupnost aplikací a urychlující zotavení po případných
haváriích.
• PowerPath SE, tedy řízení multipathingu v úložišti
s funkcemi fail-over.
• Symmetrix Management Console a Performance Analyzer.
EMC magaz in
Cloud Computing
V cloudu jsou
Cloud umožňuje provozovat aplikace levněji než dosud, protože
díky němu odpadají jak lokální správa a údržba, tak nákup licencí. To však není to hlavní. Důležitější je, že přináší informatice
zcela nové možnosti.
miliardy
Bez cloudu by totiž nemohly existovat četné webové a mobilní
aplikace včetně vyhledávání na webu. Je k nim zapotřebí ohromný
výpočetní výkon, přičemž koncová stanice slouží jen pro odeslání
požadavku a zobrazení výsledků. Kouzlo věci spočívá v odsunu
všech výpočtů do cloudu.
Už máte řečí o cloud computingu až
nad hlavu? Nejste sami. Přesto však jde
o reálnou a důležitou problematiku,
nikoliv o marketingový módní trend.
Možnosti spolupráce
Dalším přínosem cloudů je spolupráce. Aplikace provozované
v cloudu přirozeným způsobem podporují spolupráci libovolného počtu uživatelů. Nejlepší ukázkou jsou sociální sítě. Složité
proprietární nástroje ustupují jednoduchým řešením, například
na bázi Google Docs.
S
tává se to stále častěji: média se zmocní pojmu dřív než
odborníci, vyždímají ho a překroutí. Ale nenechte se mýlit,
cloud je vážná záležitost, v níž jde a půjde o miliardy.
Definic je mnoho, každá trochu jiná, klidně se dá vystačit s tou
nejjednodušší: cloud je dodávka výpočetního výkonu přes internet. Obvykle – ale to už není součást definice – se jeho použití
platí podle skutečné spotřeby stejně jako u vody nebo plynu.
Základ cloudů
Infrastrukturním základem cloudu jsou výkonné datacentrum
a broadband, softwarovým pak virtualizace serverů a datových
úložišť, umožňující vysokou škálovatelnost – tedy pružnou odezvu na rychlé změny zátěže.
U individuálních uživatelů už cloud vyhrál. Chtějí-li používat
poslední novinky – chytré telefony, tablety, webové aplikace
– pak ani jinou možnost nemají. Postoj podniků je samozřejmě
opatrnější. Je třeba řešit bezpečnostní rizika, právní aspekty,
zálohování, mít připraveny únikové cesty.
Zajímavým kompromisem jsou tzv. privátní cloudy – služby
vnitropodnikového datacentra, poskytované formou webových
aplikací a škálovaného výkonu. Kombinují to lepší z obou světů,
pružnost, technologickou vyspělost a samoobslužnou správu
cloudu s jistotami uzavřeného systému.
EMC je vedoucím dodavatelem infrastruktury pro cloud. Jde
o datová úložiště, zejména ta, která jsou optimalizována pro nestrukturovaná data, řešení v oblasti bezpečnosti a další aspekty
významné z hlediska cloudu.
Vblock – „cloud-ready“ infrastruktura
Technologické součásti Vblock
Vblock je infrastrukturní řešení „v kostce“, které obsahuje síťovou
vrstvu, úložiště, výpočetní výkon (servery) a virtualizační vrstvu. To
vše se „single point of contact“ podporou – odpadá tedy zkoumání,
ve které části se vyskytl potenciální problém – a centrální správou
i monitoringem, který je navázaný na specifické management nástroje
jednotlivých vrstev řešení.
Management
EMC Ionix Unified Infrastructure
Manager – umožňuje přidělovat
a sledovat prostředky od úrovně
jednotlivých Vblocků po úroveň
jednotlivých serverů
Úložiště
Od 8TB EMC Celerra NS-120 určeného
pro Vblock 0 až po řádově petabajtové
konfigurace EMC Symmetrix VMAX.
Možnost využít tiering úložiště od EFD
disků po méně výkonné SATA disky
Síť
Switche Cisco Nexus 1000V a Cisco
MDS 9606 podporující technologii
Unified Fabric
Servery
Bladové řešení Cisco UCS; od 4xB200
(C200) s 48 GB RAM v každém bladu
až po 64xC250 šasi s 96 GB RAM
v každém bladu
Virtualizace
VMware vSphere
VBlock je výsledkem spolupráce společností VMware, Cisco Systems
a EMC. Ty zformovaly alianci VCE (Virtual Computing Environment),
která představuje dosud nejširší technologickou spolupráci mezi
dodavateli různých částí infrastruktury.
Tato spolupráce v reálu znamená sdílení výstupů z vývoje nových
produktů, přizpůsobování technologií pro bezproblémovou integraci
a v neposlední řadě také definované postupy při eskalaci řešených
problémů v rámci podpory.
Tento typ předpřipraveného řešení dává firmám možnost využít
výhody cloud computingu v rámci vlastní infrastruktury a postupný
přechod na vnitřní architekturu typu IaaS (Infrastructure as a Service
– způsob poskytování infrastruktury jako služby, bez vazby na kapitálové investice).
Pokud potřeby přerostou aktuální konfiguraci, Vblock může být škálován jak v rámci jednoho balíčku (přidávání jednotlivých komponent),
tak v rámci datového centra (přidávání celých Vblocků). EMC vytvořilo
celou metodiku stavby datových center s použitím těchto předpřipravených infrastrukturních celků a jejich koncentrace do zón, která
umožňuje dopředu odhadovat nároky na prostor, energii a chlazení.
4
|
EMC magaz in
Big Data
Nenechte svá data
napospas
Pojem Big Data je ještě módnější, a tedy protivnější
než cloud. Ale je také stejně reálný a závažný.
Nepotřebuješ
víc času.
Potřebuješ se
jen rozhodnout.
–Seth Godin, americký
internetový guru
B
ig Data je souhrnné označení pro zpracování mimořádně
velkých datových objemů novými prostředky, k nimž především patří jednak jiné než klasické relační databáze, jednak
infrastruktura, na které je lze provozovat.
Představte si Google a jeho databázi indexovaných webových
stránek – stále aktualizovaný obraz velké části internetu (těch
stránek je v současné době kolem osmi miliard). Je zřejmé, že
klasická databázová řešení tady nevyhovují. Google používá
speciální vlastní databázový systém zvaný BigTable.
Nebo si představte Facebook s jeho 700 miliony uživatelů, kteří
neustále přidávají data a komunikují mezi sebou. Základem jeho
softwarové infrastruktury je databázový systém Hadoop. Ten využívají i Amazon, Twitter a mnoho dalších webově orientovaných
systémů a sociálních sítí.
Jsou to velké objemy dat. A jsou to jiná data, než na jaká jsme
zvyklí z běžných podnikových aplikací. A jsou to data, která
budou spoluvytvářet budoucnost byznysu.
EMC disponuje infrastrukturními řešeními, která práci s těmito
daty podporují a doplňují. Kromě již popsané řady Isilon, vyvinuté s obzvláštním zřetelem k problematice Big Data, jde také
o nástroje pro analýzu dat a jejich přeměnu v užitečné informace, což je například u sociálních sítí zásadní a obtížný požadavek.
Firma EMC má v nabídce technologii Greenplum, jež je určena
pro analytickou práci s rozsáhlými nestrukturovanými daty.
Vytváří tak most mezi infrastrukturními a aplikačními řešeními.
Staré škatulkování přestává v novém světě platit.
Scale-out NAS
5
|
EMC magaz in
Archivace
Big Data BI = Greenplum Software pro analýzu velkých dat
Software Greenplum představený naší společností na jaře roku 2011
je založen na platformě Hadoop (masivně paralelní správa dat
od společnosti Apache) a přináší nové možnosti analýzy velkého
objemu dat během několika okamžiků.
G
reenplum HD totiž eliminuje režii a složitosti, kterou s sebou nesou těžkopádné nástroje a řešení dosud dostupné
na trhu. K dispozici je ve dvou základních variantách,
Community Edition a Enterprise Editions.
Prvně jmenovaná představuje plně certifikovaný bezplatný
softwarový stack, který je optimalizován pro provoz formou virtualizovaného stroje. Mimo jiné zajišťuje odolnost proti chybám
u součástí Name Node a Job Tracker, které u standardních implementací softwaru Hadoop naopak představují místa náchylná
k selhání.
Greenplum HD Enterprise Edition je předurčen pro implementaci
v podnikových datových centrech a nabízí mimo jiné funkce, jako
jsou ochrana proti poruchám prostřednictvím automatizované
detekce a notifikace nefunkčních uzlů, administrace více lokalit,
podpora snapshotů či replikace na velkou vzdálenost. Poskytuje
také zjednodušený přístup k datům v databázích pomocí rozhraní
Network File System (NFS).
Díky všem těmto funkcím poskytuje dvoj- až pětinásobné zvýšení
výkonu oproti standardním balíčkovým verzím softwaru Apache
Hadoop.
Optimalizovaný analytický hardware
K dispozici však máme i vysoce výkonné appliance Greenplum HD
Data Computing Appliance (DCA) určené ke zpracování strukturovaných i nestrukturovaných datových sad pro účely obchodní
analýzy.
Zařízení vycházející ze serveru x86 kombinuje open source
platformu Apache Hadoop s databází EMC Greenplum a mimo
jiné podporuje externí tabulky softwaru Hadoop, díky čemuž
umožňuje přístup k datům v souborovém systému HDFS (Hadoop
Distributed File System), aniž je nutné data vyvolávat.
Karmasphere, Microstrategy, Pentaho, SAS, SnapLogic, Talend
či VMware.
Kromě toho nabízíme i integrovanou řadu specializovaných
služeb, podpory a školení, které uživatelům pomáhají urychlit
nasazování datových skladů a obchodních analýz, jako je třeba
Enterprise Business Analytics Assessment Service.
Více informací najdete na adrese www.greenplum.com.
Klíčové vlastnosti Greenplum HD
• P
řenositelnost aplikací. Greenplum HD nabízí rozhraní
plně vyhovující standardnímu Hadoopu, což eliminuje potřebu měnit aplikace už vyvinuté pro distribuci od Apache.
Jde například o framework MapReduce, datawarehousingový systém Hive či úložnou platformu HBase.
• P
odpora vysoké dostupnosti. Fault-Tolerant Name Node
a Task Tracker chrání uživatele od rizika selhání jednoho
místa (single point of silure), které je s klasickou podobou
Apache Hadoopu spojeno.
• I ntegrace s Greenplum Database: Greenplum Database
podporuje externí tabulky Hadoopu, což uživatelům
umožňuje přímo přistupovat k datům uloženým v systému
HDFS.
• E nterprise Business Intelligence a Analytic Modeling
Tool Support: EMC spolupracuje na klíčových
komponentách pro úspěšnou analytiku
Big Data s řadou významných partnerů.
Správci tak mohou paralelně číst a zapisovat soubory z databáze
Greenplum do systému HDFS, což dovoluje rychlé a jednoduché
sdílení dat.
Využitím vysokého výkonu systému Greenplum SQL a pokročilých analytických funkcí při přístupu k datům v systému HDFS lze
provádět analýzu na více platformách. Toto kombinované řešení
tak představuje jedinou ucelenou platformu pro analýzu velkých
objemů dat v oboru.
Doprovodné služby
Spolu s řešeními Greenplum HD jsme vytvořili i výkonný ekosystém, na kterém se podílí řada společností nabízejících řešení
business intelligence, ETL, analytické toolkity a podobně – patří
mezi ně Concurrent, CSC, Datameer, Informatica, Jaspersoft,
6
|
EMC magaz in
Případová studie
EMC zjednodušuje infrastrukturu
České pojišťovny
IT oddělení České pojišťovny zatěžovaly vysoké
provozní náklady diskových polí a jejich nízká
interní znalost, což znamenalo jednu z hlavních
překážek dalšího rozvoje služeb.
Z
toho důvodu proběhla centralizace diskových polí na platformu EMC Symmetrix s cílem výrazně zjednodušit celou
infrastrukturu.
Přínosy technologie EMC
„Všech tří klíčových požadavků – snížení vysokých provozních
nákladů diskových polí, flexibilita a škálovatelnost řešení –
a rovněž přesunu znalostí a kompetencí do našeho týmu jsme
dosáhli i přes dvě „kalamity“ v termínu a ve stanoveném rozpočtu,“ říká Zdeněk Kaplan, CIO České pojišťovny, a dodává:
„Celkové TCO jsme snížili přibližně o 60 %.“
Celý projekt trval pouhých šest měsíců. Díky správnému plánování výkonu diskových polí došlo navíc ke zrychlení klíčových
databázových aplikací zhruba o 40 %.
Centralizace datových úložišť v České pojišťovně:
o 60 % nižší náklady, o 40 % rychlejší
V důsledku historického vývoje provozovala Česká pojišťovna celkem sedm diskových polí pro různá prostředí, některá na úrovni
mid-range, některá na úrovni enterprise. Kapacity i znalosti
interního týmu byly plně využity k zajištění základního provozu
a na návrhy i realizaci změn a dalšího rozvoje bylo nutné využívat
služeb externího dodavatele. Na jeho drahém know-how byla
Česká pojišťovna závislá i v běžných záležitostech.
Tento stav nebyl nadále udržitelný. Česká pojišťovna proto zahájila projekt, jehož hlavními cíli byly výrazné snížení provozních nákladů, konsolidace a přesun kompetencí do týmu České
pojišťovny, tak aby nadále vlastními silami dokázal zajistit provoz
i další rozvoj diskové infrastruktury.
Klíčem k řešení bylo výrazné zjednodušení prostředí. Projekt
centralizace diskových polí na platformu EMC Symmetrix přinesl
cca 60% úsporu provozních nákladů, kompletní přesun know-how do interního týmu pojišťovny, a vznikla přehledná vícevrstvá struktura datových úložišť umístěná ve dvou aktiv-aktiv datových centrech. Jako přídavek nastalo výrazné zrychlení klíčových
databázových aplikací.
Klíčem byla důkladná analýza
Celý projekt byl striktně omezen časem. Převod všech produkčních a většiny testovacích dat bylo nutné zvládnout během půl
roku, a to bez výpadku služeb, za plného provozu včetně plánovaného uvolňování nových verzí softwaru.
Už při zadání bylo přitom jasné, že během projektu budou probíhat i další změny v IT infrastruktuře, jako jsou přesun záložního
datového centra z Brna do Prahy, migrace a optimalizace databázových serverů na platformě Sun/Solaris, stěhování mainframu, a to vše se muselo podřídit implementaci prostředí Citrix, pro
které bylo rovněž nepřetržitě nutné zajišťovat datové služby.
7
|
• Ú
spory 4letého TCO o 60 %.
• Vytvoření servisního katalogu; definované datové třídy
s jasnými parametry: výkon, ochrana dat, cena.
• Radikální zrychlení klíčových aplikací nasazením EFD disků.
• Podpora pro projekt virtualizace.
• NAS rozhraní pro podporu farmy s prostředím Citrix.
• Přechod z asynchronní na synchronní replikaci.
• R ychlá a bezproblémová migrace celého prostředí
za necelých 6 měsíců.
• Průběžné doplňování nových užitečných funkcionalit.
• Vyspělé technologie dovolující souběžný provoz
produkčního i testovacího a vývojového prostředí
na jednom systému při udržení nízkých nákladů.
Datová úložiště v České pojišťovně
Před:
• S
edm diskových polí enterprise a midrange třídy
v lokalitách Praha a Brno bez jednotné správy, replikace
některých diskových polí pomocí SRDF/A.
• Nemožnost sdílet výkon a kapacitu jednotlivých
diskových polí a jejich značně rozdílné využití.
• Problémy s výkonem diskového systému u několika aplikací.
• Vysoká náročnost provozu a plánování diskových systémů.
• Kompetence ke správě i rozvoji u dodavatele mimo
kontrolu České pojišťovny.
• Provoz většiny systémů v režimu pozáruční podpory
s velmi vysokými OPEX náklady.
• A synchronní replikace dat.
Po:
• D
vě centralizovaná disková pole EMC s definovanými
datovými třídami, popsanými ve formě servisního
katalogu pro interního zákazníka.
• Jednotný management a monitoring, sdílení kapacitních
a výkonnostních zdrojů, snížení provozních nákladů o 60 %.
• Jednotné přidělování diskové kapacity v rámci celé firmy.
• Čtyřletá podpora HW i SW ze strany dodavatele – nulové
provozní náklady.
• Kompetence ke správě i rozvoji systémů uvnitř týmu, pod
kontrolou České pojišťovny.
• Silná disková infrastruktura schopná reagovat na aktuální
i budoucí potřeby zákazníka ve formě plánovaných projektů.
• Synchronní replikace dat.
• Zvýšení výkonu o 40 %.
EMC magaz in
Případová studie
Interní tým na základě monitoringu provozu průběžně optimalizuje rozmístění aplikací na jednotlivé vrstvy tak, aby optimalizoval
celkový výkon. Přeřazování dat mezi jednotlivými vrstvami probíhá díky funkci Virtual LUN zcela bez výpadku a dopadu na provoz.
Řešení ve zkratce
• K
onsolidované úložiště EMC Symmetrix VMAX
s EFD disky
• NAS EMC Centera NS8G – gateway
• EMC Symmetrix SW pro vzdálené a lokální zrcadlení
• EMC Symmetrix SW pro optimalizující provoz
v datových třídách
• EMC Symmetrix Virtual Provisioning
V předchozím modelu bylo nutné plánovat kapacitu s rezervou
pro každé diskové pole zvlášť, nyní je možné pracovat s jedním
rezervním prostorem v rámci nealokovaného datového prostoru
pro celou firmu. Díky nasazení virtual provisioningu je dokonce
možné sdílet a dále využívat nevyužitý diskový prostor, který je
již ale alokován serverům.
Výsledkem je radikální snížení složitosti a pracnosti denního rutinního provozu. Navíc se vzhledem k tomu, že veškeré provozní
operace je možné provádět za chodu všech aplikací, z hlediska
interních zákazníků v rámci firmy zvýšily spolehlivost IT a kvalita
poskytovaných služeb.
Na počátku projektu jsme měli tři klíčové
požadavky. Snížení vysokých provozních
nákladů diskových polí, flexibilitu
a škálovatelnost řešení pro naše služby
a přesun znalostí a kompetencí do našeho týmu tak,
abychom byli schopni disková pole provozovat a dále
rozvíjet vlastními silami. Všech tří cílů jsme dosáhli. V tuto
chvíli i díky centralizaci datových úložišť disponujeme
spolehlivou platformou pro podporu obchodních projektů
celé pojišťovny.
– Zdeněk Kaplan, CIO, Česká pojišťovna
Podpora dalšímu rozvoji
Sdílení diskové kapacity je nezbytnou podmínkou pro řadu dalších rozvojových projektů České pojišťovny.
Na začátku práce proto proběhla zhruba šestitýdenní důkladná
analýza, jež zahrnovala zejména detailní zpracování migračních
postupů jednotlivých aplikačních celků a vytvoření migračního
plánu.
Jejím výsledkem byl návrh tříúrovňové struktury, která v diskových polích EMC Symmetrix VMAX poskytuje na jedné straně
velmi rychlé kapacity s EFD disky pro klíčové části produkčních
databází, na straně druhé mohou aplikace využívat i levnou SATA
vrstvu pro velké objemy dat.
Po ukončení konsolidace datových úložišť proběhla – už vlastními silami pojišťovny – optimalizace testovacího prostředí s cílem
snížit počet kopií testovacích systémů. Česká pojišťovna mohla
díky přesunu znalostí dovnitř svého týmu sama změnit organizaci
testovacího prostředí a začala využívat snapshoty.
Univerzální úložiště
Česká pojišťovna nyní disponuje dvěma plnohodnotnými datacentry, která umožňují výběrově poskytovat služby a aplikace
v módech high availability i disaster recovery. Jedno centrum
slouží jako provozní, druhé pro testování a vývoj. V případě potřeby je však možné záložní datacentrum okamžitě nastavit jako
provozní.
Na úrovni diskových polí jsou datová centra synchronně replikována. Navíc se zásluhou vhodného rozložení aplikací do datových
vrstev, zejména přispěním EFD disků, zvýšil výkon databázových
aplikací o zhruba 40 %.
Disková pole EMC Symmetrix VMAX nabízejí úložnou kapacitu pro
centrální souborový systém prostřednictvím zařízení EMC Celerra. To nahradilo několik souborových serverů z centrály i poboček
a slouží nejen jako uživatelské souborové systémy pro desktopy
a terminálové aplikace publikované přes Citrix, ale i pro unixové
systémy a mainframe.
Přímým důsledkem konsolidace diskových kapacit v polích EMC
Symmetrix je rovněž lepší využití celkové diskové kapacity.
Interní i holdingoví zákazníci mají k dispozici servisní katalog
s definovanými datovými třídami s jasnými parametry: výkon,
ochrana dat, cena.
8
|
Zjednodušení infrastruktury nasazením diskových polí EMC Symmetrix VMAX přináší nejen okamžité úspory, ale i možnosti nasazení nově přicházejících funkcí. Provozní úspory, kterých projekt
již nyní dosahuje, nejsou finální.
Nasazení výkonných diskových polí EMC umožňuje konsolidovat
velké množství dat i z lokálních disků, kde se objem informací
pohybuje v desítkách terabajtů. Díky nasazení virtual provisioningu je možné pracovat s logickou kapacitou o cca 30 % vyšší,
než je fyzická kapacita úložiště. V plánu je nasazení technologie
FAST VP (Fully Automated Storage Tiering) pro automatizované
rozkládání dat mezi datovými vrstvami.
Vzhledem k výrazným změnám celé IT
infrastruktury v České pojišťovně jsme
od nasazení nového řešení očekávali značné
zjednodušení provozu, snížení provozní
náročnosti, zrychlení zavádění nových služeb a podporu
dalším aktuálním projektům, jako jsou konsolidace
infrastruktury, virtualizace a nasazení řešení Citrix. Naše
očekávání byla překonána – projekt proběhl za příjemně
krátké období, výrazně se snížila nutnost provozních
odstávek systémů, došlo ke zvýšení kvality služeb
a nečekaným překvapením bylo výsledné výrazné zrychlení
klíčových databázových aplikací.
– Lukáš Klášterský, COO, Česká pojišťovna
Česká pojišťovna
Česká pojišťovna je univerzální pojišťovnou s dlouholetou
a bohatou tradicí v životním i neživotním pojištění. Od znovuzavedení konkurenčního prostředí v r. 1991 je největší
pojišťovnou na českém pojistném trhu. Česká pojišťovna
poskytuje jak individuální životní a neživotní pojištění, tak
i pojištění pro malé, střední a velké klienty v oblasti průmyslových a podnikatelských rizik. Přibližně 4 100 zaměstnanců
a 5 100 obchodních zástupců se na více než 300 obchodních
míst stará o co největší spokojenost klientů. V systémech
České pojišťovny se nachází přibližně 200 milionů dokumentů. Pro Českou pojišťovnu, stejně jako pro každou finanční
instituci, je hladce a efektivně fungující IT základní podmínkou pro zvyšování efektivity a další růst celé firmy.
EMC magaz in
EMC Day 2011
http://czech.emc.com/emcday
Znáte EMC? Možná ne tak dobře, jak si myslíte!
DEN S EMC je jedinečnou příležitostí, jak blíže poznat
nejen naše technologie, ale i nás jako takové. Akci
koncipujeme jako technickou, s minimem prezentací,
zato s maximálním počtem živých ukázek a příkladů
reálných implementací našich zákazníků
v reálném prostředí. Zároveň se budete moci blíže
seznámit s novinkami v našem portfoliu, zejména
v oblastech:
• Ukládání dat a jejich inteligentního a efektivního
zálohování s pomocí deduplikace
• K
onsolidačních projektů v oblasti úložišť
• Infrastruktury pro cloud computing
• Z
abezpečení informací a dat v podnikové sféře
• B
ig Data – problematiky zpracování a analýzy
velkých objemů dat
Datum: 22. září 2011
Čas: 9:00–17:00
Agenda, registrace: http://czech.emc.com/emcday
Místo konání: Hotel Diplomat, Evropská 15, Praha 6-Dejvice
CLOUD MEETS
BIG DATA
EMC DAY 2011
Praha, 22. září
EMC2, EMC, and the EMC logo are registered trademarks or trademarks of EMC Corporation
in the United States and other countries. © Copyright 2011 EMC Corporation. All rights reserved. 2442

Podobné dokumenty

Efektivní IT - Pavel Barták - Avnet Technology Solutions

Efektivní IT - Pavel Barták - Avnet Technology Solutions  NFS file share Celerra NS 960 – 100 FC drives + 2TB FAST Cache – Stejný výkon jako systém s 300 FC disky – 46% nižší náklady na I/O

Více

VMware_ESX Server

VMware_ESX Server bootu ze SAN. Zjednodušuje se tím rovněž zálohování a obnova po selhání, neboť není nutno provádět samostatné zálohování lokálně připojených disků serveru. • Virtualizace sítě. Virtuální stroje se ...

Více

Tundra - Standardní bitva - Klan ČS-TB

Tundra - Standardní bitva - Klan ČS-TB větev. Na oplátku FTR dostává informace stejně brzo jako wot-news.com a Edrard z wot-news dostává oficální informace ještě dříve, než např. community contributoři, takže jde opět o poměrně výhodný ...

Více

Produktový list

Produktový list samotné systémové správy, její stále vyšší úroveň zákazníci požadují proto, aby mohli virtualizovat celá datová centra a dosáhnout tak vyšší efektivity. Pracovníci výzkumu a vývoje společnosti Leno...

Více

Randál 2001/4 - Royal Riders motoklub Kutná Hora

Randál 2001/4 - Royal Riders motoklub Kutná Hora jsme to napálili na Zbraslavice, dál pak Na Valech bylo okolo 40 mašin! na Uhlíøky, na Sázavu a zapýchnuli jsme “Sezóna je tady!” To si vìtšina z nás myslela už nìkdy to v hospodì Na Marijánce u St...

Více

Svět HP serverů pro kritické aplikace

Svět HP serverů pro kritické aplikace Projekt Odyssey nikdy nebyl o portaci HP-UX na platformu x86! Projekt Odyssey je o vývoji platformy x86, tak aby splňovala požadavky aplikací, které vyžadují Mission Critical platformu běžící na Li...

Více

Acronis True Image 2016

Acronis True Image 2016 Nastavení ověřování ..................................................................................................................................... 32

Více

stáhnout - EMC Czech Republic

stáhnout - EMC Czech Republic PROČ SE ROZHODNOUT PRO ATOS? Atos je úspěšný světový poskytovatel IT služeb s ročními tržbami (2014) ve výši 11 miliard eur a 93 000 zaměstnanci v 72 zemích

Více