BI aplikace-výrobní linka IBM

Transkript

BI aplikace-výrobní linka IBM
Výrobní linka IBM pro aplikace BI
Výrobní linka
IBM aplikací
Business Intelligence
Základní popis produktů a jejich využití
2010
MF Servis s.r.o.
Hradec Králové
duben 2010
Strana 1
Výrobní linka IBM pro aplikace BI
Obsah :
1. CO JE BUSINESS INTELLIGENCE ? ................................... 4
1.1
ÚVOD .............................................................................................................................................. 4
ZÁKLADNÍ POJMY BI ........................................................................................................................ 5
1.2
1.2.1 Provozní data ............................................................................................................................... 5
1.2.2 OLTP ........................................................................................................................................... 5
1.2.3 Data Warehouse (DW - datový sklad)........................................................................................... 5
1.2.4 Data Mart (datové tržiště)............................................................................................................. 5
1.2.5 Externí zdroje dat ......................................................................................................................... 5
1.2.6 ETL (Extraction, Transformation, Loading).................................................................................. 5
1.2.7 OLAP ........................................................................................................................................... 5
1.2.8 Metadata ...................................................................................................................................... 6
1.2.9 Drill-down .................................................................................................................................... 6
1.2.10 Roll-up ....................................................................................................................................... 7
1.2.11 Slice & Dice ............................................................................................................................... 7
1.2.12 Data mining (dolování dat) ........................................................................................................ 7
2. VÝROBNÍ LINKA IBM PRO APLIKACE BI ......................... 8
2.1
2.2
2.3
2.4
2.5
IBM DB2 ......................................................................................................................................... 8
IBM INFOSPHERE WAREHOUSE (IW) ................................................................................................ 8
IBM INFOSPHERE BALANCED WAREHOUSE (IBW) ............................................................................ 9
IBM INFOSPHERE INFORMATION SERVER (IIS) ................................................................................. 9
IBM COGNOS BUSINESS INTELLIGENCE (CBI) .................................................................................. 9
3. IBM INFOSPHERE WAREHOUSE ....................................... 10
3.1
INFOSPHERE WAREHOUSE – PŘEHLED PRODUKTŮ .............................................................................10
3.1.1 InfoSphere Warehouse Starter Edition (IWSE) ............................................................................10
3.1.2 InfoSphere Warehouse Intermediate Edition (IWIE) ....................................................................10
3.1.3 InfoSphere Warehouse Advanced Edition (IWAE) .......................................................................10
3.1.4 InfoSphere Warehouse Base Edition (IWBE) ...............................................................................11
3.1.5 InfoSphere Warehouse Enterprise Edition (IWEE) ......................................................................11
3.1.6 InfoSphere Warehouse Developer Edition (IWDE) ......................................................................12
3.1.7 IBM Base Warehouse Feature for DB2 .......................................................................................12
3.1.8 IBM Enterprise Warehouse Feature for DB2...............................................................................12
INFOSPHERE WAREHOUSE - ARCHITEKTURA .....................................................................................12
3.2
INFOSPHERE WAREHOUSE - PLATFORMY .........................................................................................13
3.3
INFOSPHERE WAREHOUSE – TECHNOLOGICKÉ KOMPONENTY ............................................................14
3.4
3.4.1 DB2 Enterprise Server Edition (ESE)..........................................................................................14
3.4.2 Design Studio .............................................................................................................................14
3.4.3 SQL Warehousing Tool ...............................................................................................................14
3.4.4 Administration Console ..............................................................................................................15
3.4.5 Cubing Services ..........................................................................................................................15
3.4.6 Query Patroller (QP) ..................................................................................................................16
3.4.7 Performance Expert (PE)............................................................................................................17
3.4.8 DB2 Storage Optimization Feature .............................................................................................17
3.4.9 Alphablox (AB) ...........................................................................................................................17
Data mining a vizualizace ......................................................................................................17
3.4.10
Analýza nestrukturovaného textu.............................................................................................18
3.4.11
DB2 Workload Management ...................................................................................................18
3.4.12
WebSphere Application Server................................................................................................19
3.4.13
Cognos 8 BI Starter Edition ....................................................................................................19
3.4.14
Přehled komponent jednotlivých InfoSphere Warehouse Editions ............................................20
3.4.15
4. IBM INFOSPHERE BALANCED WAREHOUSE ............... 21
4.1
INFOSPHERE WAREHOUSE – TECHNOLOGICKÉ KOMPONENTY ............................................................21
Strana 2
Výrobní linka IBM pro aplikace BI
4.1.1
4.1.2
4.1.3
4.1.4
4.1.5
InfoSphere Balanced Warehouse C1000......................................................................................21
InfoSphere Balanced Warehouse C3000......................................................................................21
InfoSphere Balanced Warehouse C4000......................................................................................22
InfoSphere Balanced Warehouse D5100 .....................................................................................22
InfoSphere Balanced Warehouse E7100 ......................................................................................23
5. IBM INFOSPHERE INFORMATION SERVER ................... 24
5.1
INFOSPHERE INFORMATION SERVER – INTEGRACE INFORMACÍ, DATOVÉ SKLADY ...............................24
5.1.1 InfoSphere Information Analyzer (IIA) ........................................................................................24
5.1.2 InfoSphere Business Glossary (IBG) ...........................................................................................25
5.1.3 InfoSphere QualityStage (IQS) ....................................................................................................25
5.1.4 InfoSphere DataStage (IDS).......................................................................................................25
5.1.5 InfoSphere Federation Server (WFS)..........................................................................................26
5.1.6 InfoSphere Replication Server (WRS) .........................................................................................26
5.1.7 Datové zdroje .............................................................................................................................27
5.1.8 Platformy ...................................................................................................................................27
RATIONAL DATA ARCHITECT (RDA) – DATOVÉ MODELOVÁNÍ .........................................................28
5.2
DALŠÍ INFORMACE ...........................................................................................................................28
5.3
6. IBM COGNOS BUSINESS INTELLIGENCE ...................... 29
6.1
6.2
6.3
6.4
6.5
COGNOS
COGNOS
COGNOS
COGNOS
COGNOS
8 REPORTING ....................................................................................................................29
8 ANALYSIS ......................................................................................................................30
8 SCORECARDING ..............................................................................................................31
8 DASHBOARDS.................................................................................................................31
8 DATOVÁ INTEGRACE PRO SAP R/3 ..................................................................................32
Strana 3
Výrobní linka IBM pro aplikace BI
1. CO
JE
BUSINESS INTELLIGENCE ?
1.1 Úvod
Termín Business Intelligence (BI) nepopisuje pouze samotný proces obchodování, ale zabývá se
způsoby jak zlepšit, usnadnit a zrychlit rozhodovací procesy. Ve vztazích lidí a firem v ekonomice,
logistice, výrobě, obchodu a dalších aktivitách vznikají každý den enormní objemy informací: data o
objednávkách, inventurách, účtování, platebních transakcích a samozřejmě o zákaznících. Mimo to
jsou také shromažďována nestrukturovaná data jako například dokumenty a audiovizuální objekty a
data z vnějších zdrojů. Bohužel však více jak 90% celkového objemu dat dnes není v automatizované
podpoře procesu rozhodování použito.
Metody konsolidace, organizace a analýzy dat pro dosažení vyšší kvality rozhodování mohou přinášet
kompetitivní výhody a učí uživatele, jak tyto výhody odkrývat a využívat je. To je smysl aplikací BI.
BI řešení IBM neznamená jen rozsáhlejší a lepší technologii – účelem je přinášet důmyslné informace
a postupy koncovým uživatelům. BI transformuje informace do znalostí; aplikace BI dávají správné
informace ve správný čas do rukou kompetentních uživatelů a podporují tak jejich rozhodování.
Aplikace typu Business Intelligence jsou důležitým článkem IT infrastruktury organizace tím, že
vytvářejí podmínky pro realizaci zpětných vazeb jejich procesů řízení.
IT infrastruktura organizace
Typickými BI aplikacemi jsou:
• analýza obchodních aktivit a trhu
• analýza profitability podnikání
• analýza dodavatelsko-odběratelských vztahů
Strana 4
Výrobní linka IBM pro aplikace BI
• možnosti plánování a tvorby rozpočtů
Oddělení využívající systém BI mezi prvními je marketing a obchod, kde BI systém může pomoci
efektivně odpovídat podobné typy dotazů:
• Kteří zákazníci přinášejí největší zisky a jak je možné prohloubit s nimi obchodní vztahy ?
• Pro které produkty a služby lze rozšířit prodej stávajícím zákazníkům a kterým ?
•
•
Které prodejní kanály jsou nejefektivnější a pro které produkty ?
Která kampaň měla nejlepší finanční výsledek ?
1.2 Základní pojmy BI
1.2.1 Provozní data
Provozní data jsou detailní data o ekonomických, logistických, výrobních nebo obchodních
činnostech. Data vznikají převážně provozem podnikových informačních systémů typu OLTP
(On-Line Transaction Processing).
1.2.2 OLTP
OLTP je způsob zpracování dat uživatelem nebo počítačovým systémem. Zpracování je zaměřeno na
opakovanou aktualizaci detailních dat s velkým objemem změn.
1.2.3 Data Warehouse (DW - datový sklad)
Datový sklad je databáze, kde jsou shromažďována, organizována a vytvářena data pro účely analýzy.
1.2.4 Data Mart (datové tržiště)
Datové tržiště obsahuje podmnožinu struktury a obsahu datového skladu organizace vyčleněnou podle
konkrétního úseku, oddělení nebo skupiny uživatelů.
1.2.5 Externí zdroje dat
Externí data jsou data mimo OLTP systémy potřebná pro tvorbu datového skladu.
1.2.6 ETL (Extraction, Transformation, Loading)
ETL procesy jsou datové pumpy pro přenos zdrojových dat (provozních dat z OLTP systémů nebo
z dat externích) do datového skladu. Datové pumpy provádějí načtení zdrojových dat, jejich
transformaci a nahrání do databáze datového skladu. Výkon ETL nástrojů podstatně ovlivňuje výkon a
tím užitnou hodnotu datového skladu. Plnění skladu probíhá dávkově. Data z provozních databází a
jiných datových úložišť jsou načítána periodicky, např. každý den po pracovní době. Jejich načítání
probíhá selektivně, dochází ke čtení pouze těch dat, která mají pro uložení v datovém skladu a
následnou analýzu smysl. Získaná data se transformují do podoby, v jaké jsou následně uložena v
datovém skladu. V průběhu transformace probíhá vyčištění dat od chybných, nekompletních, či
irelevantních záznamů a hodnot.
1.2.7 OLAP
On-Line Analytical Processing (OLAP) je SW technologie umožňující analytikům, manažerům i
výkonným pracovníkům získat informace o datech rychle a interaktivně z různých pohledů. Tato data
uložená v datovém skladu byla vytvořena transformací provozních dat.
OLAP funkcionalita je charakterizována jako dynamická multidimenzionální (MD) analýza
konsolidovaných dat. MD struktura je organizována tak, že každá datová položka typu „fakt“
Strana 5
Výrobní linka IBM pro aplikace BI
(například množství nebo cena produktu) je lokalizována a zpřístupněna jako průnik položek typu
„dimenze“ (například dimenze času, regionu, typu produktu). Nejčastější organizací je struktura
hvězdy. OLAP server a struktury dat jsou optimalizovány pro rychlé vyhledávání „ad hoc“ informací i
pro výpočty a transformace dat podle libovolné dimenze. OLAP server využívá data uložená v
proprietární MD struktuře (MOLAP), v relační databázi (ROLAP) nebo s využitím kombinace obou
způsobů (HOLAP).
Struktura hvězdy
1.2.8 Metadata
Metadata jsou druh informací, které popisují data uložená v databázi a obsahují tyto charakteristiky:
• popis tabulek a polí v datovém skladu včetně datových typů a rozsahu přípustných hodnot
• popis tabulek a polí ve zdrojových databázích s mapováním polí ze zdroje do datového skladu
• popis způsobu transformace dat včetně formátování, konverze měny, struktury času apod.
• jakékoli jiné informace potřebné pro podporu a provoz datového skladu
1.2.9 Drill-down
Drill-down je schopnost postupovat do hloubky a detailu datové struktury podle popisu její hierarchie.
Strana 6
Výrobní linka IBM pro aplikace BI
1.2.10 Roll-up
Roll-up je schopnost postupovat do více agregované úrovně datové struktury podle popisu její
hierarchie. Jdo o opačný postup než drill-down.
1.2.11 Slice & Dice
Slice & Dice je schopnost otáčení datovou strukturou a volba zobrazovaného řezu napříč daty
1.2.12 Data mining (dolování dat)
Dolování dat je proces výběru platných, využitelných, dříve neznámých a komplexních informací
z datového skladu a jejich použití pro rozhodování. Tyto procesy kategorie „knowledge management“
pomáhají využívat informace skryté v datech, jejich nepředvídané souvislosti, vzory a trendy, které
mohou vést ke konkurenčním výhodám uživatele.
Strana 7
Výrobní linka IBM pro aplikace BI
2. VÝROBNÍ LINKA IBM PRO APLIKACE BI
Technologie a produkty IBM pro tvorbu, provoz a údržbu aplikací Business Intelligence pokrývají
všechny fáze životního cyklu těchto aplikací. Tento soubor produktů můžeme nazvat výrobní linkou
pro aplikace BI.
2.1 IBM DB2
IBM DB2 je víceuživatelský databázový systém pro malé i rozsáhlé konfigurace od uniprocesorů
k největším koncentracím SMP na platformách Windows, Linux, AIX, HP-UX a Solaris.
DB2 je hybridní datový server pro zpracování relačních dat a dat ve formátu XML.
DB2 je základním nástrojem DW, je nositelem obsahu a struktury datového skladu, zajišťuje
optimalizaci jeho provozu v souvislosti s rostoucím objemem dat, náročností ad-hoc i
předzpracovaných dotazů a rostoucím počtem současně přistupujících uživatelů.
Pro velké datové sklady je určena technologie DB2 Database Partitioning Feature umožňující
„SMP clustering“ a vytváření paralelních databázových architektur typu „shared-nothing“.
DB2 je pro tvorbu a provoz BI aplikace vybavena důležitými vlastnostmi například:
• operátory standardních příkazů SQL jako CUBE, ROLLUP, GROUPING SET
• star-join algoritmus s dynamickými bitmapovými indexy
• MultiDimenzionální Clustering (MDC)
• Materialized Query Tables (MQT)
Další informace : http://www.mfservis.cz/index.php?sid=&kat=2&pol=pr_ibm&p1=4&p2=43
2.2 IBM InfoSphere Warehouse (IW)
IBM InfoSphere Warehouse Edition (IW) je sada produktů a technologií, která je určena pro
komplexní řešení tvorby, údržby a provozu datových skladů, podporu OLAP technologií a dolování
dat nad databází DB2.
Strana 8
Výrobní linka IBM pro aplikace BI
2.3 IBM InfoSphere Balanced Warehouse (IBW)
IBM InfoSphere Balanced Warehouse (IBW) je kompletní řešení datových skladů obsahující o předem
otestované, škálovatelné a plně integrované systémové komponenty software a hardware : InfoSphere
Warehouse, IBM server, respektive IBM diskové pole
2.4 IBM InfoSphere Information Server (IIS)
IBM InfoSphere Information Server (IIS) je základní platformou IBM pro integraci dat; jde o sadu
produktů a technologií, která provádí analýzu, čištění a integraci informací z heterogenních zdrojů.
IIS je robustní a škálovatelná technologie vhodná pro tvorbu a provoz rozsáhlých datových skladů.
V kombinaci s IW poskytuje IIS produktivní a robustní prostředí pro tvorbu náročných aplikací typu
Business Intelligence (BI), které podporují rozhodovací procesy v organizacích.
2.5 IBM Cognos Business Intelligence (CBI)
Cognos Business Intelligence (CBI) je produkt patřící do kategorie BI, který obsahuje nástroje na
zpracování různých typů analytických požadavků uživatelů: tvorbu reportů a analýz, výstupů typu
scorecarding a dashboards.
Cognos Business Intelligence je technologie využívající data datových skladů, která jsou zde
připravena ve formě vhodné pro projektování analytických aplikací uživatelů.
Propojení produktů IIS respektive IW pro tvorbu a provoz datových skladů s analytickými
schopnostmi produktu CBI je ideální výrobní linkou společnosti IBM pro vývoj a provoz
aplikací BI - aplikací pro podporu rozhodovacích činností organizací.
Strana 9
Výrobní linka IBM pro aplikace BI
3. IBM INFOSPHERE WAREHOUSE
3.1 InfoSphere Warehouse – přehled produktů
Produkt InfoSphere Warehouse (IW) je distribuován v těchto edicích:
3.1.1
InfoSphere Warehouse Starter Edition (IWSE)
IWSE je technologie datového skladu určená pro malé a střední aplikace na Linuxu a Windows do 20
- 50 uživatelů na server v prostředí jednoho výpočetního nodu.
IWSE obsahuje tyto komponenty:
• DB2 Enterprise Server Edition (ESE) pro Linux a Windows
• SQL Warehousing Tool
• Administration Console
• Design Studio
• Cubing Services
• DB2 Database Partitioning Feature (DPF)
• WebSphere Application Server
Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/starter.html
3.1.2
InfoSphere Warehouse Intermediate Edition (IWIE)
IWIE je technologie určená pro větší a střední aplikace datového skladu (SMB) na Linuxu a Windows
v rozsahu do 32 GB dat a výpočetním výkonu 400 Procesor Value Unit (PVU) v prostředí jednoho
nebo více výpočetních nodů.
IWIE obsahuje tyto komponenty:
• DB2 Enterprise Server Edition (ESE) pro Linux a Windows
• SQL Warehousing Tool
• Administration Console
• Design Studio
• Cubing Services
• DB2 Database Partitioning Feature (DPF)
• WebSphere Application Server
Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/intermediate.html
3.1.3
InfoSphere Warehouse Advanced Edition (IWAE)
IWAE je technologie určená pro větší aplikace datového skladu (SMB) pro průmyslové a střediskové
zákazníky na Linuxu v rozsahu do 2 TB dat a výpočetním výkonu 1000 PVU v prostředí jednoho nebo
více výpočetních nodů. Pro zákazníky s velikostí datového skladu více než 2 TB je doporučen produkt
InfoSphere Warehouse Enterprise Edition.
IWAE obsahuje tyto komponenty:
• DB2 Enterprise Server Edition (ESE) pro Linux
• SQL Warehousing Tool
• Administration Console
• Design Studio
• Cubing Services
• DB2 Database Partitioning Feature (DPF)
• DB2 Query Patroller
• Workload Management
Strana 10
Výrobní linka IBM pro aplikace BI
•
•
•
3.1.4
Performance Expert
DB2 Storage Optimization Feature
WebSphere Application Server
InfoSphere Warehouse Base Edition (IWBE)
IWBE je určena pro organizace, které právě začínají vytvářet aplikace datových skladů. Poskytuje
stejnou funkcionalitu jako produkt IWIE, ovšem bez jeho omezení.
Obsahuje databázi DB2 a integrovanou schopnost tvorby a zpracování datových struktur OLAP.
IWBE umožňuje optimalizaci výkonu OLAP aplikací partnerů IBM (Cognos. Business Objects,
MicroStrategy,…).
IWBE obsahuje tyto komponenty:
• DB2 Enterprise Server Edition (ESE) pro Linux
• SQL Warehousing Tool
• Administration Console
• Design Studio
• Cubing Services
• DB2 Database Partitioning Feature (DPF)
• WebSphere Application Server
• Cognos 8 BI Starter Edition
Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/base.html
3.1.5
InfoSphere Warehouse Enterprise Edition (IWEE)
IWEE poskytuje komplexní platformu pro aplikace BI zahrnující vše, co zákazníci potřebují k
rozmístění a partneři k vybudování náročných řešení rozsáhlých datových skladů a tržišť. Tato
výkonná platforma zahrnuje databázi DB2, technologii tvorby a údržby datového skladu, rozdělování
dat (data partitioning), správu integrovaných metadat pro aplikace OLAP, špičkové dolování dat (data
mining), nástroj pro tvorbu a provoz ETL procesů a správu pracovního zatížení. IWEE zajišťuje
optimalizaci výkonu analytického produktu DB2 Alphablox a OLAP aplikací partnerů IBM (Cognos.
Business Objects, MicroStrategy, …).
IWEE obsahuje tyto komponenty:
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
DB2 Enterprise Server Edition (ESE) pro Linux
SQL Warehousing Tool
Administration Console
Design Studio
Cubing Services
DB2 Database Partitioning Feature (DPF)
DB2 Query Patroller
Workload Management
Performance Expert
DB2 Storage Optimization Feature
DB2 Alphablox včetně Blox Builder
Intelligent Miner, Modeling, Scoring a Miningblox
Analýza nestrukturovaného textu
WebSphere Application Server
InfoSphere Federation Server Relational Wrappers
Cognos 8 BI Starter Edition
Strana 11
Výrobní linka IBM pro aplikace BI
Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/enterprise.html
3.1.6
InfoSphere Warehouse Developer Edition (IWDE)
IWDE má stejný obsah a funkčnost jako IWEE. Licencování produktu je vázáno pouze na vývoj,
předvádění a testování aplikačních programů datových skladů.
3.1.7
IBM Base Warehouse Feature for DB2
Produkt je základní nabídkou technologie tvorby datových skladů v DB2. Obsahuje nástroje pro
tvorbu robustních datových skladů od vývoje datového modelu k optimalizaci dat pro analýzy OLAP.
Součástí jsou všechny komponenty, které obsahuje InfoSphere Warehouse Base Edition s výjimkou
produktu DB2 Enterprise Server Edition :
• SQL Warehousing Tool
• Administration Console
• Design Studio
• Cubing Services
• Range partitioning
• Multidimensional clustering
• DB2 Database Partitioning Feature (DPF)
- DPF lze využít pro tvorbu a správu nesdílených datových oblastí (partitions) DB2, což
poskytuje prakticky neomezenou škálovatelnost databázového serveru DB2.
Další informace : http://www-01.ibm.com/common/ssi/cgibin/ssialias?infotype=AN&subtype=CA&htmlfid=897/ENUS207-297&appname=USN
3.1.8
IBM Enterprise Warehouse Feature for DB2
Produkt je řešením pro tvorbu a provoz průmyslových datových skladů, které vyžadují sofistikované
nástroje. Obsahuje produkt IBM Base Warehouse Feature for DB2 a dále důležité nástroje pro
optimalizaci, škálování výkonu datového skladu, analýzu nestrukturovaného textu a data mining.
Tento produkt je tedy obsahově shodný s InfoSphere Warehouse Enterprise Edition s tím, že
neobsahuje produkt DB2 Enterprise Server Edition.
Mimo nástroje produktu IBM Base Warehouse Feature for DB2 navíc verze Enterprise obsahuje :
•
•
•
•
•
Storage Optimization Feature
Performance Optimization Feature (POF).
o Query patroller.
o Workload management.
o Performance expert.
Alphablox.
Analýza nestrukturovaného textu
Intelligent Miner
Další informace : http://www-01.ibm.com/common/ssi/cgibin/ssialias?infotype=AN&subtype=CA&htmlfid=897/ENUS207-297&appname=USN
3.2 InfoSphere Warehouse - architektura
IWE má vícesložkovou architekturu, kde jednotlivé složky jsou rozděleny do tří logických skupin :
•
•
Data Warehouse Server
Application Server
Strana 12
Výrobní linka IBM pro aplikace BI
•
Client
Data warehouse server
zahrnuje produkty DB2 Enterprise Server Edition, DB2 Query Patroller, Cubing
Services a Data Mining (Intelligent Miner).
Application server
zahrnuje produkty WebSphere Application Server, InfoSphere Warehouse
Administration Console, SQL Warehousing Tool, Alphablox a Miningblox.
Administration Console vyžaduje buď DB2 server nebo klienta.
Client
zahrnuje produkty Design Studio, IBM Data Server Client, Query Patroller
center, Intelligent Miner Visualization a Miningblox.
Navíc je možno nainstalovat dokumentaci InfoSphere Warehouse včetně
InfoSphere Warehouse Tutorial s jakoukoli z těchto skupin podle operačního
systému.
Složky IWE poskytují integrovanou platformu pro tvorbu a administraci datových skladů a pro vývoj
navazujících analytických aplikací včetně webového rozhraní s vloženou funkcionalitou technologií
OLAP a data mining.
Struktura členění jednotlivých složek je zřejmá z následujícího obrázku.
3.3 InfoSphere Warehouse - platformy
Linux
• Red Hat Enterprise Linux (RHEL) v4, v5 - 64bit
•
SUSE Linux Enterprise Server (SLES) v9, v10 - 64bit
Strana 13
Výrobní linka IBM pro aplikace BI
Windows
• Windows Server 2003, Standard Server, Enterprise Server a Datacenter Edition 32/64 bit
AIX
• AIX v5.3, v6.1 - 64bit
Solaris
• Solaris v9, v10 for UltraSPARC servery - 64bit
Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/
3.4 InfoSphere Warehouse – technologické komponenty
3.4.1
DB2 Enterprise Server Edition (ESE)
DB2 Enterprise Server je škálovatelný, víceuživatelský, relační databázový systém, který může být
využit k tvorbě a správě datových skladů, aplikací OLAP, aplikací transakčního zpracování (OLTP) a
aplikací data mining.
DB2 ESE mimo jiné zajišťuje následující funkce :
•
podpora pro lokální a vzdálené klienty DB2
•
vzdálená administrace DB2 serverů
•
použitím DB2 Connect, samostatného produktu, lze zpřístupnit data uložená na DB2 pro
iSeries, z/OS
Další informace : http://www.mfservis.cz/index.php?sid=&kat=2&pol=pr_ibm&p1=4&p2=43#db2ese
3.4.2
Design Studio
Design Studio je prostředí pro tvorbu a údržbu datových modelů, kostek OLAP, modelů data mining,
návrh a řízení ETL SQL procesů a analytických aplikací Blox Builder. Prostředí je založeno na
vývojovém prostředí technologie Eclipse.
Design Studio využívá tyto nástroje a vlastnosti :
•
•
•
•
•
•
•
Integrované datové modelování založené na produktech IBM Data Server Developer
Workbench a Rational Data Architect (RDA)
Návrh toku dat a řízení toku dat při plnění datového skladu založené na jazyku SQL
Nástroje pro data mining, zkoumání a vizualizaci dat
Nástroje pro návrh OLAP metadat, Materialized Query Tables (MQTs) a modelů kostek
IBM Alphablox Blox Builder pro vývoj uživatelských analytických aplikací
Nástroje pro definici, validaci a monitorování Workload Management Systému (WMS), který
generuje objekty DB2 Workload Manageru z kódu SQL
Možnost integrace s ETL systémem InfoSphere Data Stage
V rámci Design Studia lze využít technologii produktu IBM Rational Data Architect k tvorbě,
modifikování a generování DDL pro fyzické datové modely.
Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/designstudio.html
3.4.3
SQL Warehousing Tool
SQL Warehousing Tool (SQW) je grafický nástroj pro generování ETL skriptů SQL pro tvorbu,
údržbu a administraci datového skladu, který nahrazuje manuální kódování SQL. SQW na základě
v Design Studiu navrženého vizuálního toku dat generuje automaticky SQL. SQW rovněž
spolupracuje s IBM produktem InfoSphere DataStage.
Vývojáři datových skladů používají SQW v rámci Design Studia pro tvorbu :
Strana 14
Výrobní linka IBM pro aplikace BI
Fyzických datových modelů pro zdrojové a cílové databáze a staging tabulky
Toků dat reprezentujících přesun dat z datových zdrojů prostřednictvím transformačních
kroků do cílové databáze :
o datové toky formované jazykem SQL pro tvorbu datových skladů
o toky dolovaných dat integrující klíčová data z operací dolování do datového modelu
založeného na SQL
o datové toky formované jazykem SQL, které zahrnují jako podřízené operace joby
DataStage ETL
Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/sql.html
•
•
3.4.4
Administration Console
Administration Console je webová WebSphere aplikace, která nabízí nástroj pro administraci BI
aplikací, které jsou vytvořeny v Design Studiu.
Pomocí Administration Console lze administrovat :
• Obecné funkce
tvorba a správa databází a systémových zdrojů, prohlížení logů, řízení chybových procesů
SQW
• SQL Warehousing
rozmístění, provoz a monitorování aplikací DW vytvořených v Design Studiu
• Cubing Services
import, export, zkoumání modelů kostek, spouštění OLAP Metadata Optimization Advisoru
• Mining
view, export, update a delete modelů v mining databázi; load, import, export modelů data
mining; grafické zobrazení výsledků mining modelů ve vizualizačním nástroji
• Alphablox
spouštění administrace Alphabloxu
Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/administration.html
3.4.5
Cubing Services
Cubing Services je využíván ke zrychlení dotazů do datového skladu z OLAP aplikací, jako např.
Alphablox nebo technologie BI třetích stran.
Cubing Services definuje a distribuuje OLAP metadata (kostky) - informace o struktuře dat v datovém
skladu uložených v tabulkách faktů a o hierarchii všech dimenzí - a vkládá je do katalogu DB2.
Metadata umožňují mapování multidimenzionálního modelu do relační struktury. Cubing Services na
základě popisu metadat generuje skripty pro tvorbu DB2 objektů MQT (Materialized Query Tables).
Agregace a součty v hierarchii dimenzí popsané v metadatech jsou v MQT předzpracovány.
Optimalizátor DB2 je schopen přepsat komplexní analytický dotaz SQL tak, aby využíval MQT místo
základních detailních tabulek. Příkladem může být dotaz na zjištění obratu obchodní firmy za první
čtvrtletí běžného roku. Příkaz SQL, který načítá obrat po denních stavech, je optimalizátorem přepsán
tak, že přímo zjistí stav obratu za 1.Q uložený v tabulce MQT, která byla vygenerována CV. Klientské
nástroje BI připojené k relační struktuře přes Cubing Services jsou takto schopny využít podstatně
větší rychlosti, jednoduchosti a škálovatelnosti přístupu k datům.
Cube server, součást Cubing Services, zpracovává multidimenzionální (MD) dotazy ve formě
dotazovacího jazyka MDX a produkuje MD výsledky. Cube server předkládá data z DB2
prostřednictvím dotazů SQL podle požadavků dotazů MDX.
K technologiím Business Intelligence, které podporují Cubing Services patří :
Ascential Software, Brio, Business Objects, Cognos, IBM OLAP Server, Kalido, Microstrategy a
Rocket Software.
IBM ve spolupráci s Meta Integration Technology, Inc. nabízí nový obousměrný most (bridge), který
umožňuje integraci Cubing Services s více než 40 existujícími mosty metadat pro :
Strana 15
Výrobní linka IBM pro aplikace BI
•
•
•
nástroje datového modelování, př. CA AllFusion ERwin Data Modeler
nástroje objektového modelování, př. IBM Rational Rose
nástroje ETL, př. Informatica PowerCenter
•
•
nástroje BI, př. BusinessObjects a Cognos
metadata repository a standardy, př. OMG CWM a UML XM
DB2 je OLAP akcelerátor pro různé výrobce MD technologií
Cubing Services je dodáván jako součást Infosphere Warehouse Editions
Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/olap.html
3.4.6
Query Patroller (QP)
QP využívá prognózy náročností dotazů vytvořené DB2 optimizerem ke správě zatížení datového
skladu.
QP je robustní nástroj, který dynamicky organizuje a řídí proud SQL dotazů proti databázi DB2. Je
určen k optimalizaci provozu a zvýšení prostupnosti především datových skladů a rozsáhlých databází.
QP provádí následující činnosti:
• definuje oddělené skupiny dotazů rozdílných velikostí za účelem optimálního sdílení zdrojů
• přiděluje priority dotazům různých uživatelů
• monitoruje a pozastavuje náročné dotazy, které lze následně zrušit nebo naplánovat ke spuštění
v čase nižšího zatížení zdrojů
• sleduje a ruší nekoordinované dotazy
QP umožňuje regulovat zatížení databáze tak, že malé SQL dotazy a dotazy s vysokou prioritou jsou
vykonávány okamžitě současně s efektivním využíváním zdrojů systému. Informace o provedených
dotazech mohou být shromažďovány a následně podrobeny analýze za účelem zjištění typů a četnosti
dotazů, identifikace náročných uživatelů a často používaných tabulek a indexů.
Strana 16
Výrobní linka IBM pro aplikace BI
Další informace : http://www-01.ibm.com/software/data/db2/querypatroller/features.html
3.4.7
Performance Expert (PE)
Nástroj pro analýzu a ladění výkonu v heterogenním prostředí datových serverů DB2 z jednoho místa.
Další informace : http://www-01.ibm.com/software/data/db2imstools/db2tools/db2pe/db2pe-mp.html
3.4.8
DB2 Storage Optimization Feature
Tento nástroj zahrnuje dva typy komprese, Data Row Compression a Backup Compression, které šetří
místo na pamětových médiích.
Další informace : http://www-306.ibm.com/software/data/db2/9/editions_features_storage.html
3.4.9
Alphablox (AB)
Alphablox umožňuje rychlý vývoj a provoz webových analytických aplikací. Má otevřenou a
rozšiřitelnou architekturu založenou na J2EE. Aplikace AB jsou provozovány ve standardním web
browseru, takže lze provádět uživatelsky nastavitelné multidimenzionální aplikace v reálném čase. K
základním funkcím patří možnosti interaktivní tvorby komplexních formátovaných webových reportů
s možností drill-down, zpracování relačních i nerelačních dat s možností aktualizace zdrojových dat.
AB je integrován s nástrojem Cubing Services, který umožňuje optimalizaci metadat a databáze pro
multidimenzionální analýzy prováděné v AB.
Typickými aplikacemi Alphabloxu jsou :
• zpracování Key Performance Indicators (KPI)
• aplikace typu scorecard
• ekonomické prognózy
Alphablox Bloxbuilder je integrován do Design Studia a poskytuje snadné rozhraní pro tvorbu
analytických aplikací pro uživatele, kteří mají pouze zkušenosti s analytikou BI.
Další informace : http://www-01.ibm.com/software/data/db2/alphablox/
3.4.10 Data mining a vizualizace
Infosphere Warehouse (IW) používá algoritmy data mining pro analýzu dat v datovém skladu a nabízí
pohled do těchto dat. např.do chování zákazníků nebo vývoje obchodních parametrů. Příkladem může
být zjištění, že více než 18% zákazníků, kteří nakupují tvrdé sýry současně nakupuje směs ořechů.
Design Studio lze použít pro vizualizaci průběhu procesů data mining s využitím operátorů pro
modeling, scoring a vizualizaci. Design Studio zobrazuje datové i textové toky operací data miningu a
analýzy nestrukturovaného textu.
Můžete rovněž generovat SQL a vkládat jej do analytického nástroje Alphablox.
IW obsahuje tyto nástroje a funkce data mining:
•
•
•
•
•
•
•
funkce data mining v Design Studiu a Administration Consoli
analýza nestrukturovaného textu v Design Studiu
Intelligent Miner Easy Mining
Intelligent Miner Modeling
Intelligent Miner Scoring
Intelligent Miner Vizualization
Miningblox
Strana 17
Výrobní linka IBM pro aplikace BI
Intelligent Miner Modelling (IMM)
IMM podporuje vývoj modelů dolování dat ve formátu tabulek relační databáze. Současně umožňuje
export do formátu průmyslovému standardu pro analytické modely Predictive Model Markup
Language (PMML) nebo do XML. IMM obsahuje databázové objekty UFT, UDF a DB2 extendry ve
formě uložených procedur pro následující operace modelování:
•
•
•
Associations discovery
příklady využití: výskyt produktu v analýzách trhu; kombinace finančních nabídek
Demographic clustering
příklady využití: segmenty trhu; návrh skladů; vzory nákupního chování
Tree classification
příklady využití: profilace zákazníků; pravděpodobnost ztrát v čase
Intelligent Miner Scoring (IMS)
Ověřené modely data mining mohou být aplikovány na data pro zjištění předvídatelných výsledků.
Například při převzetí nové bankovní transakce do zpracování jsou na transakční data aplikována
pravidla pro zjištění podvodu. Tato pravidla mají za úkol předpovědět pravděpodobnost, že datová
věta je podvodná.
Proces aplikující pravidla tohoto typu se nazývá Scoring. Aplikace Scoringu v reálném čase umožňuje
zjistit podvodné souvislosti v datech rychleji, rozdělit nové zákazníky a nabídnout jím lepší a
spolehlivější servis.
IMS tedy zajišťuje provoz existujích modelů „data mining“ založených na historických datech nad
aktuálními novými daty jak dávkově, tak i v reálném čase. Funkce „scoring“ jsou standardní rozšíření
SQL a lze je proto použít nad DB2 i Oracle.
Intelligent Miner Vizualization (IMV)
IMV obsahuje javovské vizualizery pro zjišťování a grafickou prezentaci výsledků operací
modelování: "associations", "demographic clustering" a "tree classification". Vstupem jsou modely
odpovídající PMML v.2.0. Vizualizery mohou pracovat v transakčním režimu nebo jako applet ve web
browseru.
Další informace: http://www-01.ibm.com/software/data/infosphere/warehouse/mining.html
3.4.11 Analýza nestrukturovaného textu
Nestrukturovaná data představují až 80% všech dat v organizaci. InfoSphere Warehouse lze použít pro
extrahování strukturované informace z volně poskládaného textu. Přínos této technologie je značný –
umožnění detekce podvodu, analýza chyb produktů, lepší profilace zákazníka a včasné upozornění na
snižující se zájem zákazníka.
Analýza nestrukturovaného textu je integrována do Design Studia a umožňuje drag and drop
zpracování použitím dvou základních anotací – slovníku a na vzorech založených extraktorech.
Další informace:
http://www-01.ibm.com/software/data/infosphere/warehouse/unstructured-data-analysis.html
3.4.12 DB2 Workload Management
DB2 Workload Management umožňuje řídit, zavádět a monitorovat worload při provozu datového
skladu.
DB2 WM poskytuje:
•
řízení workloadu DW podle uživatelských priorit
Strana 18
Výrobní linka IBM pro aplikace BI
•
•
•
zabránění nekontrolovaného růstu DW
zabránění zběhlých dotazů
monitoring výkonu v reálném čase
3.4.13 WebSphere Application Server
Další informace : http://www-01.ibm.com/software/webservers/appserv/was/
3.4.14 Cognos 8 BI Starter Edition
Cognos 8 BI Starter Edition poskytuje základnu pro tvorbu a provoz dotazů ad-hoc a reportů a
obsahuje následující komponenty :
•
•
•
•
komponenty platformy Cognos 8 BI :
- Query Studio (ad-hoc dotazy)
- Reporting Studio ( tvorba a doručování reportů a dashboardů)
- Cognos Connection (navigace uživatelů)
- Framework Manager (přístup k datům, modelování a publikování informací
uživatelům)
DB2 Express-C V9.5 (pro repozitory Cognosu)
WebSphere Application Server Express Edition v.6.1.0.3
integrovaný instaler pro instalaci a konfiguraci komponent
Použití Cognos 8 BI Starter Edition má tato omezení :
•
•
•
•
max. 5 pojmenovaných uživatelů
instalace na jednom serveru s max. 2 CPU
pouze Windows platforma
pouze datové zdroje DB2
Cognos 8 BI Starter Edition je součástí pouze těchto produktů :
InfoSphere Warehouse Enterprise Edition
InfoSphere Warehouse Base Edition
InfoSphere Warehouse Base Edition with Optim Data Retention Edition
IBM Base Warehouse Feature for DB2
IBM Enterprise Warehouse Feature for DB2
Další informace : http://www.cognos.com/solutions/data/ibm/starter_edition.html
Strana 19
Výrobní linka IBM pro aplikace BI
3.4.15 Přehled komponent jednotlivých InfoSphere Warehouse Editions
IWSE
Starter
IWIE
Intermediate
IWAE
Advanced
Operační
systém
Linux
Windows
Linux
Windows
Linux
Limit
200 PVU
4GB mem
400 PVU
32GB mem
1000 PVU
2TB WH
není
není
pouze vývoj
DB2ESE
+
+
+
+
+
+
SQL
Warehousing
Tool
+
+
+
+
+
+
Admin.
Console
+
+
+
+
+
+
Design
Studio
+
+
+
+
+
+
Cubing
Services
+
+
+
+
+
+
DPF
+
+
+
+
+
+
Query
Patroller
+
volitelné
+
+
Workload
Management
+
volitelné
+
+
Performance
Expert
+
volitelné
+
+
Storage Opt.
Feature
+
volitelné
+
+
Intelligent
Miner
+
+
Unstructured
Text
Analysis
+
+
+
+
+
+
+
+
Produkt /
komponenta
Alphablox
WAS
IWBE
Base
+
+
InfoSphere
Federation
Server
Relational
Wrappers
+
Legenda : +
komponenta v daném produktu existuje
PVU Processor Value Unit
Další informace : https://www112.ibm.com/software/howtobuy/passportadvantage/valueunitcalculator/vucalc.wss
Strana 20
IWDE
Developer
Linux, Unix, Linux, Unix, Linux, Unix,
Windows
Windows
Windows
volitelné
+
IWEE
Enterprise
Výrobní linka IBM pro aplikace BI
4. IBM INFOSPHERE BALANCED WAREHOUSE
Produkt InfoSphere Balanced Warehouse (IBW) je kompletní řešení datových skladů obsahující tyto
předem otestované, škálovatelné a plně integrované systémové komponenty :
•
InfoSphere Warehouse
•
IBM server
•
IBM diskové pole
4.1 InfoSphere Warehouse – technologické komponenty
IBW je strukturován do tří skupin :
•
InfoSphere Balanced Warehouse C-Class
- umožňuje organizacím malé a střední velikosti jednoduché a kompletní řešení pro integraci a
údržbu heterogenních datových zdrojů do škálovatelného datového skladu
•
InfoSphere Balanced Warehouse D-Class
- nabízí podporu střediskových datových tržišť a menších datových skladů
•
InfoSphere Balanced Warehouse E-Class
- umožňuje tvorbu robustních, široce škálovatelných datových skladů mimořádně vysokého
výkonu
IBW je produktově distribuován v těchto edicích :
4.1.1
InfoSphere Balanced Warehouse C1000
C1000 poskytuje jednoduché, ihned použitelné řešení tvorby, údržby a doručování dynamických
reportů z datového skladu (do 350 GB uživatelských dat) vytvořeného z heterogenních datových
zdrojů. Produkt podporuje flexibilní databázovou konektivitu a umožňuje vytvářet intuitivní
formátované reporty. Tvorba reportů je urychlována pomocí wizardů a opakovaně použitelných vzorů.
Řešení je integrováno a předem otestováno na IBM hardware. Podpora SW není součástí produktu.
C1000 je dodáván ve dvou alternativních konfiguracích :
Originální konfigurace :
•
InfoSphere Warehouse Starter Edition software
•
IBM Systém x 3500
BladeCenter Configuration :
•
InfoSphere Warehouse Starter Edition software
•
IBM BladeCenter S Chassis
•
IBM HS21 Blade
Další informace : http://www-01.ibm.com/software/data/infosphere/balanced-warehouse/c1000.html
4.1.2
InfoSphere Balanced Warehouse C3000
C3000 poskytuje jednoduché a kompletní řešení datových skladů pro tvorbu aplikací BI s objemem
dat do 1,5 TB uživatelských dat. Produkt obsahuje pokročilé databázové vlastnosti – data partitioning
a range partitioning umožňující produktivně zpracovávat rozsáhlejší datové sklady. Řešení je
dodáváno na hardware IBM v integrované a předem testované konfiguraci, kterou je snadné
nainstalovat a udržovat. Podpora SW není součástí produktu.
C3000 je dodáván ve dvou alternativních konfiguracích :
Strana 21
Výrobní linka IBM pro aplikace BI
Originální konfigurace :
•
InfoSphere Warehouse Intermediate Edition software
•
IBM Systém x 3650
•
IBM Systém Storage DS3200
BladeCenter Configuration :
•
InfoSphere Warehouse Intermediate Edition software
•
IBM BladeCenter S Chassis
•
IBM HS21 Blade
•
optional IBM System Storage DS3200
Další informace : http://www-01.ibm.com/software/data/infosphere/balanced-warehouse/c3000.html
4.1.3
InfoSphere Balanced Warehouse C4000
C4000 poskytuje jednoduše navrhovatelné a spravovatelné řešení datových skladů pro tvorbu aplikací
BI s objemem dat do 5 TB uživatelských dat. Řešení nabízí prostor pro škálovatelný růst a vývoj
aplikací vyžadujících plnou funkčnost IBM Warehouse Base software a rozsáhlou infrastrukturu pro
provoz kritických aplikací typu Business Intelligence. Podpora SW není součástí produktu.
C4000 obsahuje :
•
InfoSphere Warehouse Base nebo Enterprise Edition software
•
IBM Systém x 3950
•
IBM Systém Storage DS3200
•
optional EXP3000 - rozšiřující expanzní jednotku diskového pole
Další informace : http://www-01.ibm.com/software/data/infosphere/balanced-warehouse/c4000.html
4.1.4
InfoSphere Balanced Warehouse D5100
D5100 je k dispozici pro středně velké a velké organizace spravující data od kapacity 1 TB výše.
Produkt nabízí škálovatelnost výkonu datových skladů v souladu s růstem organizace včetně
volitelného zajištění vysoké dostupnosti a je nákladově efektivní. Podpora SW je součástí produktu.
D5100 obsahuje :
•
InfoSphere Warehouse Base nebo Enterprise Edition software
•
IBM Systém x 3655
•
IBM Systém Storage DS3400
K významným výhodám D5100 patří :
•
automatický failover poskytující potřebnou dostupnost systému
•
inteligentní funkce “call home” umožňující proaktivní automatickou údržbu systému
•
průmyslové nástroje a funkce hardware typu “midrange”
Další informace : http://www-01.ibm.com/software/data/infosphere/balanced-warehouse/d5100.html
Strana 22
Výrobní linka IBM pro aplikace BI
4.1.5
InfoSphere Balanced Warehouse E7100
E7100 je produkt nabízející plné využití nové technologie IBM POWER6 při vývoji, implementaci a
provozu rozsáhlých datových skladů a analytických aplikací s požadavkem na maximální
škálovatelnost výkonu. Podpora SW je součástí produktu.
E7100 obsahuje :
•
InfoSphere Warehouse Enterprise Edition software
•
IBM Systém p570 (POWER6)
•
IBM Systém Storage DS4800
K významným výhodám E7100 patří :
•
technologie POWER6 zajišťující vysokou rychlost přístupu k informacím typu OLAP a Data
Mining s maximální úrovní podpory tisíců konkurentních uživatelů zpracovávajících
komplexní i ad-hoc dotazy
•
vlastnosti RAS (Reliability, Availability, and Serviceability) převzaté z technologií IBM
mainframe umožňující téměř kontinuální operace datových skladů
•
autonomní bezpečnostní funkce operačního systému AIX jsou povýšeny nativním systémem
bezpečnosti
•
škálovatelnost, která zajišťuje produktivní zpracování uživatelských požadavků
Další informace : http://www-01.ibm.com/software/data/infosphere/balanced-warehouse/e7100.html
Strana 23
Výrobní linka IBM pro aplikace BI
5. IBM INFOSPHERE INFORMATION SERVER
5.1 InfoSphere Information Server – integrace informací, datové sklady
IBM InfoSphere Information Server (IIS) je skupina produktů integrace dat, která organizacím
umožňuje získávat informace s přidanou hodnotou z heterogenních datových struktur napříč
informačními systémy.
V této kapitole jsou popsány základní produkty, které umožňují integraci dat a tvorbu datových skladů
a splňují maximální požadavky na komplexnost a kvalitu vstupních dat a škálovatelnost výkonu.
Další informace: http://www-01.ibm.com/software/data/integration/info_server/
5.1.1
InfoSphere Information Analyzer (IIA)
IIA automatizuje proces profilace a analýzy hodnot, kvality a struktur datových zdrojů.
IIA poskytuje tyto vlastnosti :
Profilace a analýza zdrojových dat - umožňuje snadné pochopení dat, nalezení jejich anomálií,
validace datových hodnot, validace vztahů sloupce/tabulka, mapování vztahů zdrojová/cílová data a
drill-down na úroveň řádků. Funkce profilace dat zahrnuje sloupce, primární a cizí klíče, relační
vztahy a základní analýzy.
Komplexní reporty - vizuální a nastavitelné reprezentace analýz/trendů/metrik včetně poznámek
uživatelů
Uživatelské anotace- vkládání popisných informací, které umožňují uživatelům přizpůsobit výstupy
svým pojmům, termínům a atributům tabulek a sloupců
Společná metadata - sdílení metadat ve všech modulech IBM InfoSphere Information Serveru;
například InfoSphere DataStage designer je schopen ihned vidět, které sloupce byly profilovány i
navazující informace, př., že sloupec „Adresa“ musí být vyčištěn před aplikací procesu ETL.
Security Framework - zajišťuje řízený a omezený přístup k citlivým analytickým informacím na
úrovni projektu, role a uživatele
Strana 24
Výrobní linka IBM pro aplikace BI
Škálovatelnost - vysoce výkonný paralelní provoz IIA proti velkým objemům dat snižující čas až o
70%
Další informace: http://www-01.ibm.com/software/data/infosphere/information-analyzer/
5.1.2
InfoSphere Business Glossary (IBG)
IBG umožňuje uživatelům správu vlastnictví informací o informacích (metadat) prostřednictvím
importu názvů datových prvků z externích zdrojů, jejich autorizaci a editování ve webovém rozhraní,
klasifikaci těchto názvů do kategorií a propojení názvů s dalšími technickými pojmy spravovanými ve
InfoSphere Metadata Serveru, který reprezentuje unifikovanou vrstvu metadat v IBM InfoSphere
Information Serveru
Další informace: http://www-01.ibm.com/software/data/infosphere/business-glossary/
5.1.3
InfoSphere QualityStage (IQS)
IQS automatizuje proces zkoumání, porovnávání, čištění a standardizování dat. Tyto automatizované
činnosti snižují čas a náklady na kontrolu a úpravu dat a současně zvyšují jejich spolehlivost a
důvěryhodnost. Produkt nabízí aplikaci pravidel pro standardizaci, čištění, porovnávání, která mohou
být provozována v reálném čase, dávkově nebo jako webové služby. IQS pracuje ve výkonném
paralelním režimu.
Další informace: http://www-01.ibm.com/software/data/infosphere/qualitystage/
5.1.4
InfoSphere DataStage (IDS)
InfoSphere DataStage zajišťuje rychlou integraci průmyslových informací z mnoha různorodých
datových struktur. Produkt podporuje kompaktní přístup také k aplikačním systémům CRM (Customer
Relationship Management), SCM (Supply Chain Management), a ERP (Enterprise Resource Planning.
IBM InfoSphere DataStage poskytuje následující funkce a vlastnosti:
•
•
•
•
ETL
(Extract, Transform, Load) - robustní technologie umožňující sběr, integraci a transformaci
velkých objemů dat s jednoduchou i vysoce komplexní strukturou. InfoSphere DataStage řídí
tok dat v reálném čase i dat zpracovávaných v periodickém nebo plánovaném intervalu.
Škálovatelnost
InfoSphere DataStage využitím paralelních schopností multiprocesorových platforem zajišťuje
škálovatelnost požadavků na zpracování neustále rostoucích objemů dat současně se stále se
zmenšujícími časovými intervaly, které jsou k dispozici pro dávkové zpracování.
Podpora velkého množství zdrojových a cílových datových struktur
Podporovány jsou heterogenní zdrojová a cílová data včetně textových souborů, komplexní
struktury v XML, ERP systémy jako SAP a PeopleSoft, téměř všechny databáze (včetně
partitioningu), webové služby a nástroje BI jako je SAS
Konektivita mezi libovolnými datovými zdroji a aplikacemi
Nabídka komplexní konektivity zajišťuje integraci většiny relevantních, úplných a přesných
dat. Konektivita může být použita i spolu se známými průmyslovými aplikacemi včetně SAP,
Siebel, Oracle a PeopleSoft
Následující produkty umožňuji konektivitu WDS k průmyslovým aplikacím :
•
•
•
•
•
•
InfoSphere DataStage Pack for SAP BW
InfoSphere DataStage Pack for SAP R/3
InfoSphere DataStage Pack for Siebel
InfoSphere DataStage Pack for PeopleSoft Enterprise
InfoSphere DataStage Pack for Oracle Applications
InfoSphere DataStage Pack for JD Edwards Enterprise One
Strana 25
Výrobní linka IBM pro aplikace BI
•
InfoSphere DataStage Pack for SAS
Další informace: http://www-01.ibm.com/software/data/infosphere/datastage/
5.1.5
InfoSphere Federation Server (WFS)
InfoSphere Federation Server umožňuje virtuální přístup k datovým zdrojům v reálném čase, jako by
se jednalo o jednu databázi bez ohledu na její umístění. Principiálně jde o spuštění jediného příkazu
SQL nad heterogenními datovými zdroji.
Federovaný server umožňuje :
•
tvorbu relačního pohledu napříč různými datovými organizacemi
•
využití existujících nástrojů pro tvorbu reportů a vývoj aplikací
•
využití optimalizátoru DB2
•
podpora XML
•
jednodušší pohledy na data
•
federovaný dvoufázový commit, umožňující aktualizaci více různých datových zdrojů
současně (DB2, MS SQL Server, Informix, Oracle a Sybase CTLIB)
•
federované uložené procedury SP dovolující použití remote SP ve federovaném dotazu
•
error-tolerant vnořené tabulkové výrazy; programátor má možnost specifikovat určité chybové
kódy SQL, které budou tolerovány; když se v příkazu SQL vyskytne tato chyba, není příkaz
ukončen a chyba je tolerována
•
GUI (Eclipse-based) pro návrh, generování a uvedení do provozu federovaných databází; k
dispozici jsou dvě licence IBM Rational Data Architect, nástroje pro návrh a tvorbu datových
modelů
Další informace : http://www-01.ibm.com/software/data/infosphere/federation-server/
5.1.6
InfoSphere Replication Server (WRS)
InfoSphere Replication Server distribuuje, konsoliduje a synchronizuje data za účelem vysoké
dostupnosti a výkonu.
WRS umožňuje :
•
řízení strategie přesunu dat mezi různými zdroji
•
monitorování procesu synchronizace replikací.
V rámci tohoto produktu mohou být použity dva přístupy pro asynchronní datovou replikaci :
•
SQL replikace
•
Q replikace (Queue-based)
Oba přístupy mohou být použity nezávisle nebo je lze kombinovat.
SQL replikace - základní vlastnosti :
Transformaci dat lze provádět během přenosu dat standardními příkazy SQL nebo pomocí uložených
procedur.
Přenos dat je spouštěn automatickým plánovačem na základě navrženého intervalu, nepřetržitě nebo
na základě události.
Přenos dat, která jsou vždy online, je řízen v čase v příhodném časovém okně nebo v souvislosti s
prováděnými transakcemi.
DB2, Informix Dynamic Server, Microsoft SQL Server, Oracle a Sybase Adaptive Server Enterprises
mohou být jak zdroji, tak i cíli replikace; Informix Extended Parallel Server a Teradata pouze
replikačními cíli.
Strana 26
Výrobní linka IBM pro aplikace BI
Q replikace - základní vlastnosti :
Tento typ replikace poskytuje vysokou rychlost, nízké zpoždění a příznivé rozdělení zátěže
(workload).
Prováděné změny jsou publikovány do fronty zpráv WebSphere MQ, důmyslný mechanismus APPLY
je prováděn v souladu s probíhajícími uživatelskými transakcemi a aplikuje replikované transakce na
cílový systém s minimálním zpožděním a využitím paralelismu
K dispozici je sada algoritmů pro detekci a řešení konfliktů, které umožňují produktivní práci backup
systémům tak, že workload aplikace může být distribuován podél více serverů
Data mohou být filtrována, přenášena jsou pak pouze potřebná data
Mechanismus APPLY může vyvolat SP, které provádějí transformace dat
Integrované možnosti automatických funkcí a vysokého výkonu; zpracování je prováděno paralelně,
proto cílová dat mohou být zapisována současně s tím, jak jsou změnová data replikována
Data mohou být replikována do/z databází DB2 a z databází DB2 do Informix, Oracle, MS SQL
Server, a Sybase
Další informace : http://www-01.ibm.com/software/data/infosphere/replication-server/
5.1.7
•
•
•
•
•
•
•
Datové zdroje
Textové soubory
XML datové struktury
Oracle, DB2 (včetně Data Partitioning Feature), Informix, Sybase, Teradata a MS SQL Server
Web Services
SAP, Siebel,Oracle a PeopleSoft
SAS
WebSphere MQ
Další informace : http://www-01.ibm.com/support/docview.wss?uid=swg27011206&rs=3171
5.1.8
Platformy
Linux
• Red Hat Linux Advanced Server 4.0, 32/64 bit
Windows
• klient - 32-bit Windows XP, Service Pack 2, nebo Windows Vista
• server - 32-bit Windows Server 2003, Service Pack 1 nebo 2
AIX
• AIX 5.2, 5.3, 32 bit režim
Solaris
• Solaris 9,10 pro UltraSPARC , 32 bit režim
HP
•
•
HP-UX 11i v2 pro PA-RISC, 32/64 bit režim
HP-UX 11i v2 pro Itanium, 64 bit režim
Další informace: http://www-01.ibm.com/support/docview.wss?uid=swg27009462&rs=14
Strana 27
Výrobní linka IBM pro aplikace BI
5.2 Rational Data Architect (RDA) – datové modelování
RDA je průmyslová technologie datového modelování a navrhování relačních vztahů. Lze jej využít
k tvorbě, modifikování a generování DDL pro fyzické datové modely. Fyzický datový model popisuje
relační datové objekty (např. tabulky, sloupce, primární klíče a cizí klíče) a jejich vzájemné relace.
Fyzický datový model vytváříme pro zdrojové a cílové databáze a staging tabulky pro aplikace
datových skladů.. Generování příkazů DDL lze směrovat přímo do databázového serveru
prostřednictvím nástroje Database Explorer.
Technologie RDA lze využít i k porovnávání datových objektů nebo analýze dopadů změn a jejich
souvislostí. Můžeme zjišťovat rozdíly mezi porovnávanými objekty nebo modely a změny mezi nimi
kopírovat.
RDA umožňuje :
• Vytvářet logické a fyzické datové modely relačních nebo federovaných databází
•
•
•
•
Zjišťovat, analyzovat a vizualizovat strukturu datových zdrojů a modelů vzhledem
k průmyslovým standardům
Identifikovat relační vztahy mezi různými datovými zdroji (impakt analýza)
Porovnávat a synchronizovat strukturu dvou datových zdrojů/cílů
Podporuje DB2 v9 včetně podpory XML
Další informace: http://www-01.ibm.com/software/data/integration/rda/
5.3 Další informace
Další informace o uvedených produktech naleznete na adrese :
http://www.mfservis.cz/index.php?sid=&kat=2&pol=pr_ibm&p1=4&p2=43
Strana 28
Výrobní linka IBM pro aplikace BI
6. IBM COGNOS BUSINESS INTELLIGENCE
Cognos Business Intelligence (CBI) je BI produkt, který poskytuje nástroje na pokrytí všech
požadavků na aplikace BI: tvorba reportů, analýz, scorecarding, dashboards.
CBI poskytuje uživatelské rozhraní umožňující uživatelům snadné ovládání a podporuje podnikové
procesy rozhodování.
CBI je ve verzi 8 distribuován ve formě následujících produktů :
6.1 Cognos 8 Reporting
Cognos Reporting poskytuje odpovědi na interaktivní dotazy a umožňuje vytvářet potřebné výkazy a
přehledy. Dává uživateli volnost k rychlému a snadnému zhotovení libovolného standardního nebo
ad-hoc výkazu, avšak současně umožní administrátorům IS kontrolovat a udržovat konzistenci všech
uživatelů a reportů.
Cognos Reporting je významný nástroj v rámci CBI, který poskytuje přístup ke všem typům reportů,
umožnuje připojit jakýkoliv datový zdroj a pracuje s jednou metadatovou vrstvou, která umožňuje
různé výhody jako například poskytování reportů ve vícejazycích.
Katalog Cognos Reportingu izoluje uživatele od složitostí databáze jako jsou syntaxe příkazů SQL,
spojení tabulek a symbolická jména polí tím, že organizuje data za použití odborné uživatelské
terminologie. Výsledkem je, že informace jsou předkládany manažerům tak, jak chápou své
podnikání, nikoli tak, jak jsou uloženy v databázi.
Charakteristiky reportů :
•
•
•
•
•
Jedno prostředí pro vytváření všech typů reportu včetně dashoardů
Uživatelský interface pro více jak 10 jazyků, reporty ve více jak v 25 jazycích; uživatelský
interface lze měnit do podoby definované implementátorem řešení
Různé exportovací formáty reportu (Excel, PDF, XML, HTML a CSV)
Flexibilní distribuční metody: centalizovaný přístup, email, aplikační integrace, MS Office
Jednotná architektura pro prohlížení, dotazování, analyzování a pro týmové vytváření
jakéhokoliv typu reportu včetně dashoardů
Rozšířené možnosti vytváření reportů :
•
•
•
•
•
•
•
•
Intuitivní vytváření reportu bez nutnosti jakéhokoliv programování
Federalizované dotazy - pouze jeden dotaz na více heterogenních datových zdrojů
Konzistentní vzhled, který se přizpůsobuje v případě přidání, změně nebo odebrání objektu
Možnost vložit do reportu aplikace, odkazy a jakýkoliv jiný obsah
Drag and Drop funkce umožnující přidat data, texty, grafy, grafiku a obrázky
Editování reportu pomocí příkazového řádku i pomocí objektových nástrojů
Interaktivní vizualizace reportů pomocí velkého množství grafů (crosstabs, bar/3D bar,
pie/donut, line, gauge, funnel, scatter, dot density, waterfall, a dalších)
Vytvářet komplexní, vícestránkové návrhy reportů s použitím různých datových zdrojů, bez
programování podmíněného formátování a automatické kalkulace
Datové zdroje :
•
•
•
•
•
•
Relační datové zdroje zahrnující DB2, Oracle, SQL, Informix, Teradata, Sybase a ODBC
Multi Dimenzionální zdroje jako IBM Cubing Services, Cognos OLAP, SAP BW, Microsoft,
SAS, EssBase, Oracle 10g
ERP systémy jako SAP, PeopleSoft a Siebel
Moderní datové zdroje zahrnující XML, Java Beans, JDBC, LDAP, WSDL
Ostatní zdroje např. soubory Excelu, Accessu a flat soubory
Legacy a mainframe systémy VSAM, IMS, IDMS a Cobol Copybooks
Strana 29
Výrobní linka IBM pro aplikace BI
•
•
•
ECM systémy zahrnující FileNet, Documentum a OpenSoft
Podpora operačních systémů Windows, UNIX, Linux
SAP-certified BAPI a iViews.
Webové rozhraní :
•
•
•
Integrace s technologií WebSphere
Plně publikované webové rozhraní SDK
Jednotná metadatová vrstva pro všechny typy reportů
Další informace: http://www.cognos.com/products/cognos8businessintelligence/reporting.html
6.2 Cognos 8 Analysis
Cognos Analysis umožňuje jednoduše zkoumat a analyzovat informace, které náleží do všech oblastí
lidských činností bez ohledu na to, kde jsou data uložena. Analýza a reporting jsou zpracovány za
použití On-Line Analytického zpracování (OLAP) a dimenzionálně orientovaných datových zdrojů.
Robustní analytické nástroje :
•
•
•
•
Provádějí komplexní analýzy rychle a jednoduše, odpovídají na otázku "PROČ"
Analyzují klíčové faktory výkonnosti podnikání s daty orientovanými v logických kategoriích
(dimenzích) jako finanční rok, oblasti prodeje, produkty, a další
Jednoduše přecházejí z agregované úrovně k detailu a poskytují požadované informace
Sofistikované časové analýzy trendů umožní zjistit, co se změnilo během posledního roku,
měsíce, dekády, týdne popřípadě zjistit, jak se změnily jiné kritické ukazatele během tohoto
časového období
Jednoduchost a snadné používání :
•
•
•
•
•
•
•
•
•
Zkoumání komplexní datové struktury s použitím drag and drop funkcionality. Drill down do
úrovní s větším detailem a prohlížení dat přes různé dimenze, jako je např. prodej přes oblasti
prodeje nebo prodej přes jednotlivé produkty
Prohlížení a analyzování graficky znázorněných datových závislostí s možností přepínání
různých pohledů
Jednoduché používání operací: drill down, slice & dice, roll-up, rank, sort, forecast.
Obecný XML formát reportu umožňuje umístit report do libovolného uživatelského nástroje
dle potřeb uživatele
Uživatelsky přívětivé rozhraní umožňuje provádět multidimenzionální analýzy jednoduše bez
ohledu na úroveň znalostí IT
Import a manipulace s daty v MS Office
Podpora relačních databází i zdrojů dat typu OLAP
Integrace se stávajícími kostkami a OLAP servery třetích stran
Analýza zpracovává a sumarizuje data na aplikační úrovni a vrací pouze sumarizované
výsledky; výsledkem je úspora objemu přenášených dat a zvýšení propustnoti sítě
Další informace: http://www.cognos.com/products/cognos8businessintelligence/analysis.html
Strana 30
Výrobní linka IBM pro aplikace BI
6.3 Cognos 8 Scorecarding
Scorecarding je ověřená metoda na sledování, měření a řízení sledování a měření výkonnosti na úrovni
strategické i taktické pro firmy, týmy nebo jednotlivé zaměstnance.
Na taktické úrovni se scorecardy používají na sledování jednotlivých projektů a porovnávají se s
cílovými hodnotami. Na strategické úrovni mohou být scorecardy součástí rozsáhlého systému na
sledování výkonnosti.
Cognos Scorecarding je reprezentován seznamem klíčových ukazatelů nebo metrik, jejichž
prostřednictvím se prezentuje výkonnost organizace v porovnání s cílovými hodnotami. Scorecardy ve
své většině nabízejí kombinace finančních a nefinančních informací, provozních a výsledkových
ukazatelů a odpovídajících strategických map.
K hledání odpovědi na otázku PROČ může být s výhodou využita funkcionalita definice závislosti
mezi jednotlivymi metrikami. Jednotlive metriky ovlivňují metriky jiné a proto může být často
skutečnou příčinou špatné hodnoty nějaké metriky metrika jiná, jenž je s ní v úzkém závislostním
vztahu.
Další informace: http://www.cognos.com/products/cognos8businessintelligence/scorecarding.html
6.4 Cognos 8 Dashboards
Dashboardy jsou systémy, které umožňují zobrazení kritických informací na jedné obrazovce, a jsou
proto velmi vhodné pro manažery.
V prostředí produktů Cognos BI je možné vytvářet všechny typy dashboardů (jak provozní, tak
taktické a strategické).
Dashboardy dávají manažerům možnost vidět klíčové ukazatele prezentované přehlednou formou na
jednom místě. Dashboardy mají rovinu aplikační, rovinu vrstev a typů.
Aplikační rovinu lze rozčlenit na:
•
•
•
monitoring
analýzy
reporting
Rovinu vrstev lze rozčlenit na:
•
•
•
grafickou
sumární dimenzní data
detailní provozní data
Z pohledu typů rozeznáváme následující typy dashboardů:
•
•
•
provozní
strategické
taktické
Strana 31
Výrobní linka IBM pro aplikace BI
V prostředí produktů Cognos BI je možné vytvářet všechny typy dashboardů (jak provozní, tak
taktické a strategické).
Další informace: http://www.cognos.com/products/cognos8businessintelligence/dashboards.html
6.5 Cognos 8 datová integrace pro SAP R/3
Cognos 8 datová integrace pro SAP R/3 rozšiřuje schopnosti SAPu. Nástroj je postaven jako webová
služba se SOA architekturou a je certifikován SAP NetWeaverem.
Cognos 8 datová integrace pro SAP R/3 kombinuje data ze SAPu a data mimo SAP, využívá výhody
SAP NetWeaveru a infrastruktury mimo SAP.
Cognos 8 datová integrace pro SAP R/3 umožňuje použití starých nebo nových verzí SAPu a
násobných SAPovských instancí. Řešení je nezávislé na SAPovské infrastruktuře - zvyšuje flexibilitu
a snižuje riziko.
Další informace:http://www.cognos.com/solutions/data/sap/index.html
Strana 32

Podobné dokumenty

IBM WebSphere

IBM WebSphere Relační databáze (db) – obsahuje tabulky a vazby mezi tabulkami. Používá jazyk SQL. OLTP (On-Line Transactional Processing) – technologie zpracování dat, typická pro ERP. Multidimenzionální db (mdb...

Více

celý časopis

celý časopis Pokud jste podlehli Windows 7 natolik, že je používáte jako primární desktop a potřebovali byste, aby z něho bylo možné spravovat servery na síti přímo prostřednictvím nástrojů a ne jen připojením ...

Více

SOUBOR Č. 1 INSTRUCTION MANUAL © 1992

SOUBOR Č. 1 INSTRUCTION MANUAL © 1992 šířku textu (ja nastavena "natvrdo" na 48® bodů, což není cifra jan tak vycucaná z prstu, ala standard, který dokáže vytisknout vitiina tiskáren). Najeden uživatel vlak uposlechl rad uveřejnlných v...

Více

Ceník Express modlů IBM System x

Ceník Express modlů IBM System x x3200 x3200M2 E4600 2.40GHz 2MB L2, 2x 512MB, O/B H/S SAS/SATA, multiburner x3200M2 Xeon 3320 2.50GHz 6MB L2, 2x 512MB, 2x 250GB SS SATA, multiburner x3200M2 Xeon 3320 2.50GHz 6MB L2, 2x512MB, O/B ...

Více

Databázové servery pro nejvy‰‰í nároky a pro zpracování jak

Databázové servery pro nejvy‰‰í nároky a pro zpracování jak a pfiedvídání v˘voje trhu • získávání klíãov˘ch obchodních poznatkÛ

Více

PDF / 4,8 MB - Duha - Moravská zemská knihovna v Brně

PDF / 4,8 MB - Duha - Moravská zemská knihovna v Brně programů knihoven. Jedná se o Strategii celoživotního učení ČR (2007) a návrh Strategie rozvoje vzdělávání do roku 2020 (http://www.vzdelavani2020.cz). V těchto materiálech jsou knihovny, jako význ...

Více