Pokročilé analýzy dat a textů / Data mining, text/web mining

Transkript

Pokročilé analýzy dat a textů / Data mining, text/web mining
Pokročilé analýzy dat a textů /
Data mining, text/web mining
Data mining i text mining jsou postupy využívané tam, kde jsou k dispozici velké objemy dat
a textů, které je potřeba „vytěžit“ a přetavit na určitou znalost či obchodní výhodu.
Jako příklad uveďme oblast marketingu a prodeje, kde pokročilé analýzy strukturovaných
dat (data mining) i nestrukturovaných textů (text/web mining) poskytují obchodní výhodu
nalezením odpovědí na otázky jako:
»
»
»
Jak nejlépe cíleně oslovit zákazníky – s jakou nabídkou, jak často, jakým kanálem?
U kterých zákazníků lze nalézt potenciální fraud chování?
V jakých souvislostech (kontextech) lze na internetu nalézt jméno společnosti zákazníka?
Pokročilé analýzy se uplatňují tam, kde není možný
nebo efektivní individualizovaný manuální přístup
a kde současně není vhodné nebo možné jednotné
plošné řešení. Úkolem je efektivně využít zdroje,
které jsou k dispozici, a změnit potenciálně zajímavé
informace na výstupy s reálnou hodnotou.
Jak postupujeme
1. Stanovení obchodního cíle
Na začátku určíme společně se zákazníkem obchodní
cíle, například lepší zacílení nabídek, minimalizace rizika,
prevence odchodů, úspory v interních procesech pomocí
automatické kategorizace příchozích dokumentů atd.
3. Implementace řešení do stávající procesní
a technické infrastruktury
Nalezené řešení prezentujeme konzultačním způsobem
tak, aby bylo srozumitelné koncovým uživatelům
bez znalostí analytických technologií. Součástí
řešení často bývá jeho implementace do stávajících
obchodních procesů a technologické infrastruktury,
např. automatizované poskytnutí varování určitého druhu
kontaktním pracovníkům, zadání pro marketingovou
kampaň, určitý report v rámci manažerského
informačního systému apod.
Příklady využití data a text miningu
Níže uvádíme příklady řešení, které realizovala společnost
KOMIX s.r.o. nebo členové týmu naší společnosti.
2. Shromáždění dat a analytické řešení
Po stanovení obchodních cílů realizujeme napojení
na relevantní vstupní data a jejich analýzu. Součástí řešení
může být interní analytické úložiště pro strukturovaná
nebo nestrukturovaná data. Při analytickém řešení
využíváme technologie předních komerčních dodavatelů
(IBM SPSS, SAS, HP Autonomy aj.), včetně technologií
„Big data“, nebo využíváme technologie open source.
1 Stanovení
obchodního cíle
2 Shromáždění
a příprava dat
Data mining – využití strukturovaných údajů
»
Podpora cíleného prodeje (realizace – bankovní
instituce)
Při cílených nabídkách prostřednictvím call centra,
e-mailu, poštovních zásilek atd. se prostřednictvím
modelů tzv. „propensity to buy“ optimalizují
náklady tak, že se k oslovení vybírají zákazníci se
statisticky vyšší pravděpodobností kladné reakce
na nabídku, optimalizuje se i volba kanálu.
3 Analytické
řešení
4 Obchodní
implementace
»
»
»
»
»
»
Prevence odchodu zákazníků (realizace –
bankovní instituce)
Cílem je zmenšit pravděpodobnost odchodu
zákazníků tak, že na určité zákazníky vykazující
statisticky vyšší pravděpodobnost odchodu
se uplatní retenční strategie.
Segmentace zákazníků (realizace – bankovní
instituce, mobilní operátor, Národní technická
knihovna)
Obchodním cílem je rozčlenění zákazníků
do určitého počtu hlavních skupin (obvykle 5–15)
podle hodnoty, rizikovosti, druhu chování atd.
Využívají se pokročilé techniky tzv. clusteringu
(shlukování) v kombinaci s expertními
obchodními náhledy.
Hledání podvodného chování (realizace –
zdravotní pojišťovna)
Cílem je nalezení podvodného chování a jeho
prevence. V případě velkého množství případů
(vykázaná zdravotní péče) je tak možné radikálně
minimalizovat náklady na kontrolu tak, že jsou
označeny případy, které vykazují statisticky
nápadně odlišné chování od chování typického.
Analýza nákupního košíku pro účely
optimalizace nákupní plochy (realizace – retail)
Cílem je optimalizace umístění zboží na nákupní
ploše (např. jedno zboží je umístěno na více
místech) pro účely zvýšení prodeje na základě
asociačního efektu kupujících.
Začlenění výsledků data mining do procesu
cíleného marketingu (realizace – bankovní
instituce)
Cílem je obchodně-procesní i technologická
integrace. Příkladem je situace, kdy při volání
klienta na call centrum má klientský pracovník
na úvodní obrazovce informace o tom, které
produkty je možné se zvýšenou pravděpodobností
úspěchu volajícímu v případě vhodně vyvíjejícího
se telefonního hovoru nabídnout.
Odhad budoucí návštěvnosti s využitím
časových řad (realizace – Národní technická
knihovna)
Na základě historických údajů se odhaduje budoucí
vývoj návštěvnosti instituce. Součástí analýzy
je analýza sezónních výkyvů ev. externích jevů
typu propagační kampaň.
Oblast text mining – využití nestrukturovaných údajů
(texty, hlasové informace)
»
Segmentace odpovědí ze zaměstnaneckých
nebo zákaznických průzkumů (realizace –
bankovní instituce)
Obchodním cílem je určení typologií textových
odpovědí a jejich rozdělení do menšího počtu
(cca 8–10) skupin pro porozumění typologií
zaměstnaneckých nebo zákaznických požadavků.
Realizuje se s využitím shlukovacích algoritmů text
miningu.
»
Automatizovaná kategorizace příchozích
stížností nebo požadavků (realizace – bankovní
instituce)
Automatická kategorizace příchozích stížností
nebo požadavků umožňuje v případě statisticky
„jistého“ výsledku poslat daný požadavek
přímo na příslušného řešitele, pouze v případě
statisticky nejistého určení se následně provádí
kategorizace ručně.
»
Analýza web informací pro účely minimalizace
rizika (realizace – bankovní instituce)
Při schvalování firemního úvěru vstupují do
schvalovacího procesu výsledky web analýzy,
kdy pro název dané firmy je získáno rizikové skóre
vypočtené analýzou textových zdrojů získaného
z volně přístupných online zdrojů.
Spojení oblasti data mining a text mining
»
Posílení modelů „propensity to buy“
(náchylnost ke koupi) pokročilými textovými
analýzami (realizace – bankovní instituce)
Modely typu „propensity to buy“ využívané
pro snížení nákladů a zlepšení účinnosti cíleného
oslovování zákazníků byly posíleny prostřednictvím
pokročilých textových analýz.
O společnosti KOMIX
KOMIX s.r.o. je česká společnost založená v roce 1992. Specializuje se zejména na dodávky informačních
systémů nebo aplikací na klíč, dále pak integrační nebo transformační projekty. Společnosti KOMIX také
poskytuje konzultační služby zaměřené jak na návrh informačních systémů, tak na jejich kvalitu, testování
a provoz. Naším posláním je pomocí ICT technologií zlepšovat lidem život, usnadnit jim práci a firmám
poskytovat dlouhodobou konkurenční výhodu.
KOMIX s.r.o.
Drtinova 467/2A / Praha 5 / 150 00
+420 257 288 211 / [email protected] / www.komix.cz

Podobné dokumenty

Řešení pro podporu rozhodování a cíleného marketingu

Řešení pro podporu rozhodování a cíleného marketingu Určení typologií textových odpovědí a jejich rozdělení do menšího počtu skupin pro porozumění typologií zaměstnaneckých nebo zákaznických požadavků. Realizuje se s využitím shlukovacích algoritmů t...

Více

Inicializační rozdělení do shluků a jeho vliv na konečné shlukování v

Inicializační rozdělení do shluků a jeho vliv na konečné shlukování v Shluková analýza se stala jedním z hlavních nástrojů pouţívaných při získávání znalostí z dat, které je označováno jako data mining. V této nové oblasti analýzy dat se často zpracovávají data velký...

Více

Úvod do problematiky Stále větší množství dat uložených v

Úvod do problematiky Stále větší množství dat uložených v ◦ Koncový uzel – třída, do které je objekt klasifikován

Více

11 Reseni pro dlouhodobe ukladani dat

11 Reseni pro dlouhodobe ukladani dat  Zákonné požadavky na uchování dat  Oborové požadavky na uložení dat např. z výrobních testů  Nutnost prokazatelnosti původu a neměnnosti dat

Více

Informační systémy - Katedra automatizační techniky a řízení

Informační systémy - Katedra automatizační techniky a řízení {Výpočet kostky (volba úložiště) {Zpracování výsledků (výsledky je možno zobrazit např v MS Excel jako kontingenční tabulku) Informační systémy 2006/2007

Více

Inovační vouchery Fakulta managementu

Inovační vouchery Fakulta managementu datových souborů, výběrových šetření, analýza textových informačních zdrojů. Sběr a analýza veřejně dostupných dat zejména z oblasti veřejných financí, eventuelně i jiné oblasti dle zájmu a dle i...

Více

management znalostí - Personalizace výuky prostřednictvím e

management znalostí - Personalizace výuky prostřednictvím e spojenou se zvýšením výkonnosti firmy, přežití firmy v reakci na stále dynamičtějším a nestabilnějším situaci trhu. Prioritním cílem „Knowledge managementu“ je dosažení vyšší prosperity podniku. Pr...

Více

Prezentace aplikace PowerPoint

Prezentace aplikace PowerPoint • kontakty – Argentina, ČR, Indie, Irsko, Itálie, Kanada, Qatar, Rumunsko, Rusko, Řecko, Srbsko, Španělsko, Tunis, UK, USA • http://ui.pefka.mendelu.cz/en/NLP

Více