Všude se hovoří o velkých datech, využíváte je i vy?

Jiří Maňas

ředitel IT distribučních kanálů, Česká spořitelna

Maňas: Jako největší retailová banka na českém trhu samozřejmě zpracováváme obrovské množství informací. V poslední době se tomuto zpracování začal dávat přívlastek "velká data", ale jde spíše o způsoby práce s takto velkým množstvím informací.

U nás to jsou informace, které nám plynou nejen přes naši největší síť bankomatů a platbomatů (kterých máme 1561), samozřejmě také ze všech poboček (aktuálně jich je 634) a neposlední řadě i z našich digitálních kanálů, jejichž důležitost se nám každým dnem potvrzuje (v současné chvíli máme například přes 1,6 milionu aktivních uživatelů internetového bankovnictví Servis 24).

Dalšími zdroji dat jsou naše aplikace pro mobilní bankovnictví na všech platformách a v nemalé řadě také web www.csas.cz. Velmi podobné zdroje dat jsou také v našem korporátním bankovnictví z korporátních center a v jejich digitálním obrazu v internetovém bankovnictví Business 24 a mobilní banky, ale také data z finančních trhů a platebního styku. Všechna tato data zpracováváme v našich transakčních a analytických systémech.

Veselý: Ne, nevyužíváme, ani v plném významu pojmu "big data", ani v jeho marketingovém, bohužel mnohdy častějším, použití pojmu.

Ten jde mnohdy cestou slepého hromadění dat bez vize či schopnosti z té spousty dat umět "vydestilovat" tu důležitou, byznysově potřebnou informaci.

Táborský: Samozřejmě data pohánějí každou moderní firmu, tedy i tu naši. Osobně nemám termín "big data" rád, protože si pod ním každý představí něco jiného. Našimi systémy proteče asi 100 milionů událostí za den.

Nekvasil: Jsou velké rozdíly v tom, jak se v různých odborných kruzích velká data definují a kde je jejich hranice. V T-Mobilu se snažíme využívat data velká i malá pro interní potřeby, trvalé zlepšování našich služeb a zákaznické spokojenosti. Zároveň pracujeme projektově s velkými daty jako službou pro naše zákazníky.

 

V jaké oblasti a s jakou přidanou hodnotou a s jakými přínosy pro váš byznys?

Maňas: V bankovnictví se data zpracovávají z několika důvodů. Začal bych každodenním zpracováním transakcí, kdy musíme umět správně všechny zprocesovat a započíst, včetně různých kalkulací, jako jsou úroky atd.

Další oblastí, která má rostoucí tendenci ve složitosti zpracování, je regulatorika bankovnictví a finančních trhů: pro regulátory zpracováváme velké množství dat a děláme velké množství výpočtů.

Poslední, ale neméně důležitou oblastí je zpracování dat pro poskytování kvalitních služeb našim klientům, a to zejména v oblasti řešení jejich životních situací, kdy nám data pomohou nabídnout klientovi správnou službu ve správný okamžik. Tuto dovednost máme v plánu do budoucna dál rozvíjet, a to zejména v digitálním světě.

Veselý: V integrovaných datech získaných nestrukturovaně nebo již zpracovávaných klasickými způsoby strukturovaně, relačně, je v každém případě obrovský informační potenciál. Konkurenční potenciál informací k využití jak pro aktivní nabídku klientům, tak pro lepší procesování nabízených služeb nebo aktivit interně, např. procesy obsluhy, vymáhaní, rizik atd.

Cílem je samozřejmě, co nejlépe identifikovat potřeby, chování, zvyklosti, rizika, a tomu umět přizpůsobit svoje postupy a nabídky. Nyní nejsme z mnoha důvodů nakloněni k bezhlavé investici do tzv. big dat, nicméně různé techniky zpracování, které bývají pod tímto pojmem schovány, připravujeme, zkoušíme a dle aktuální byznysové potřeby po částech implementujeme.

Michal Táborský

CTO, Mall.cz

Táborský: Analyzujeme velké množství technických dat vznikajících v našich systémech za účelem detekce anomálií a zlepšování spolehlivosti a výkonu. Data o chování zákazníků na webu nám umožňují postavit pro ně personalizovanou nabídku. Hledáme také různé závislosti mezi jednotlivými produkty na základě chování zákazníků, což následně využíváme při vylepšování nabídky.

Nekvasil: Hlavními oblastmi interního využití datových analýz je pro nás optimalizace sítě, zlepšování zákaznické zkušenosti a cílení. Z pohledu našeho portfolia nabízíme studie a analýzy přísně anonymizovaných a agregovaných pohledů na mobilitu obyvatelstva, což může sloužit například jako podklad v územním plánování, při živelných událostech nebo plánování dopravní infrastruktury. Velikost přidané hodnoty považujeme za obchodní tajemství.

 

Můžete jmenovat technologie, které používáte při zpracování velkých dat?

Maňas: Používáme celou řadu standardních technologií, které však musí být vzhledem k objemu zpracování dat velmi výkonné. V poslední době prototypujeme zpracování velkých dat v technologiích, které se na tuto oblast více hodí, například Hadoop, Keboola, BigQuery, SnowFlake, Tableau, GoodData atd. Navíc nám tyto technologie umožní obohatit naše data o data z vnějšího světa, což zákazníkům přinese nové služby.

Veselý: Pro finanční svět je stále důležitá přesnost, včasnost a spolehlivost, takže v oblasti zpracování dat to jsou systémy veskrze strukturované a relační. Z těch, řekněme hlavních, užíváme běžné technologie SAP, Oracle, MS, SAS a Teradata. V době optimalizace nákladů hledáme cesty i odlehčeného zpracování dat, které jsou finančně dostupnějšími, jako je Postresql, ale jejich zavádění nesmí být na úkor kvality služeb nebo spolehlivosti dodávky dat. Poslední dobou se snažíme o inteligentní a efektivní koexistenci všech těchto technologií, což je poměrně zajímavé cvičení.

Marek Nekvasil

senior manažer CRM, T-Mobile

Táborský: Hadoop a jeho komponenty Hive a Impala, Elasticsearch pro rychlou analýzu.

Nekvasil: Zde máme výhodu, protože náš Enterprise Warehouse (datový sklad) je založen na platformě IBM Netezza, což je jedno z prvních etablovaných řešení pro velká data. Dále pro analytiku používáme řešení firmy SAS, testujeme různé verze Apache Hadoop s možností využití jazyka R.

 

Kdo u vás za tuto oblast zodpovídá (ve smyslu oddělení), co se týče zpracování dat a dalšího rozvoje velkých dat přes organizaci?

Maňas: Problematice velkých dat se u nás věnuje několik týmů, které zpracovávají danou datovou oblast. Tyto týmy podporuje IT, které pomáhá s nastavením a řízením procesů okolo datové čistoty a jednoty. Vzájemnou spoluprací pak stanovujeme technologický směr, kterým budeme velká data zpracovávat.

Ivan Veselý

ředitel Útvaru rozvoje BI a DWH, Česká pojišťovna

Veselý: Odpovědnost za rozvoj BI a DWH je v gesci CFO. Rozhodování o tom, co datově v DWH zpracováno bude a co se v jeho modelech objeví pro celopodnikové použití, je na nejvyšším vedení pojišťovny, které rozhoduje na základě byznysovými vlastníky předložených projektových záměrů. Vlastníci se v rámci BI pravidelně scházejí k řešení a stanovování datových potřeb a priorit; toto uskupení je organizováno útvarem BI DWH.

Táborský: Správa dat spadá pod tým BI v rámci IT, ale přístup k datům mají uživatelé z celé firmy, takže mohou data analyzovat samostatně.

Nekvasil: Za zpracování dat jako takové je v naší společnosti zodpovědné oddělení BI, nicméně obchodní zadání a jednotlivé případy užití vznikají v B2B obchodním oddělení, v řízení CRM a produktů.