Přinášíme vám pravidelné shrnutí zajímavých článků z odborného tisku a specializovaných webů. Pro členy Asociace máme k dispozici podrobnější rozbor obsahu. Přihlášení zde.
Rozběhněte datovou strategii
CIO Business World 2/2023, Michael Bertha, str. 6-8
Aktivace dat se podobá roztočení setrvačníku. Je třeba vyvinout obrovské úsilí, aby se kolo dalo do pohybu, ale poté se do značné míry točí samovolně. Které čtyři kroky vedou k rozběhu datové strategie? Prvním krokem je zvolit správný problém. Problém musí být naléhavý a musí být jednoduše vysvětlitelný. Také musí být hmatatelný a musí se týkat celého podniku. Jádrem všech strategií je tedy řešení skutečných obchodních problémů. Druhým krokem je shromáždění správných dat. Definování problému zužuje škálu dat, která jsou pro datovou strategii potřeba a také určuje jaká data jsou potřeba, kde se dají získat a jak je spravovat. Také se zúží okruh lidí, procesů a technologií, které budou tvořit příslušné datové prostředí. Znalost toho, jaká data jsou potřeba poskytne kontext, který je potřeba k výběru lidí, nástrojů a procesů. Třetím krokem je propojení toho, co dříve zdánlivě nemělo souvislost. Setrvačník se se zpočátku točí pomalu, stačí když se dá do pohybu. Nalezení i jen několika nových příležitostí nebo typů dat firmě umožní najít souvislosti mezi věcmi, které se dříve zdály nesourodé. Ne každý nový poznatek je užitečný. Je potřeba hledat ty nejcennější, nejreálnější, které jsou viditelné, měřitelné a hmatatelné. Čtvrtým krokem je postup od původního problému k dalším problémům. Když se setrvačník roztočí rychleji, je na výběr z širšího okruhu problémů. Je potřeba upřednostnit ty, které jsou řešitelné a ekonomicky významné a které tematicky navazují na již řešené problémy. Datovou strategii je tedy nutné krok za krokem uvádět do pohybu podle principu setrvačníku.
Přeměňte data na budoucnost
CIO Business World 2/2023, Thor Olavsrud, John Edwards, str. 14-16
Prediktivní analýza je kategorie analýzy dat, zaměřená na předpovědi budoucích výsledků na základě historických dat a analytických technik, jako je statistické modelování a strojové učení. S pomocí sofistikovaných nástrojů a modelů prediktivní analýzy může dnes každý podnik využívat minulá a aktuální data ke spolehlivému předpovídání trendů a chování v řádu milisekund, dnů nebo let do budoucnosti. Pomocí prediktivní analýzy mohou podniky vyhledávat a využívat vzorce obsažené v datech za účelem detekce rizik a příležitostí. Díky prediktivní analýze je pohled do budoucnosti přesnější a spolehlivější než u dřívějších nástrojů. Jako taková může pomoci nalézt způsoby, jak ušetřit a vydělat peníze. Optimalizací marketingových kampaní pomocí prediktivní analýzy mohou podniky také vyvolat u zákazníků nové reakce nebo je podnítit k nákupu a také podpořit křížový prodej. Prediktivní analýzu lze také využít k detekci a blokaci různých typů protiprávního jednání dříve, než dojde k vážným škodám. Prediktivní analýza je využívána v letectví, automobilovém průmyslu, energetice, finančních službách, průmyslové výrobě nebo maloobchodu. Například firma Rolls-Royce optimalizuje díky prediktivní analýze harmonogramy údržby a snižuje uhlíkovou stopu, vodárenská společnost DC Water omezuje ztráty vody v potrubí nebo PepsiCo řídí dodavatelský řetězec pomocí prediktivní analýzy. Mezi nejvýznamnější softwarové platformy a řešení patří Amazon SageMaker, IBM SPSS, SAP Analytics cloud, SAS Viya nebo TIBCO. Jsou k dispozici čtyři modely prediktivní analýzy. Jedná se o model celoživotní hodnoty zákazníka, model segmentace zákazníků, model prediktivní údržby a model zabezpečování kvality. K technikám prediktivního modelování patří rozhodovací stromy, Regresní techniky a neuronové sítě. Uživatelé prediktivní analýzy mají snadný přístup k širokému spektru statistických algoritmů, algoritmů pro dolování dat a algoritmů strojového učení, vyvinutých pro použití v prediktivně analytických modelech. Algoritmy jsou obecně navržené tak, aby řešily konkrétní obchodní problém nebo řadu problémů, vylepšovaly existující algoritmus nebo poskytovaly určitý druh jedinečné schopnosti. Jak by měl podnik začít s prediktivní analýzou? Začít pilotním projektem omezeného rozsahu v některé důležité obchodní oblasti je vynikající způsob, jak omezit počáteční náklady a zároveň na minimum zkrátit dobu, než se začnou projevovat ekonomické přínosy. Jakmile je model uveden do praxe, bude dodávat užitečné poznatky po mnoho let, přičemž obvykle vyžaduje jen drobnou údržbu.
Nabídněte datovou analýzu celé firmě
CIO Business World 2/2023, Bob Violino, str. 20-22
Rozhodování založené na datech je klíčovým atributem moderního digitálního podnikání. Zkušení datoví analytici a datoví vědci však mívají značné platové nároky a bývá je obtížné nalézt a udržet. Jedním z možných řešení tohoto problému je zavedení samoobslužné analýzy, což je typ business intelligence (BI), který umožňuje podnikovým uživatelům klást dotazy a generovat sestavy samostatně jen s minimální pomocí IT nebo datových specialistů, případně zcela vlastními silami. Samoobslužná datová analýza obvykle zahrnuje nástroje, jež se snadno používají a nabízejí základní analytické funkce. Jak používat samoobslužnou analýzu? Je důležité sestavit plán, kde a kdy má smysl analýzu používat, a zavést odpovídající kontrolní mechanismy, aby se vaše analytická strategie nevymkla z ruky. Je také potřeba plán správy dat kvůli udržování jejich pořádku a čistoty. Je dobré zaměřit se na data, která jsou prakticky využitelná při řízení podniku a jeho jednotlivých činností. Získané poznatky lze využít k transformaci procesů a rozhodování na úrovni celého podniku. I když je důležité mít dlouhodobou strategii analýzy dat, neznamená to, že by podniky měly při zavádění samoobslužných nástrojů postupovat pomalým tempem. Také lze využít zpracování přirozeného jazyka (NLP). To zpřístupňuje datovou analýzu širšímu okruhu uživatelů. Dva hlavní aspekty NLP u analýzy dat jsou vyhledávání v přirozeném jazyce a prezentace přirozeného jazyka. Integrované nástroje zpřístupňují analytické funkce a vizualizace dat v podnikových aplikacích . Zpřístupnění reportů a přehledových panelů v reálném čase v těchto aplikacích umožňuje uživatelům analyzovat data přímo v nich. Rozdíl mezi úspěchem a neúspěchem samoobslužné datové analýzy může záviset na zvolených technických prostředcích. Podnikoví manažeři musejí úzce spolupracovat s vedením IT a společně posoudit, které nástroje budou nejlépe vyhovovat potřebám podniku a zároveň budou dobře fungovat v rámci existující infrastruktury.
Vysvětlování dat pomocí příběhů
CIO Business World 2/2023, Linda Rosencrance, str. 26-28
Vyprávění příběhů podle dat je klíčovým faktorem pro podniky, které chtějí ze svých dat získat užitečné informace. Jedná se o metodu, která ukazuje jak předávat poznatky založené na datech pomocí vyprávění a vizualizací, které zaujmou publikum a pomohou lépe pochopit klíčové závěry a trendy. Vyprávění příběhů začíná podle dat znalostí publika. Kdo jsou hlavní postavy (publikum), jaké informace jsou pro ně nejdůležitější? Je potřeba obsah strukturovat tak, aby předvídal další otázku, kterou posluchači nejspíš chtějí položit. Překážkou, s níž se většina vypravěčů příběhů podle dat potýká, je dosáhnout toho, aby publikum uznávalo platnost a relevantnost příslušných informací. To se dá vyřešit uspořádáním sezení k validaci a pochopení dat. Cílem vypravěče příběhů podle dat je vyjasnit všechny otázky ohledně jejich zdroje, stáří a podobně, aby při dalších pohledech na data je nemusel neustále obhajovat. Vyprávění příběhů podle dat se skládá z vizualizace dat, vyprávění a kontextu. Je dobré používat obrázky. Také je nutno uvést kontext k vyprávění. Schopnost zasadit data do kontextu v podobě vyprávění umožňuje lidem se o ně zajímat a pochopit, co z nich vyplývá. Klíčové kroky při vyprávění příběhů podle dat jsou identifikace zásadních poznatků, podělení se o příběh vzniku dat, upozornění na překvapivé momenty, rozvíjení dat, oživení příběhu zdůrazněním a zvýrazněním a přidání postav hrdiny a padoucha aby byl příběh poutavější. Když se vypravěč dostane k pointě nebo závěrečnému doporučení, jeho sdělení by mělo být plně v souladu s prezentovanými daty. Co se týče komunikace přes nástroje s pracovníky z různých zemí, je důležité přemýšlet o komunikačním softwaru, který firma používá a nastavení pravidel a norem komunikace s firemním týmem.
Sedmero trendů v datových strategiích
CIO Business World 2/2023, John Edwards, str. 29-31
Prvním trendem je, že data v reálném čase se stávají skutečností a stejně tak složitost práce s nimi. CIO by měli ve své strategii dát prioritu investicím, které pomohou zvládat rostoucí objem komplexních dat v reálném čase, jež proudí do podniku. Druhým trendem jsou stoupající požadavky na interní přístup k datům. Každý v podniku, od prodeje přes marketing po HR a provoz, potřebuje přístup k datům, aby se mohl lépe rozhodovat. Manažeři IT hledají datové strategie, které jim umožní spravovat obrovské objemy různorodých dat umístěných v separátních systémech, aniž tím vzniknou potenciální problémy v oblasti rizik a dodržování předpisů. Třetím trendem je to, že práce s externími daty nabývá na strategickém významu. Při smysluplném využití nativně cloudových datových skladů a na ně napojených analytických platforem se ukazují zajímavé případy použití, kdy jsou podniky schopné propojit svá data s daty partnerů a vytvořit zcela nová digitální aktiva. Čtvrtým trendem jsou datové architektury typu “fabric” a “mesh”. Architektura typu mesh umožňuje podniku čerpat informace a poznatky, které potřebuje, z prostředí v jeho aktuálním stavu, aniž ho musí radikálně měnit nebo přizpůsobovat. Oproti tomu data fabric je architektura, která umožňuje komplexní integraci různých datových kanálů a cloudových prostředí pomocí inteligentních a automatizovaných systémů. Pátým trendem je pozorovatelnost dat. Ta se stává z obchodního hlediska kriticky důležitou schopností. Pozorovatelnost dat rozšiřuje koncept řízení kvality dat o pečlivé sledování je jich toku do a z aplikací. Tento přístup poskytuje důležité poznatky o informacích v aplikacích, jejich schématech, metrikách a původu. Šestým trendem je to, že “data jako produkt“ začínají přinášet užitek. Jedná se o koncept, jehož cílem je řešit obchodní problémy reálného světa pomocí agregovaných dat získávaných z mnoha různých zdrojů. Tento přístup poskytuje podnikům novou úroveň poznatků, které mohou mít skutečný dopad na hospodářské výsledky. Sedmým trendem je to, že vznikají multidisciplinární týmy pro datové produkty.
Závislost na datech a připravenost na jejich ztrátu
CIO Business World 3/2023, příloha Ovládněte svá data, Lukáš Kříž, str. II-III
Tři pětiny organizací v současnosti podnikají kroky potřebné k tomu, aby se staly datově řízené neboli data driven. Co to v praxi znamená? Zavádějí nástroje a postupy pro efektivnější využívání dat v zájmu rychlejšího a efektivnějšího rozhodování, které nabízí vyšší přesnost i jistotu. V konceptu data driven představuje klíčový prvek samotná dostupnost dat. Bez ní jej nelze uskutečnit. Ztráta dat se v kontextu tématu stává vlastně permanentní nedostupností. A na rozdíl od dočasné nepřístupnosti ji doprovází potenciál fatálních dopadů na byznys organizace. Podnikoví informatici proto hledají řešení, která by dokázala snížit dobu prostojů a obnov téměř na nulu. V konkrétním vyjádření jde o známé hodnoty RTO a RPO. Jejich teoretická minimalizace by znamenala, že nedojde k žádnému výpadku ani ke ztrátě dat. Podniková informatika reaguje na tuto situaci opatřeními jako je multicloudová správa, řešení integrovaného zálohování, orchestrace obnovy anebo smluvních vztahů s poskytovateli, jež ošetřují zásady a SLA. Výzvu představuje složitost a provázanost prostředí, v nichž data vznikají a jsou ukládána. Většina nových softwarových systémů je nasazována v cloudu nebo na okraji sítí. Cloudové aplikace ale do značné míry spadají do kategorie SaaS. Ta sama o sobě vytváří určitou mezeru ve správě dat, protože data v SaaS obvykle spravují poskytovatelé služeb. Tím se vzdalují z dosahu podnikových IT útvarů. K novinkám v oboru patří koncept a současně kategorie řešení s názvem continuous data protection neboli CDP. Jeho prostřednictvím organizace dosahují kratší obnovy a nižších ztrát dat. CDP může pomoci při běžných typech obnovy dat po havárii, ale hraje také významnou roli v boji proti kybernetickým útokům, zejména ransomwarovým.
Co je to DataOps? Kolaborativní multifunkční datová analýza
CIO Business World 3/2023, příloha Ovládněte svá data, Thor Olavsrud, str. XIII-XV
DataOps (datové operace) je agilní, procesně orientovaná metodika pro vývoj a poskytování analýz. Spojuje týmy DevOps s datovými inženýry a datovými vědci, aby společně poskytovali nástroje, procesy a organizační struktury, které potřebuje datově orientovaný podnik. Cílem DataOps je zefektivnit návrh, vývoj a údržbu aplikací založených na datech a datové analýze. Usiluje o zlepšování způsobu správy dat a vytváření produktů a koordinuje tato zlepšení s cíli podniku. Také má za cíl urychlit tvorbu ekonomického užitku tím, že zajišťuje předvídatelné poskytování a konzistentní řízení změn dat, datových modelů a souvisejících artefaktů. DevOps je metodika pro vývoj softwaru, která do vývojového cyklu systémů za vádí průběžné dodávání tím, že propojuje vývojové a provozní týmy do jedno ho celku odpovědného za produkt nebo službu. DataOps na tomto konceptu staví a posouvá jej dále přidáním datových specialistů. DataOps vychází z agilní metodiky. Klade důraz na nepřetržité poskytování analytických poznatků s primárním cílem uspokojovat zákazníka. Cílem DataOps je funkční datová analýza, přičemž její výkon se měří získanými poznatky. Týmy DataOps také iniciují změny a snaží se neustále chápat vývoj potřeb zákazníků a také se snaží organizovat a řídit data, nástroje, kód a prostředí od počátku do konce s cílem poskytovat reprodukovatelné výsledky. DataOps se nejlépe uplatní ve strojovém učení, ale je užitečný pro jakoukoli práci orientovanou na data. Pokud chtějí podniky DataOps využít na maximum, musejí upravit své strategie správy dat, tak aby dokázaly jak pracovat s daty ve velkém rozsahu, tak reagovat na události v reálném světě. Vzhledem k tomu, že DataOps staví na DevOps, jsou nezbytné multifunkční týmy složené z odborníků na provoz, softwarové inženýrství, architekturu a plánování, produktový management, analýzu dat, vývoj dat a datové inženýrství. Doporučuje se hledat inženýry DataOps, kteří se specializují na vytváření a zavádění procesů na podporu týmové spolupráce v rámci datových organizací. Členové týmu by měli být datoví specialisté, kteří podporují datové prostředí a osvědčené vývojové postupy, datoví inženýři, již poskytují ad hoc a systémovou podporu Bl, analytických a podnikových aplikací a hlavní datoví inženýři, kteří vyvíjejí produkty a služby určené zákazníkům. Mezi nejpopulárnější nástroje DataOps patří Census, Databricks Lakehouse Platform, Datafold, Dbt a Tengu.
Co je to data governance? Nejlepší praxe správy datových aktiv
CIO Business World 3/2023, příloha Ovládněte svá data, Thor Olavsrud, str. XVI-XIX
Data governance je systém k definování toho, kdo v rámci organizace má pravomoc a kontrolu nad datovými aktivy a jak mohou být datová aktiva užívána. Zahrnuje osoby, procesy a technologie potřebné ke správě a ochraně datových aktiv. Data governance lze považovat za funkci, která podporuje všeobecnou strategii správy podnikových dat. Rámec data governance podniku poskytuje komplexní přístup ke shromažďování, správě, zabezpečení a uchovávání dat. Z data governance vychází datová architektura, modelování a design dat, ukládání dat a provoz úložišť, zabezpečení dat, integrace a interoperabilita dat, dokumenty a obsah, referenční a hlavní data, datové sklady a business intelligence (BI), metadata a kvalita dat. Data governance je otázkou rolí, kompetencí a procesů pro zajištění odpovědnosti za datová aktiva a jejich vlastnictví. Správa dat (data management) je oproti tomu zastřešující pojem, který popisuje procesy sloužící k plánování, specifikaci, podpoře, tvorbě, získávání, uchovávání, užívání, archivaci, vyhledávání, řízení a čištění dat. Data governance přináší podnikům lepší podporu rozhodování, jasná pravidla pro změnu procesů, snížení nákladů v jiných oblastech správy, zvýšení efektivity, zvýšenou důvěru v kvalitu dat nebo lepší soulad se zákony na ochranu údajů.Cílem Data governance je stanovit metody, odpovědnosti a procesy pro standardizaci, integraci, zabezpečení a uchovávání podnikových dat. Předpokladem úspěchu programů data governance je dodržování osmi principů. Mezi hlavní problémy programu data governance patří slabé vedení v oblasti dat, nedostatek prostředků a izolované datové zdroje. Role v oblasti data governance jsou řídící výbor, vlastník dat a správce dat. Výhodnými certifikacemi v oblasti Data governance jsou DAMA Certified Data Management Professional, Data Governance and Stewardship Professional, edX Enterprise Data Management, SAP Certified Application Associate – SAP Master Data Governance.