Rešerše: datová centra (3Q 2022)

Přinášíme vám pravidelné shrnutí zajímavých článků z odborného tisku a specializovaných webů. Pro členy Asociace máme k dispozici podrobnější rozbor obsahu. Přihlášení zde.

Není jen kybersvět, ale i svět skutečný

CIO Business World 04/2022, Ľuboslav Lacko, str. 36-38

Jak zajistit objekty, ve kterých se nacházejí datacentra? Velmi důležité je propojení zabezpečování a přístupového systému, tedy systému pro monitorování docházky. To umožňuje zjistit, jestli v zabezpečeném objektu někdo má, nebo nemá být. Inteligentní systém si poradí i v případě, že pracovníci zapomenout zabezpečené prostory zakódovat. Nastavené procesy se musejí aktivovat už tehdy, když se narušitel blíží k oplocení, nebo k jinak vytyčené hranici zájmové zóny. Moderní digitální kamerové a vyhodnocovací systémy dokážou samy rozpoznat nežádoucí aktivity, umějí rozeznat člověka od zvířete nebo jiného pohybujícího se objektu. Nejúčinnější ochranu poskytuje kombinace bezpečnostního systému, přístupového systému a kamerového monitorovacího systému, přičemž tato uspořádání musejí navzájem komunikovat. Včasné odhalení narušitele tak aktivuje reakci už tehdy, když překročil hranice objektu, ale ještě před vniknutím do budovy. Maximální možná automatizace zabezpečovacího systému je klíčová i z hlediska rizika, které představuje lidský faktor. Kvalitní řešení poskytuje kvalitní kamery, rozlišení obrazu a kvalitní pohybové senzory. Zabezpečovací systém je třeba také umět používat a proto jsou nezbytné simulace rizikových situací.

Databáze s nativní podporou strojového učení

COMPUTERWORLD 7-8/2022, Martin Heller, str. 32-33

Ideálním případem pro velmi velké datové sady je vytvoření modelů tam, kde jsou data, takže není potřebné je nikam přesouvat. Které databáze interně podporují strojové učení? První databází je Amazon Redshift. Jedná se o spravovanou službu datového skladu petabajtové kategorie, která je navržená pro usnadnění a zlevnění analýzy všech dat pomocí existujících nástrojů Business Intelligence. Redshift ML využívá SageMaker Autopilot k automatickému vytvoření predikčních modelů z dat specifikovaných v příkazu SQL a následně extrahovaných do bucketu S3. Druhou databází je BlazingSQL. BlazingSQL dokáže spouštět dotazy akcelerované pomocí GPU pro datová jezera ve službě Amazon S3, předat výsledné Data Frames pro manipulaci s daty a nakonec použít strojové učení. Třetí databáze je Google Cloud BigQuery. BigQuery ML přináší velkou část výkonu platformy Google Cloud ML do datového skladu BigQuery pomocí syntaxe SQL bez extrahování dat z datového skladu. Čtvrtou databází je IBM Db2 Warehouse. Tato databáze obsahuje širokou řadu in-database SQL analýz, která zahrnuje některé základní funkce strojového učení a in-database podporu pro jazyky R a Python. Pátou databází je Kinetica. Kinetica poskytuje řešení celého životního cyklu in-database pro strojové učení akcelerované pomocí GPU s možností výpočtů pro streamovaná data. Šestou databází je Microsoft SQL Server. Aktuální verze SQL Serveru mohou trénovat a využívat modely strojového učení ve více programovacích jazycích. Sedmou databází je Oracle database. Oracle Cloud Infrastructure může hostit zdroje datové vědy integrované pomocí datového skladu, úložiště objektů a funkcí a umožňuje také celý životní cyklus vývoje modelu. Osmou databází je Vertica. Vertica má pěknou vestavěnou sadu algoritmů strojového učení a dokáže importovat modely TensorFlow a PMML. Predikci může vykonávat z importovaných modelů i z modelů vlastních. Devátou databází je MindsDB. Tato databáze přináší užitečné schopnosti ML pro řadu databází, které postrádají vestavěnou podporu strojového učení.

Blockchain pro blockchain

COMPUTERWORLD 09/2022, David Slouka, str. 10-11

NFT neboli Non-Fungible Tokeny slouží hlavně potřebám investorů a startupů. Idea je, že zákazník si koupí jakýsi certifikát uložený v blockchainu o tom, že si zakoupil digitální soubor. Ale to je zároveň všechno k čemu NFT slouží. Zákazník za ně nedostane nic. Zákazník nemá copyright, žádné duševní vlastnictví, nemůže zabránit šíření díla ani tvorbě nových NFT na stejný soubor, který bude autor prodávat. Zákazník si ve své podstatě kupuje certifikát o nákupu odkazu na digitální dílo. Dávalo by smysl digitální umění sdružovat pod jednu škatulku a umožnit snadnou směnu, převod a případně i třeba výměnu za reálné peníze. Dříve si lidé kupovali kartičky hokejistů, fotbalistů a dalších sportovců běžně, něco podobného by mohlo vzniknout z NFT.V dnešní době experimentuje s NFT sportovní odvětví. Mluví se o prodeji digitálních materiálů, jako jsou odkazy na videa, fotografie a příspěvky, které lidé pořídí o perspektivních sportovcích, možná budoucí hvězdách, a o tom, jak by tyto digitální materiály mohly nabýt na hodnotě. Tento princip by se dal využít i u lístků, kdyby bylo možné si zakoupit jako digitální památku, třeba i s krátkým videem. Celý koncept NFC přináší mnoho otazníků, a pouze budoucnost odhalí, jak celý dopadne.

Hyperkonvergovaná infrastruktura: Strategie pro výběr i nákup

COMPUTERWORLD 09/2022, Jeff Rochlin, str. 21-25

Tradiční datové centrum je postaveno na třívrstvé infrastruktuře s diskrétními bloky výpočetních úložných a síťových prostředků přidělovaných pro konkrétní aplikace. V hyperkonvergované infrastruktuře se tyto tři vrstvy kombinují do jediného stavebního bloku nazývaného uzel. Dohromady se může seskupit více uzlů, které potom vytvoří pool, neboli fond prostředku, který lze spravovat prostřednictvím softwarové vrstvy. Konfiguraci lze zajistit za provozu prostřednictvím snadno přístupného rozhraní, které umožní vytvořit a škálovat firemní řešení. Výsledkem je, že celou strukturu lze lépe využít. Hyperkonvergovaná infrastruktura kombinuje úložiště, výpočetní prostředky a sítě do jednoho systému, aby se snížila složitost a zefektivnilo nasazení napříč datovými centry, vzdálenými pobočkami a lokalitami edge computingu. Při výběru platformy je důležité zvážit problémy, jako jsou kompatibilita se starší infrastrukturou, limit a škálovatelnosti a podpora cloudových propojení. Každý uzel HCI zahrnuje výpočetní, úložné a síťové prostředky neboli balíčkované uzly, které jsou stavebními bloky infrastruktury. Kupující si mohou zvolit určité konfigurace například koupit uzly nakonfigurované výhradně vysoce výkonnými disky SSD nebo si zvolit GPU pro uspokojení specifických požadavků na pracovní zátěže. Jednou z výhod zařízení je, že si lze zvolit již připravený, plně integrovaný a výkonnostně vyladěný hardware. Nevýhody tohoto přístupu mohou zahrnovat připoutání k dodavateli a možné potíže s integrací existujících komponent datových center. Stavební bloky HCI jsou uzly s výpočetní, úložnou a síťovou kapacitou, které využívají virtualizaci pro konfiguraci a orchestrační vrstvu, aby umožnily administrátorům svou správu jako jeden fond prostředků. Je důležité pochopit minimální požadavky a maximální velikost těchto stavebních bloků, aby bylo možné posoudit náklady na budoucí růst. Některé uzly jsou omezené na konkrétní typ úložiště. Dalším problémem při rozšiřování HCI je režie. Vrstvy softwaru, které obsahují hardware a umožňují fungování HCI, je nutné zohlednit při plánování kapacit rozšiřování. Také je dobré si ověřit jaké jsou horní limity kapacity orchestračního softwaru. Důležitým aspektem HC je, zda orchestrační vrstva dodavatele dokáže podporovat složitost, která vzniká v důsledku nesourodě nakonfigurovaného hardwaru. Pochopení toho, jak orchestrační vrstva v jednotlivých zařízeních funguje, může mít při migraci na HCI velký význam. Při posuzování platforem HCI a zvažování investičních priorit je dobré také zohlednit to, zda spolupracuje HCI nativně se službami veřejného cloudu, jaké jsou vestavěné funkce redundance a obnovení po havárii, jak mohou zálohovat zařízení a SaaS fungovat uvnitř HCI, jaké další funkce úložiště jsou vestavěné v HCI, jak se zvládají specifické požadavky na vysoký výkon a jak bude fungovat podpora produktu. Díky HCI je firma schopna rychle splnit požadavky na server pomocí známých nástrojů, zkrátit čas potřebný ke zprovoznění aplikací online a snížit požadavky na údržbu přidání flexibility. HCI by ale nemělo zvyšovat složitost na druhém konci. Hyperkonvergovaná infrastruktura by měla sloužit firemním potřebám. V současné době je zárukou v budoucím firemním růstu. Mezi přední dodavatele těchto infrastruktur patří Cisco Dell EMC, HPE, Scale computing, Pivot3 nebo NetApp.

MPLS: Proč se stále používá?

COMPUTERWORLD 9/2022, Josh Fruhlinger, str. 26-28

Multi-Protocol Label Switching je síťová technologie, kterou využívali podnikové sítě desítky let. Narozdíl od jiných síťových protokolu, které směřují provoz na základě zdrojové a cílové adresy, směřuje MPLS provoz na podstatě předem stanovených štítků neboli nálepek. Firmy využívají MPLS k propojení vzdálených pracovišť s potřebou přístupu k datům nebo aplikacím umístěným v datovém centru nebo sídle. V případě MPLS je paket v okamžiku vstupu do sítě označený přidáním krátké posloupnosti bitů odpovídající konkrétní předávací třídě služby také známé jako třída ekvivalence pro předávání. Klíčovým architektonickým aspektem je, že štítky poskytují způsob, jak připojit další informace ke každému paketu nad rámec toho, s čím dříve museli směrovače pracovat. Jednou z klíčových výhod MPLS je to, že odděluje mechanismy pro předávání od nosné služby linkové vrstvy. Cesty LSP jsou jednosměrné, Což znamená že provoz směrem zpět se zasílá přes jinou cestu LSP. Štítek MPLS se skládá ze čtyř částí, kterými jsou samotný štítek, experimentální část, bottom-of-stack a time-to-live. Pokud firmy přecházejí do cloudu, začne být hvězdicový model založený na MPLS neefektivní. Softwarově definované sítě WAN jsou navržené s ohledem na připojení do cloudu, což je důvod proč tolik firem nahrazuje nebo rozšiřuje své sítě MPLS pomocí SD-WAN. SD-WAN je výrazně levnější než MPLS a je to vrstva nezávislá na transportu, která dokáže směrovat libovolný typ provozu a to včetně MPLS. Malé a středně velké podniky MPLS opouští. Velké podniky ale MPLS udržují z důvodu nákladů. V budoucnu budou preferovat hybridní řešení, při kterém budou udržovat MPLS pro starší aplikace provozované v síti a internetový provoz a přístup do cloudu přesunou do řešení SD-WAN. MPLS tedy bude nadále plnit úlohu propojení mezi konkrétními místy, jako jsou velké regionální kanceláře, budovy maloobchodu s pokladnami nebo regionální výrobní provozy.

Jaké největší výzvy čekají firmy při zabezpečení cloudu

IT Systems 7-8/2022, Petr Kovalčík, str. 48-49

V cloudových prostředích běží kritické podnikové aplikace a jsou v nich uložena citlivá firemní i zákaznická data. Cloudové aplikace musí být chráněny proti útokům a data zabezpečena v souladu s předpisy před neoprávněným přístupem. Cloudová prostředí se ale od on-premise infrastruktury výrazně liší, takže tradiční bezpečnostní nástroje a přístupy nejsou vždy dostatečně efektivní. V důsledku toho se mnoho organizací potýká s problémy při zabezpečení nově nasazované cloudové infrastruktury. Jakým výzvám firmy čelí? První výzvou je multicloudové prostředí. V takovém prostředí je náročné správně chránit data v souladu s firemními zásadami a regulačními požadavky. Různá prostředí mají různé bezpečnostní kontroly a nástroje, což ztěžuje jednotné a zabezpečení. Společnosti také nemají dostatečné zkušenosti potřebné k nasazení konzistentní správy zabezpečení multicloudových prostředí. Druhou výzvou jsou poskytovatelé cloudu. Mnoho společností využívá dva nebo více poskytovatelů cloudových služeb. V takové situaci je složité prostředí důsledně monitorovat a zabezpečit. Komplexnost zabezpečení multicloudových prostředí může ztížit dosažení primárních bezpečnostních cílů, jako jsou prevence chybné konfigurace, zabezpečení již používaných cloudových aplikací, dodržování shody s předpisy a obrana proti malwaru. Třetí výzvou je automatizace a orchestrace. Organizace používají nejrůznější nástroje, které jim pomáhají implementovat bezpečnostní kontroly a procesy jako je infrastruktura jako kód, bezserverové technologie, pluginy pro kontinuální integraci a doručování nebo nástroje pro orchestraci, automatizaci a reakci. Čtvrtou výzvou je DevOps cyklus. Začlenění bezpečnosti do raných fázích životního cyklu vývoje softwaru může výrazně snížit náklady a dopady zranitelností nebo kódu který porušuje požadavky na dodržování předpisů. Organizace implementují zabezpečení a shody s předpisy DevOps do různých fází SDLC. Pátou výzvou je provozní zabezpečení. Mezi největší bezpečnostní výzvy, kterým organizace čelí, patří nedostatek kvalifikovaného personálu, dodržování předpisů, nedostatečný přehled o zabezpečení infrastruktury, problémy při odhalování chybné konfigurace, nastavení konzistentních bezpečnostních politik, automatizace zabezpečení cloudu a automatizované vynucení bezpečnosti. Šestou výzvou je dodržování předpisů v cloudu. Mezi největší výzvy, kterým organizaci v oblasti dodržování předpisů v cloudu čelí, patří nedostatek znalostí a odbornosti, měnící se prostředí, složité audity, monitorování dodržování předpisů, měnící se požadavky, správa zranitelností v cloudu a automatizace dodržování shody s předpisy.

Co mají společného cloudová agilita a transformace automobilového průmyslu?

IT Systems 9/2022, David Zeman, str. 23

Podniky z odvětví automotive musí být schopny v současné době rychle reagovat, měnit zdroje a alokovat prostředky na nově vznikající priority. Proto se agilita musí stát celopodnikovou strategií, která začíná na vrcholu organizace a je aplikována směrem dolů. Které oblasti tlačí na větší agilitu? Jedná se o inovaci produktů. Dopad transformačního konceptu CASE (propojené, autonomní, sdílené a elektrifikované) ovlivňuje celé odvětví, které musí držet krok s konstrukčními a provozními změnami a se stále se zkracujícím životním cyklem výrobků. Další oblastí je spolupráce. Sdílení nápadů, návrhů, výkresů CAD a změnových řízení v rámci celého podniku vyžaduje výkonné nástroje pro spolupráci a digitální platformy. Další oblastí jsou zkušenosti zákazníků. Uživatelský zážitek prošel zásadní proměnou, i vozy nižší a střední cenové kategorie jsou nyní vybaveny rostoucí škálou nadstandardních prvků. Spolu s rostoucí komplexností elektronických systémů vyžadují mnohem vyšší úroveň obchodní flexibility a odpovídající agilnější technologická řešení. Další oblastí je odolnost dodavatelského řetězce. Výrobci a dodavatelé se snaží najít novou rovnováhu mezi dostupností lokálních nebo regionálních zdrojů a finančními a množstevními výhodami globálně distribuovaného dodavatelského řetězce. Poslední oblastí je vývoj a výroba na zakázku. Pro subdodavatele je klíčové, aby si osvojili výrobní procesy ve smíšeném režimu a byli schopni více spolupracovat se zákazníky na specifikacích a konstrukčních detailech. Přijetí pokročilých, předkonfigurovaných moderních řešení nasazených v cloudu pomůže společnostem rychle reagovat na nové výzvy, a dokonce je předvídat, jakmile se objeví. Vysoce agilní, odvětvově-specifická ERP řešení a další cloudové technologie podnikových procesů pomáhají automobilovým společnostem správně reagovat na změny v dynamicky se měnícím světě.

8 tipů pro budování vyspělých platforem Big Data

IT Systems 9/2022, Dagmar Bínová, str. 40-41

Databáze jsou typicky klasifikované jako relační (SQL) nebo noSQL, transakční (OLTP) nebo hybridní (HTAP). Pokusy o vytvoření jednotných databází pro všechna data v rámci podniku se označují jako datová jezera (data lakes), pokud se data ponechají v původním formátu nebo jako datové sklady, jestliže se údaje převedou do společného formátu a schématu. Podmnožiny datového skladu se pak nazývají datová tržiště (data mart). Datový sklad je tady analytická databáze obvykle relační, která je vytvořena ze dvou nebo více zdrojů dat, obvykle určená pro ukládání historických dat, jež mohou dosahovat objemu velikosti petabajtů. Datový sklad se využívá kvůli tomu, že jakmile se do něj data zkopírují, lze pro dobrý výkon analytických dotazů indexovat vše co firmu v datovém skladu zajímá, aniž to ovlivní výkon zápisu databáze OLTP. Dalším důvodem k použití podnikových datových skladů je umožnění spojení dat z více zdrojů pro analýzu. Jaký je rozdíl mezi datovým skladem datovým jezerem a datovým tržištěm? Datová jezera, která ukládají soubory dat v nativním formátu jsou v podstatě schéma při čtení, což znamená, že jakákoli aplikace, která čte data z jezera si bude muset zavést vlastní typy data vztahy mezi těmito daty. Datové sklady naopak představují schéma při zápisu, což znamená, že datové typy, indexy a vztahy jsou zavedené už datech tak, jak jsou uložená v EDW. Datové sklady obsahují celopodniková data, zatímco datová tržiště zahrnují data orientovaná na konkrétní firemní záležitosti. Datová tržiště mohou být na datovém skladu závislá, nezávislá nebo mohou být hybridem obou zmíněných variant. Jaká je vhodná architektura datového skladu? Obecná architektura se skládá ze zdrojových dat, staging databáze, nástroje ETL nebo ELT, fyzického úložiště a nástroje pro prezentaci dat. Každá vrstva slouží jinému účelu. Je lepší mít datový sklad v cloudu nebo ve vlastní infrastruktuře? V současné době je trendem přesunout vše nebo alespoň část datového skladu do cloudu, aby se využila inherentní škálovatelnost prostředí a snadnost připojení k dalším cloudovým službám. Nevýhodou přesunu petabajtů dat do cloudu jsou provozní náklady. Existují dva hlavní přístupy jak navrhnout datový sklad a to návrh datového skladu shora a návrh datového skladu zdola nahoru. V konečném důsledku všechna rozhodnutí spojená s podnikovými datovými sklady závisejí na konkrétním cíli společnosti jejich prostředcích a rozpočtu.