Pre nedávnym časom som mal možnosť (aj vďaka portálu robíme.it) zúčastniť sa konferencie “Big Data a ako na ne“. Na konferencii sa stretli zástupcovia biznisu, ľudia z IT a tiež zopár odborníkov z akademickej sféry. Informácií o Big Data na českom a slovenskom webe je pomerne málo, preto mnohí v našich končinách chcú vedieť, kedy sa z bežných dát stáva veľké dáta a čo to reálne znamená pre český a slovenský trh. V tomto blogu zhrniem niekoľko myšlienok o Big Data, ktoré som si z konferencie odniesol.
Aj málo dát v pohybe je veľký problém
Dát nemusí byť vôíbec veľa, aby bol problém ich spracovať. Stačí trackovať vašu GPS pozíciu a na základe GPS poslať esemesku na váš mobil, keď idete okolo obchodu, kde majú váš obľúbený tovar v akcii. Aby sa postupnosť krokov vykonala v priebehu niekoľkých sekúnd, treba zosúladiť viacero systémov a nájsť tie správne dáta. A tak z malej úlohy vznikne veľký problém.
Analytika v reálnom čase poteší biznis
Ľudí z biznisu jednodňová latencia dát v DWH obmedzuje. V svete internetu pekný príklad spracovania veľkého množstva dát v reálnom čase ponúka Google Analytics. Predstava mať dáta dostupné ihneď je lákavá. Ďalší pekný príklad sa črtá v utility segmente, kde sa snaha vzorkovať spotrebu odbezných miest v niekoľko minútových intervaloch. Ukladaním dát v operačnej pamäti je analytika v reálnom čase na dosah.
Dostatok úložného priestoru pre dáta
Už nepotrebujeme šetriť miesto pri ukladaní dát. Časy, keď sa rátal každý bit, sú nenávratne preč. Nie je nevyhnutné modelovať všetky biznis prípady a namáhavo sa snažiť ich vtesnať do denormalizovaného dátového modelu. Vďaka dobrej škálovateľnosti dátových úložísk dokážeme dáta ukladať tak ako ich vidí biznis: objednávku spolu s položkami objednávky, poistnú udalosť so všetkými súvislosťami, atď. Môžeme oddelieť ukladanie dát a ich následné dopytovanie vďaka lacným úložiskám a škálovateľným technológiám.
Nový priestor pre startupy
Na prvý pohľad sa môže zdať, Big Data technológie sú určené pre veľké spoločnosti, ktoré disponujú veľkým množstvom dát. No cenovo dostupné škálovateľné technológie otvárajú dvere inovatívnym firmám, ktoré ponúknu lepšie riešenia pre existujúce problémy. Napr., celkom bežným problémom je nízka efektívnosť emailových kampaní, kde väčšina newslettrov nie je pre prijímateľov zaujímavé. Newsletter je však zaujímavý pre čitateľa, keď reflektuje aktuálne záujmy prijímateľa. A tieto záujmy je možné odhaliť analýzou statusov na sociálnych sieťach alebo príspevkov na blogoch.
Big Data ošiaľ, ako prišiel, tak odíde
Mnohí priznávajú, že Big Data aktuálne predstavuje skôr marketingový buzzword než reálnu potrebu. Vyhlásenia o zavádzaní Big Data technológií do korporácií a zvyšovaní výdavkov na Big Data vyznievajú ambiciózne, miestami skôr ako klišé. Big Data totiž nepredstavujú všeliek ani nevyhnutnosť. Technológie spadajúce pod všeobjímajúci termín Big Data si zrejme nájdu uplatnenie v organizáciach, kde prinesú reálny benefit pri plnení základných cieľov ako: zvyšovanie príjmov, znižovanie nákladov, zvyšovanie spokojnosti zákazníkov alebo znižovanie rizika. Väčšina firiem však bude naďalej používať ERP, CRM, DMS či BI bez ohľadu nato, na akom type databázy pobežia.
Zahraničné weby chrlia stovky článkov denne na tému Big Data, producenti softvéru sa predbiehajú v predstavovaní svojich moderných technológií. To však neznamená, že Big Data je jediná cesta vpred a už vôbec nie na malých trhoch ako ten slovenský alebo český. Je pravdepodobné, že budeme svedkami mnohých drahých Big Data projektov, ktoré neprinesú želaný efekt. Zároveň sa však môžeme tešiť na mnoho nových užitočných služieb, ktoré budú spájať Big Data, cloud a mobilné platformy.