Na vytvorenie akéhokoľvek grafu vo vizualizačnom nástroji ako je napríklad Qlick či Tableau si treba ujasniť čo je dimenzia (dimension) a čo je mežúra (measure). Priznám sa, že na začiatku sa mi tieto definície plietli a nevedela som rozlíšiť čo je čo. Pritom to vôbec nie je zložité 🙂 Pripravila som si rýchle pomôcky k tomu, zistiť čo dať do kolonky Dimension a čo do kolonky Measure.
Na začiatku vytvárania grafu si položte otázku ČO chcete zobraziť. Sú to predaje? Zisky, náklady? Alebo výkonnosť podniku? Toto všetko sú measures.
Ďalšia otázka by mala byť AKO chcem túto mežúru kalkulovať (per what?). Mesačne, ročne? Na jedného zákazníka alebo dodávateľa? To budú dimenzie.
Ideálny príklad je nasledovný. Chcem zobraziť predaje na mesačnej báze. Predaje budú measures a mesiace budú dimenzie. A graf by mohol vyzerať nejako takto:
Databáza, ktorú idete vizualizovať pozostáva z veľkého počtu záznamov, ktoré v sebe nesú určitú informáciu. Mežúra je vlastne kalkulácia týchto záznamov, ktorej výsledkom je jedno konkrétne číslo. Tento typ kalkulácie sa volá agregácia, v ľudskej reči Sum(), Count(), Min(), Max() sú všetko agregácie a teda mežúry.
Dimenzie narozdiel od mežúr sú deskriptívne atribúty, teda textové polia (dni, mesiace, typ produktu) či diskrétne čísla (ID).
Pomôcka pre nadšencov SQL
Ak máte skúsenosti s SQL, mám pre vás nasledujúci hint – to čo si viete dať do príkazu GROUP BY alebo ORDER BY budú dimenzie a spomínané agregácie sú mežúry.
Verím, že vám tento ťaháčik pomôže rýchlejšie sa rozhodnúť pri definovaní atribútov pri vytváraní dátovej vizualizácii 🙂