otvorenesudy.sk z pohľadu IT

169

samo_paloPrednedávnom prebehla v tlači informácia o dvoch mladých študentoch, ktorí v rámci projektu otvorenesudy.sk sprístupnili na jednom mieste dáta, ktoré umožňujú sledovať prácu slovenských súdov a sudcov. Autori projektu Samo Molnár a Pavol Zbell nám poskytli krátky rozhovor. Pokiaľ vás zaujímajú ďalšie informácie k projektu, napíšte nám svoje otázky v komentároch. 

Povedzte nám pár slov o sebe. Kto vlastne ste?

Sme študenti a úspešní absolventi bakalárskeho štúdia na FIIT STU, členovia výskumnej skupiny PeWe a víťazi prvého ročníka súťaže ReŠtart Slovensko. Informatike a programovaniu sa venujeme už viac ako 7 rokov.

Za ten čas sme vyskúšali viacero programovacích jazykov, z ktorých sa nam v súčasnosti najviac pozdáva práve Ruby. Prvú skúsenosť s Ruby a Ruby on Rails sme získali v rámci výskumného seminára na našej fakulte, kde sme sa aj po prvýkrát dostali k projektom, ktoré predpokladajú spracovanie vačšieho objemu dát.

Ako ste sa, ako študenti, dostali k projektu otvorenesudy.sk?

Približne pred rokom sme si so záujmom robili prehľad o tom, aké dáta okrem zmlúv a tendrov zverejňujú portály ministerstiev. Zaujala nás stránka ministerstva spravodlivosti, ktorá pred rokom ponúkala vyše 300 000 súdnych rozhodnutí (dnes je to viac ako 650 000), ale ako to už so štátnymi portálmi býva, vôbec nefungovala tak ako by ste očakávali.

Súčasne sme si všimli, že Centrum pre filantropiu organizuje projekt ReŠtart Slovensko na tému podpory právneho štátu. Rozhodli sme sa preto projekt do ReŠtartu prihlásiť s cieľom zlepšiť prístup, organizáciu a vyhľadávanie v dátach, ktoré ponúka portál ministerstva spravodlivosti.

S trochou šťastia sme ReŠtart vyhrali a krátko na to nás oslovilo Transparency International Slovensko s ponukou spolupráce na projekte. Spolu s Transparency sme pridali dalšie zdroje dát, vytvorili sme zaujímavé indikátory o fungovaní súdov a práce sudcov a posunuli sme celý projekt o veľký kus vpred.

Ako by ste popísali architektúru riešenia?

Prezentácii súdnych rozhodnutí, pojednávaní a základých informácií o sudcoch a súdoch na portáli predchádza sťahovanie a spracovanie dát zo stránky justice.gov.sk, ktoré sa pravidelne opakuje.

Spracovanie dát zahŕňa ich prečistenie, normalizáciu, prepojenie, uloženie do databázy a indexovanie vyhľadávacím strojom. Štatistické výkazy sudcov a dalšie zaujímavé dáta máme predspracované a do databázy ich nahrávame pomocou jednoduchých skriptov.

Na akých technológiách je riešenie postavené?

Aplikácia je postavená na frameworku Ruby on Rails. Databázovú vrstvu tvorí PostgreSQL, ktoré kŕmi vyhľadávací stroj ElasticSearch. Na spracovanie nových dát a na rôzne procesy na pozadí používame knižnicu Resque. Dizajn portálu sme realizovali pomocou frameworku Bootstrap. Ako webový server sme zvolili Nginx. Na správu zdrojových kódov projektu používame git, pričom naše repozitáre sú verejne dostupné na https://github.com/otvorenesudy ako Open Source.

S čím ste najviac bojovali počas realizácie projektu?

Z hľadiska dostupnosti otvorených dát – s úradmi, ministerstvami a s pomalými servermi portálu justice.gov.sk, ktoré si mnohokrát dávali načas a posielali odozvy rádovo v minútach, čomu sme, bohužial, museli prispôsobovať celkovú architektúru sťahovania dát.

Z hľadiska samotných dát – prevažne s chýbajúcimi alebo nesprávnymi hodnotami, ale predovšetkým s identifikovaním a párovaním mien sudcov a VSÚ (vyšších súdnych úradníkov).

Ak by ste tento projekt robili ešte raz, čo by ste spravili inak?

Určite by sme sa sústredili na menšiu vzorku dát, pretože v projekte spájame zhruba 10 rôzne štruktúrovaných typov dát zo 4 rôznych zdrojov. Pri návrhu sme neuvažovali nad takým množstvom a rôznorodosťou dát, čo spôsobilo nárast komplexnosti projektu.

Aké pokračovania čakajú projekt? Čo plánujete do budúcnosti?

Momentálne sa chceme sústrediť na vylepšovanie existujúcej funkcionality. Chceme modularizovať a zgeneralizovať riešenie sťahovania dát, aby iní na ňom mohli stavať vo svojich projektoch. V budúcnosti sa chceme zamerať skôr na zaujímavé vizualizácie a grafy z viac ako 400 GB surových dát, ktoré máme spracované.

Foto: Samo Molnár a Pavol Zbell (zľava doprava)

Pokiaľ vás zaujímajú ďalšie informácie k projektu, napíšte nám svoje otázky v komentároch.

Dobrý článok? Chceš dostávať ďalšie?

Už viac ako 6 200 ITečkárov dostáva správy e-mailom. Nemusíš sa báť, nie každé ráno. Len občasne.

Súhlasím so spracovaním mojich osobných údajov. ( Viac informácií. )

Tvoj email neposkytneme 3tím stranám. Posielame naňho len informácie z robime.it. Kedykoľvek sa môžeš odhlásiť.