Blog otvorenesudy.sk z pohľadu IT

otvorenesudy.sk z pohľadu IT

Prednedávnom prebehla v tlači informácia o dvoch mladých študentoch, ktorí v rámci projektu otvorenesudy.sk sprístupnili na jednom mieste dáta, ktoré umožňujú sledovať prácu slovenských súdov a sudcov. Autori projektu Samo Molnár a Pavol Zbell nám poskytli krátky rozhovor. Pokiaľ vás zaujímajú ďalšie informácie k projektu, napíšte nám svoje otázky v komentároch. 

Povedzte nám pár slov o sebe. Kto vlastne ste?

Sme študenti a úspešní absolventi bakalárskeho štúdia na FIIT STU, členovia výskumnej skupiny PeWe a víťazi prvého ročníka súťaže ReŠtart Slovensko. Informatike a programovaniu sa venujeme už viac ako 7 rokov.

Za ten čas sme vyskúšali viacero programovacích jazykov, z ktorých sa nam v súčasnosti najviac pozdáva práve Ruby. Prvú skúsenosť s Ruby a Ruby on Rails sme získali v rámci výskumného seminára na našej fakulte, kde sme sa aj po prvýkrát dostali k projektom, ktoré predpokladajú spracovanie vačšieho objemu dát.

Ako ste sa, ako študenti, dostali k projektu otvorenesudy.sk?

Približne pred rokom sme si so záujmom robili prehľad o tom, aké dáta okrem zmlúv a tendrov zverejňujú portály ministerstiev. Zaujala nás stránka ministerstva spravodlivosti, ktorá pred rokom ponúkala vyše 300 000 súdnych rozhodnutí (dnes je to viac ako 650 000), ale ako to už so štátnymi portálmi býva, vôbec nefungovala tak ako by ste očakávali.

Súčasne sme si všimli, že Centrum pre filantropiu organizuje projekt ReŠtart Slovensko na tému podpory právneho štátu. Rozhodli sme sa preto projekt do ReŠtartu prihlásiť s cieľom zlepšiť prístup, organizáciu a vyhľadávanie v dátach, ktoré ponúka portál ministerstva spravodlivosti.

S trochou šťastia sme ReŠtart vyhrali a krátko na to nás oslovilo Transparency International Slovensko s ponukou spolupráce na projekte. Spolu s Transparency sme pridali dalšie zdroje dát, vytvorili sme zaujímavé indikátory o fungovaní súdov a práce sudcov a posunuli sme celý projekt o veľký kus vpred.

Ako by ste popísali architektúru riešenia?

Prezentácii súdnych rozhodnutí, pojednávaní a základých informácií o sudcoch a súdoch na portáli predchádza sťahovanie a spracovanie dát zo stránky justice.gov.sk, ktoré sa pravidelne opakuje.

Spracovanie dát zahŕňa ich prečistenie, normalizáciu, prepojenie, uloženie do databázy a indexovanie vyhľadávacím strojom. Štatistické výkazy sudcov a dalšie zaujímavé dáta máme predspracované a do databázy ich nahrávame pomocou jednoduchých skriptov.

Na akých technológiách je riešenie postavené?

Aplikácia je postavená na frameworku Ruby on Rails. Databázovú vrstvu tvorí PostgreSQL, ktoré kŕmi vyhľadávací stroj ElasticSearch. Na spracovanie nových dát a na rôzne procesy na pozadí používame knižnicu Resque. Dizajn portálu sme realizovali pomocou frameworku Bootstrap. Ako webový server sme zvolili Nginx. Na správu zdrojových kódov projektu používame git, pričom naše repozitáre sú verejne dostupné na https://github.com/otvorenesudy ako Open Source.

S čím ste najviac bojovali počas realizácie projektu?

Z hľadiska dostupnosti otvorených dát – s úradmi, ministerstvami a s pomalými servermi portálu justice.gov.sk, ktoré si mnohokrát dávali načas a posielali odozvy rádovo v minútach, čomu sme, bohužial, museli prispôsobovať celkovú architektúru sťahovania dát.

Z hľadiska samotných dát – prevažne s chýbajúcimi alebo nesprávnymi hodnotami, ale predovšetkým s identifikovaním a párovaním mien sudcov a VSÚ (vyšších súdnych úradníkov).

Ak by ste tento projekt robili ešte raz, čo by ste spravili inak?

Určite by sme sa sústredili na menšiu vzorku dát, pretože v projekte spájame zhruba 10 rôzne štruktúrovaných typov dát zo 4 rôznych zdrojov. Pri návrhu sme neuvažovali nad takým množstvom a rôznorodosťou dát, čo spôsobilo nárast komplexnosti projektu.

Aké pokračovania čakajú projekt? Čo plánujete do budúcnosti?

Momentálne sa chceme sústrediť na vylepšovanie existujúcej funkcionality. Chceme modularizovať a zgeneralizovať riešenie sťahovania dát, aby iní na ňom mohli stavať vo svojich projektoch. V budúcnosti sa chceme zamerať skôr na zaujímavé vizualizácie a grafy z viac ako 400 GB surových dát, ktoré máme spracované.

Foto: Samo Molnár a Pavol Zbell (zľava doprava)

Pokiaľ vás zaujímajú ďalšie informácie k projektu, napíšte nám svoje otázky v komentároch.


Dobrý článok? Chceš dostávať ďalšie?

Už viac ako 6 200 ITečkárov dostáva správy e-mailom. Nemusíš sa báť, nie každé ráno. Len občasne.



Súhlasím so spracovaním mojich osobných údajov. ( Viac informácií. )

Tvoj email neposkytneme 3tím stranám. Posielame naňho len informácie z robime.it. Kedykoľvek sa môžeš odhlásiť.

DevOps Enginner / Online Bezpečnosť

Pre IT spoločnosť, ktorá sa venuje online bezpečnosti hľadáme do tímu DevOps Medior Engineer. Spoločnosť má 20-členný tím s...

Senior Java Consultant

Hľadáš, kam by si sa posunul? Možno ťa táto práca zaujme. Ide o Senior JAVA konzultanta v nadnárodnej IT...

Ruby on Rails Junior-Medior Developer / REMOTE

Je tvoj život príliš v “koľajniciach”? Urob si odbočku a skús sa pridať do tímu Ruby on Rails developerov.Ide...

JS Sencha Senior Developer / Homeoffice

Máš rád svoju slobodu, pracuješ na projektoch, ideálne remote? Pre medzinárodnú softwarovú spoločnosť hľadáme JS Sencha Developera.Po dvoch týždňoch...

Junior Angular Developer / REMOTE

Pre nášho partnera hľadáme ITčkára na pozíciu Angular Developer. Spoločnosť sa venuje vývoju platformy pre firmy na znižovanie nákladov...

Frontend Medior Developer

Medzinárodná IT spoločnosť, ktorá vyvíja finančný softvér.Práca je v Bratislave na TPP. Odmena sa pohybuje od 2000+ EUR.Tvoje úlohy...

.NET Core Medior Developer / REMOTE

Svoju budúcnosť máš vo svojich rukách, skús to teraz ako .NET Core developer. Ide o startup projekt, ktorý vyvíja...

GIRL ́S DAY 2020: Už po siedmy raz môžu stredoškoláčky nahliadnuť do IT firiem po celom Slovensku.

Občianske združenie Aj Ty v IT už siedmy rok prepája IT firmy a organizácie so stredoškoláčkami po...

DIGITALEUROPE: Na digitalizáciu pôjde z plánu obnovy až pätina prostriedkov. Ako zareaguje Slovensko?

Výzva v podobe zníženej globálnej konkurencieschopnosti, ako aj kríza spojená s pandémiou postavili Európu...

OpenSlava 2020 tentokrát online!

OpenSlava 2020 je 8. ročník úspešnej konferencie pre IT komunitu na Slovensku...

Čítaj ďalej:

Dobrý článok? Chceš dostávať ďalšie?

Už viac ako 6 200 ITečkárov dostáva správy e-mailom. Nemusíš sa báť, nie každé ráno. Len občasne.

Súhlasím so spracovaním mojich osobných údajov. ( Viac informácií. )

Tvoj email neposkytneme 3tím stranám. Posielame naňho len informácie z robime.it. Kedykoľvek sa môžeš odhlásiť.