Problémová oblasť
Verejné dáta sú zdrojom cenných informácií, avšak udržiavať ich a sprístupňovať verejnosti je náročná úloha. Často nie sú prístupné, sú ukladané v nevyhovujúcich formátoch a informácie, ktoré z nich dokážeme získať, sú obmedzené.
Riešením je jednoduchý a automatizovaný proces nahrávania verejných datasetov, ich validácia a sprístupnenie cez internet v upravenej, strojovo čitateľnej podobe. Program, s ktorým by dokázala pracovať väčšina úradníkov, ktorý by vedel čítať dáta z rôznych formátov a transformovať ich na požadované, strojovo čitateľné dáta. Riešením tohto problému sa môže stať práve projekt Inteligentného importéra verejných datasetov.
Ponúkané riešenie
Inteligentný importér verejných datasetov je webová aplikácia, ktorú vyvíjame vrámci tímového projektu na Fakulte informatiky a informačných technológií, s cieľom zlepšiť webové služby verejnej správy a umožniť automatizovaný import, validáciu, transformáciu a sprístupnenie verejných datasetov.
Importér je dostupný cez webový prehliadač (data-importer.sk). Je dizajnovaný podľa jednotného dizajn manuálu elektronických služieb verejnej správy a má jednoduché a zrozumiteľné používateľské rozhranie. Používateľ-úradník si doň nahrá ľubovoľný dataset, ktorý chce zverejniť, a aplikácia mu ho uloží do databázy a pripraví ho na validáciu a transformáciu do požadovaného formátu.
Pri stanovení, o aké dáta sa jedná, používame umelú inteligenciu, aby pomohla identifikovať obsiahnuté dátové typy pomocou natrénovaných modelov na rozpoznávanie jednotlivých tried dát. Všetky možné akceptovateľné dátové entity sú popísané v Centrálnom modeli údajov verejnej správy, na ktorý sa aj výstupné formáty z Importéra odkazujú. Importér tým vytvára vzťahy medzi Centrálnym modelom a každým jedným importovaným súborom a riadkom dát v ňom. Aplikácia prirodzene umožňuje prístup ku všetkým nahratým datasetom, v ich pôvodnom formáte aj transformovanom.
Cieľom tohto projektu je teda nielen umožniť jednoduchší a inteligentnejší import verejných dát, ale aj ich sprístupnenie v otvorenom, strojovo čitateľnom formáte. Výstupné dáta sú štruktúrované a môžu byť ľahko použiteľné na rýchle automatizované vyhľadávanie či objavovanie skrytých znalostí a vzťahov medzi nimi, čo by v bežných neštruktúrovaných formátoch bolo takmer nemožné.
O nás
Tento projekt vznikol na pôde Fakulty informatiky a informačných technológií Slovenskej technickej univerzity v Bratislave a je aktuálne vo fáze vývoja pod tímom MI16, ktorého členmi sú študenti inžinierskeho štúdia: Adam Talian, Milan Vaško, Jana Vrabľová, Filip Varga, Ladislav Bari a Adam Ševčík. Vedúcim a zakladateľom tohto projektu je Ing. Jakub Śimko, PhD. Projekt je vytváraný v spolupráci s Úradom podpredsedu vlády pre investície a informatizáciu.