Big Data kvality a ich využitie pri validácii a obohacovaní existujúcich dát

110

nitrogen_logoAj Vám sa zdá zvláštne ručné spracovávanie a vyhľadávanie informácií o publikáciách a ich citovanosti v rámci vedeckých inštitúcií v 21. storočí?

Výskumné inštitúcie sú financované najmä formou grantov, prideľovaných zväčša ministerstvom školstva SR. Veľkosť prideleného grantu je determinovaná množstvom a kvalitou výskumnej činnosti, ktorú inštitúcia preukázateľne vykonala. Záznamy o uverejnených publikáciách a o ich citovanosti inými publikáciami sa nachádzajú v citačných indexoch, akými sú napríklad Web Of Science (WOS), Elsevier Scopus alebo Google Scholar.

Počet ohlasov na publikované diela je základným ukazovateľom kvality výskumnej a publikačnej činnosti, keďže praktický prínos publikácie tkvie v užitočnosti využitia v nej obsiahnutých poznatkov. Ak však výskumné inštitúcie chcú získavať informácie o citovanosti nimi publikovaných diel, nemajú v súčasnosti inú možnosť, ako manuálne kontrolovať tento stav vo viacerých citačných indexoch.

Takýto postup je nielen zdĺhavý, ale zároveň oberá výskumných pracovníkov o čas, ktorý môžu venovať z hľadiska výskumu dôležitejším činnostiam. Preto sme navrhli a vytvorili systém, ktorý automatizuje proces získavania a evidencie ohlasov.

Systém je prepojený s viacerými citačnými indexami a prístup k ďalším indexom je, vďaka jeho modulárnemu návrhu, možné kedykoľvek pridávať. Systém umožňuje automatizovane vyhľadať, prevziať a evidovať záznamy publikačnej činnosti ako aj ohlasy na ne z vybraných citačných indexov pre konkrétneho vedca, ale aj pre inštitúciu ako celok.

Jeden pracovník inštitúcie tak dokáže zadaním príkazu na plánovanú synchronizáciu záznamov o citovanosti, získať podklady pre hodnotenie všetkých ostatných pracovníkov inštitúcie. Tie budú od toho momentu pravidelne automaticky aktualizované a vedecký pracovníci budú o nových citáciach informovaní prostredníctvom notifikácií.

Ďalším prínosom systému je jeho lokálna databáza. Tá je nielen centrálnym úložiskom informácií z viacerých citačných indexov, ale jej prepojením s ďalšími systémami a operáciami nad takto agregovanými dátami, vieme získavať nové hodnotiace ukazovatele, ktoré sú relevantné z pohľadu konkrétnej inštitúcie, či vedného odboru, regiónu a pod.

screen1Používateľ má k dispozícii prehľadné webové rozhranie pomocou ktorého má okamžite prístup k informáciám o svojich publikáciách a ich citovanosti. Môže si tu tiež pridávať nové zdroje, ktoré majú byť pridané do automatických kontrol. Všetka funkcionalita je tiež dostupná prostredníctvom štandardných webových služieb, ktoré je možné integrovať do knižnično-informačných systémov, pretože tieto zo zákona spracovávajú evidenciu publikačnej činnosti, ale aj do iných systémov.

screen2

Projekt nemá na Slovensku fungujúcu obdobu. Získavanie informácií o citovanosti diel a hodnotiacich faktorov sa vykonáva len manuálne a náš systém výskumníkov od tejto činnosť odbremeňuje. Systém je dynamickou aplikáciou. Na základe centrálnej konfigurácie je vyskladávaný dynamický servlet, ktorého štruktúre sa prispôsobuje aj štruktúra databázy. V neposlednom rade sa zmena v konfigurácii premietne aj do množiny selekčných prvkov rozhrania.

Automatizáciou získavania ohlasov udržiavame ich zoznam v aktuálnom stave a po pribudnutí záznamu do množiny ohlasov notifikujeme autora publikácie.
Citačné indexy poskytujú pre komunikáciu rôzne aplikačné rozhrania. Náš systém tvorí nadstavbu nad nimi a ponúka jednotné REST rozhranie pre prístup k ich funkcionalite.

Na projekte sa podieľa momentálne pod vedením Ing. Nadeždy Andrejčíkovej, PhD. tím Nitrogen Family v zložení: Martin Cibula, Marek Černák, Vladimír Demčák, Ján Krivý, Jozef Melko a Martin Šustek.

TP_team15

Dobrý článok? Chceš dostávať ďalšie?

Už viac ako 4 200 z vás dostáva správy e-mailom. Nemusíš sa báť, nie každé ráno. Len občasne.

Tvoj email neposkytneme 3tím stranám. Posielame naňho len informácie z robime.it. Kedykoľvek sa môžete odhlásiť.