Webový portál OpenScience – pre otvorené dáta

161

DataScienceContentBannerDatasety sú kľúčové hodnotiace faktory metód používaných pri výskumoch. Problém korektného porovnávania výsledkov experimentov s iným experimentom podobného typu si mnohokrát vyžaduje použitie rovnakých experimentálnych dát. Často to však nie je jednoduché, pretože datasety nie sú v rámci vedeckej obce jednoducho dostupné. Ich verejné zdieľanie je tak dôležitou súčasťou vedeckých výskumov, umožňujúcou lepšiu verifikáciu a rýchlejšie napredovanie výskumov.

Tí z vás, ktorí mali šťastie venovať sa nejakému výskumu, sa už možno dostali do situácie, kedy potrebovali získať dataset potrebný pre ich prácu, ale nekonečné „googlenie“ prinieslo len množstvo neprehľadných stránok alebo datasetov s nekompletnými informáciami. Stránky poskytujúce datasety sú často špecializované na konkrétne vedecké smery. Ak aj nájdete takú, ktorá by mohla obsahovať vhodné dáta, čaká vás únavné klikanie a manuálne prezeranie množstva informácií, pretože nie je dostupné efektívne vyhľadávanie medzi datasetmi. Nájdené datasety často nemajú uvedených autorov, citácie alebo iné potenciálne potrebné informácie a teda nepôsobia práve dôveryhodne.detail_2

A čo v prípade ak ste vy sami autormi niečoho, čo chcete poskytnúť svetu? Väčšina stránok uchovávajúcich datasety poskytuje len súkromné úložiská, alebo je takpovediac uzavretá, a zdieľať na nej dataset by znamenalo zdĺhavé kontaktovanie jej správcov a požiadanie ich, či by mohli uverejniť váš výtvor. Dobre, prínos pre vedeckú komunitu stojí za tú námahu. Ale čo v prípade, že potrebujete pozmeniť informácie o datasete alebo ho z nejakého dôvodu kompletne odstrániť?  Jediná možnosť je znova kontaktovať správcov a dúfať v ich ochotu. A tu sa znova vraciame k problému, že náš dataset pravdepodobne nájde len hŕstka ľudí, polovica z nich omylom.

Preto sme sa rozhodli vytvoriť webový portál OpenScience, ktorého cieľom je vyriešiť spomínané problémy. Portál umožňuje verejné zdieľanie datasetov a poskytuje:

  • rôzne druhy datasetov zoskupených na jednom mieste a dostupných pre každého;
  • po rýchlej a jednoduchej registrácii môže používateľ nahrať dataset s potrebnými informáciami. Ten je dostupný každému, kto ho potrebuje;
  • prehľad všetkých datasetov, ktoré používateľ nahral na jednom mieste;
  • možnosť autorovi kedykoľvek jednoducho zmeniť informácie o datasete, alebo dataset z portálu odstrániť;
  • jednoduché a intuitívne vyhľadávanie na základe názvu, tagov, autorov alebo obsahu opisu datasetu a jeho stiahnutie, bez potreby registrácie;
  • základné informácie o datasetoch;
  • možnosť kontaktovať autora datasetu;
  • pre registrovaných používateľov možnosť pridávania citácií a hodnotenia datasetov, čo poskytuje informácie o jeho kvalite a relevantnosti a slúži ako spätná väzba pre autora.

Portál je dostupný na akomkoľvek zariadení a používa cloud technológie od spoločnosti Google, ktoré sú zárukou stability a rozšíriteľnosti. Má potenciál zjednodušiť prístup k datasetom a podporiť kolaboráciu v rámci vedeckej obce, či už na fakulte alebo globálne. Výskumníci môžu navzájom porovnávať a zdieľať získané dáta, čo urýchli výskum a potenciálne zvýši jeho kvalitu. S tým súvisí aj zníženie vytvárania redundantných dát, čo ušetrí nielen čas, ale aj finančné prostriedky.

Screenshot (32)

Pod hlavičkou Petra Lacka sa zišiel tím siedmich študentov – Helmt Posch, Martin Žalondek, Milan Gajdoš, Michal Palatinus, Richard Belan, Tomáš Chovaňák, ktorý sa môže ako jeden z mála na fakulte pýšiť ženským zastúpením – Rania Daabousová.

Dobrý článok? Chceš dostávať ďalšie?

Už viac ako 4 200 z vás dostáva správy e-mailom. Nemusíš sa báť, nie každé ráno. Len občasne.

Tvoj email neposkytneme 3tím stranám. Posielame naňho len informácie z robime.it. Kedykoľvek sa môžete odhlásiť.