Neverest: Odhaľovanie skrytých vzťahov zo životopisov

220

Informačná explózia so sebou prináša aj viacero problémov. Napriek tomu, že v dnešnej dobe si nemožno sťažovať na nedostatok informácií, máme často problém nájsť to, čo práve potrebujeme. Väčšina dokumentov je totiž v neštruktúrovanej podobe a získať z nich informácie typu: kto v danom období pôsobil v určitom regióne je prakticky nemožné. Fulltextové vyhľadávanie má jeden vážny nedostatok a to, že nezohľadňuje sémantiku daných kľúčových slov.

V našom projekte sa zameriavame na spracovanie prirodzeného jazyka a stanovili sme si pomerne ambiciózny cieľ, ktorým je extrakcia štruktúrovaných dát z neštruktúrovaného textu so zachytením ich významu. Pričom zameriavať sa budeme najmä na životopisy a iné dokumenty, z ktorých budeme môcť extrahovať informácie o tom kde a kedy dané osoby študovali, prípadne pôsobili. Pokúsime sa tiež z textov získať vzťahy typu: kolega alebo spolužiak.

Našou úlohou je teda rozpoznávať, a pokiaľ to bude možné aj jednoznačne identifikovať, entity typu osoba, korporácia, geografické lokácia, datácia a zároveň identifikovať udalosť štúdium, prípadne pôsobenie a v rámci nich vzťahy medzi týmito entitami prepojiť.

Cieľom je tieto údaje uložiť v štruktúrovanej podobe tak, aby bolo možné v nich vyhľadávať a získať informáciu o tom kto a kedy v danom mieste študoval, s kým sa mohol poznať a vytvárať tak aj virtuálne komunity napr. pre určité zameranie.

Čím je náš projekt výnimočný?

V súčasnosti neexistuje nástroj v slovenskom a českom jazyku na identifikáciu vzťahov medzi významnými osobnosťami. Väčšina elektronicky spracovaných životopisov obsahuje len základné informácie, ktoré zahrňujú podrobnosti o narodení, úmrtí či bydlisku. Tento projekt sa zameriava na odhalenie školy, zamestnania, a ďalej zobrazeniu týchto informácií vo forme prehľadného grafu, pomocou ktorého môže používateľ odhaliť zaujímavé spojitosti. Pomocou tohto grafu je možné zobraziť všetkých ľudí, ktorí študovali alebo iným spôsobom pôsobili na určitej škole, či inej inštitúcii.

O nás

V našom tíme sa stretli študenti z rôznych škôl a teda aj s rozdielnymi technickými skúsenosťami. Tieto rozdiely sme sa snažili využiť naplno strategickým porozdeľovaním úloh. Počas riešenia tohto projektu sme taktiež riešili odchody a príchod niektorých členov. Týmto spôsobom sme sa oboznámili s náročnosťou nachádzania vhodného miesta pre nového člena v tíme a jeho plnohodnotného začlenenia do procesu. Aj tento problém, podobne ako ostatné komplikácie, na ktoré sme narazili, sa nám podarilo pomerne rýchlo a úspešne prekonať.

Neverest

Členovia tímu:  Matej Adamov, Peter Berta, Ondrej Hamara, Michal Krempaský, Bronislava Pečíková

Dobrý článok? Chceš dostávať ďalšie?

Už viac ako 6 200 ITečkárov dostáva správy e-mailom. Nemusíš sa báť, nie každé ráno. Len občasne.

Súhlasím so spracovaním mojich osobných údajov. ( Viac informácií. )

Tvoj email neposkytneme 3tím stranám. Posielame naňho len informácie z robime.it. Kedykoľvek sa môžeš odhlásiť.