J2-9180 — Zaključno poročilo
1.
Strojno učenje lematizatorjev

Lematizacija je ena od osnovnih jezikovnotehnoloških komponent. V tem znanstvenem članku predstavimo metodo, s katero se lahko skozi strojno učenje nad oblikoslovnimi leksikoni nauči kvalitetnih modelov za lematizacijo poljubnega jezika in pokažemo njene prednosti glede na poprej razvite metode.

COBISS.SI-ID: 21593383
2.
Oblikoslovno označevanje slovenskega jezika z metaoznačevalnikom

Oblikoslovno označevanje je ena od osnovnih jezikovnotehnoloških komponent. V članku predstavimo metodo, s katero je moč poboljšati rezultate oblikoslovnega označevanja skozi kombinacijo oblikoslovnih označevalnikov.

COBISS.SI-ID: 22416423
3.
Oblikoslovno označeni korpus jos100k

Članek predstavi prvo, samo oblikoslovno označeno različico korpusa jos100k.

COBISS.SI-ID: 21930023
4.
Avtomatizacija izdelave slovenskega semantičnega leksikona

Izdelava semantičnih leksikonov je zamuden in drag proces. Članek predlaga metodo, pri kateri iz odprtih jezikovnih virov, kot npr. Wikipedia, avtomatsko dopolnjujemo semantične leksikone za poljubne jezike.

COBISS.SI-ID: 40118626
5.
Semantično označevanje slovenskega jezika

Predstavitev procesa in rezultatov ročnega označevanja besednih pomenov v korpusu jos100k.

COBISS.SI-ID: 42066018