Predstavitev pristopa za luščenje dvojezičnih leksikonov iz primerljivih korpusov za sorodne jezike
COBISS.SI-ID: 46703714
Predstavitev jezikovnih virov in orodij za semantično obdelavo slovenščine
COBISS.SI-ID: 50261858
Predstavitev pristopov za širitev in čiščenje zadnje različice slovenskega wordneta
COBISS.SI-ID: 47786850
V prispevku predstavljamo metodo za avtomatsko luščenje hrvaško-slovenskega leksikona iz primerljivega časopisnega korpusa s predpostavko, da se besede in njihove prevodne ustreznice pojavljajo v podobnih sobesedilih. Izhodiščni leksikon za primerjavo kontekstnih vektorjev z izkoriščanjem podobnosti med jezikoma zgradimo kar iz korpusa, nato pa opravimo še razvrščanje rezultatov glede na stopnjo sorodnosti med izvorno besedo in njenimi prevodnimi kandidati. Rezultati so zelo spodbudni in odpirajo številne možnosti uporabe za druge sorodne jezike.
COBISS.SI-ID: 47260258
Prispevek predstavlja pristop za iskanje prevodnih ustreznic polisemnih samostalnikov.
COBISS.SI-ID: 50058338