Semantično označeni korpusi so nepogrešljivi vir za razvoj sodobnih jezikovnih tehnologij, kot so avtomatsko razreševanje večpomenskosti, iskanje informacij po obsežnih zbirkah dokumentov in strojno prevajanje. V prispevku predstavljamo prvi poskus semantičnega označevanja korpusa za slovenščino, v katerem smo najpogostejšim samostalnikom v korpusu pripisali pomene iz wordneta.
COBISS.SI-ID: 43099234
V prispevku predstavljamo inovativen pristop k luščenju slovenskih definicij iz korpusa slovenskih strokovnih besedil s pomočjo oblikoskladenjskih vzorcev, samodejnega prepoznavanja terminologije in semantičnega označevanja s pomeni iz wordneta. Rezultati eksperimenta so vzpodbudni, natančnost pa niha med 67 % in 71 %. V prispevku prav tako razpravljamo o slabostih pristopa in predlogih za prihodnje izboljšave.
COBISS.SI-ID: 43122530