Projekti / Programi
Jezikovni viri za slovenščino
Koda |
Veda |
Področje |
Podpodročje |
6.05.00 |
Humanistika |
Jezikoslovje |
|
Koda |
Veda |
Področje |
H350 |
Humanistične vede |
Jezikoslovje |
H352 |
Humanistične vede |
Slovnica, semantika, semiotika, sintaksa |
H360 |
Humanistične vede |
Uporabna lingvistika, poučevanje tujih jezikov, sociolingvistika |
P175 |
Naravoslovno-matematične vede |
Informatika, teorija sistemov |
P176 |
Naravoslovno-matematične vede |
Umetna inteligenca |
jezikovni viri, korpusno jezikoslovje, korpusi, slovenski jezik, jezikoslovno označevanje, lematizacija, disambiguacija, pomensko označevanje, avtomatsko iskanje podatkov
Organizacije (3)
, Raziskovalci (10)
0106 Institut "Jožef Stefan"
št. |
Evidenčna št. |
Ime in priimek |
Razisk. področje |
Vloga |
Obdobje |
Štev. publikacijŠtev. publikacij |
1. |
17137 |
Marko Grobelnik |
Računalništvo in informatika |
Tehnični sodelavec |
2003 - 2005 |
479 |
2. |
12570 |
dr. Dunja Mladenić |
Računalništvo in informatika |
Raziskovalec |
2004 - 2005 |
698 |
3. |
21346 |
Maja Škrjanc |
Računalništvo in informatika |
Raziskovalec |
2003 |
57 |
0581 Univerza v Ljubljani, Filozofska fakulteta
0582 Univerza v Ljubljani, Fakulteta za družbene vede
št. |
Evidenčna št. |
Ime in priimek |
Razisk. področje |
Vloga |
Obdobje |
Štev. publikacijŠtev. publikacij |
1. |
15000 |
dr. Monika Kalin Golob |
Jezikoslovje |
Raziskovalec |
2003 - 2005 |
604 |
2. |
20331 |
dr. Tina Lengar Verovnik |
Jezikoslovje |
Raziskovalec |
2003 - 2005 |
351 |
Povzetek
Projekt Jezikovni viri za slovenščino bo oblikoval korpusne vire in jezikoslovna ter tehnološka orodja za raziskovanje slovenskega jezika in besedil v slovenščini. Oblikovan bo kot količinska in kakovostna nadgradnja referenčnega korpusa slovenskega jezika FIDA, v sodelovanju istih partnerjev (Filozofska fakulteta Univerze v Ljubljani, Inštitut Jožef Stefan, DZS d.d., Amebis d.o.o.) in s pritegnitvijo enega novega (Fakulteta za družbene vede Univerze v Ljubljani). Nadgradnja korpusa bo potekala na več nivojih: v količinski podvojitvi (na 200.000.000 besed), v vključitvi sestavine govornih in spletnih besedil ter v oblikovanju in uporabi dodatnih uravnoteževalnih meril. Vzporedno bo potekala gradnja orodij za avtomatsko pridobivanje besedil za korpus, za procesiranje korpusnih podatkov in njihovo analizo. Vsi rezultati bodo po poteku projekta javno dostopni v raziskovalne in pedagoške namene in s tega stališča odločilni premik v raziskovalni in jezikovnonačrtovalni infrastrukturi na področju humanistike, družboslovja in informacijskih ved.