Projekti / Programi
Na drevesnici temelječ pristop k raziskavam govorjene slovenščine
Koda |
Veda |
Področje |
Podpodročje |
6.05.00 |
Humanistika |
Jezikoslovje |
|
Koda |
Veda |
Področje |
6.02 |
Humanistične vede |
Jeziki in književnost |
govorjeni jezik, slovnica govorjenega jezika; skladenjsko označeni korpusi, drevesnice, odvisnostna skladnja, skladenjska drevesa; korpusno jezikoslovje, popolni korpusni pristop, primerjava korpusov, jezikovna variantnost
Organizacije (1)
, Raziskovalci (1)
0581 Univerza v Ljubljani, Filozofska fakulteta
št. |
Evidenčna št. |
Ime in priimek |
Razisk. področje |
Vloga |
Obdobje |
Štev. publikacijŠtev. publikacij |
1. |
36491 |
dr. Kaja Dobrovoljc |
Jezikoslovje |
Vodja |
2022 - 2025 |
197 |
Povzetek
V skladu s celostnim pristopom k preučevanju jezika, znotraj katerega sta govorjeno in pisno sporazumevanje razumljena kot dva konca istega kontinuuma, smo bili v zadnjih treh desetletjih priča skokovitemu porastu korpusnojezikoslovnih raziskav govorjenega jezika, ki si prizadevajo za sistematičen opis tipično govorjenih skladenjskih pojavov, kakršni so bili v tradicionalnih slovničnih opisih večinoma prezrti ali opisani nezadovoljivo. Ta trend je bistveno manj izrazit v slovenskem jezikoslovju, kjer so raziskave skladenjskih značilnosti govorjene slovenščine še vedno redke ter se po načelu 'od zgoraj navzdol' prevladujoče osredotočajo predvsem na preučevanje posamičnih skladenjskih pojavov na podlagi kvalitativnih analiz nereprezentativnih vzorcev jezikovne rabe.
Da bi zapolnili to vrzel in vzpostavili nujno potrebne empirične temelje za nadaljnje slovnične raziskave govorjene slovenščine, bomo v okviru predlaganega projekta sistematično raziskali potencial skladenjsko razčlenjenih korpusov (t. i. drevesnic) za jezikoslovne raziskave govorjene slovenščine, in sicer tako, da bomo (1) vzpostavili metodološki okvir za skladenjsko označevanje korpusov govorjene slovenščine, (2) izdelali visokokakovostno drevesnico govorjene slovenščine, (3) razvili metodologijo za kvantitativno jezikoslovno analizo drevesnic govorjenega jezika ter pri tem (4) promovirali uporabo skladenjsko razčlenjenih korpusov v jezikoslovju nasploh.
Natančneje, v predlaganem projektu bomo izdelali bistveno izboljšano različico obstoječe drevesnice govorjene slovenščine (Dobrovoljc in Nivre 2016), ki jo bomo nadgradili tako z vidika obsega in dokumentiranosti kot kakovosti vsebovanih oznak. Novo različico drevesnice govorjene slovenščine bomo nato uporabili za razvoj povsem nove korpusnojezikoslovne metode za statistično prepoznavo tipično govorjenih skladenjskih vzorcev po načelu 'od spodaj navzgor', s katero bomo na podlagi t.i. izračuna ključnosti izdelali seznam skladenjskih dreves, ki se statistično signifikantno pogosteje pojavljajo v govorjeni kot v pisni slovenščini. Pričakujemo, da bo poglobljena jezikoslovna analiza tega seznama empirično potrdila že znane, prototipične in kognitivno najbolj izstopajoče skladenjske pojave v govoru, po drugi pa razkrila morebitne nove, doslej neidentificirane, a statistično izstopajoče vzorce govorjene rabe.
Rezultati projekta bodo tako z vzpostavitvijo novih virov, metod in analiz za preučevanje govorjene slovenščine pomembno prispevali k znanstvenemu napredku slovenskega jezikoslovja, pa tudi korpusnega jezikoslovja nasploh, znotraj katerega metodološki potencial skladenjsko razčlenjenih korpusov za raziskave govorjenega jezika in raziskave jezikovne variantnosti nasploh ostaja povsem neraziskan.