P2-0069 — Vmesno poročilo
1.
Slovanski jeziki v fraznem statističnem prevajanju: pregled

V članku smo opravili pregled literature, ki obravnava statistično prevajanje slovanskih jezikov. Posvetili smo se različnim aspektom obravnave morfologije slovanskih jezikov v kontekstu strojnega prevajanja. Ob pregledu metod smo zaključili, da se v zadnjem času interes za strojno prevajanje morfološko kompleksnih jezikov povečuje, kar se kaže tudi v vedno bolj kvalitetnih strojnih prevodih.

COBISS.SI-ID: 20561174
2.
Razširjanje modelov HMM za preznavanje aktivnosti dnevnega življenja z Markovskimi verigami in utežjo za prehod med aktivnostmi

Raziskovali smo razširjanje sistema razpoznavanja aktivnost s prikritimi modeli Markova. Sistem smo razširili z markovskimi verigami višjih redov, s katerimi dosežemo daljše odvisnosti v modeliranju, in utežjo za prehod med aktivnostmi, s katero zmanjšamo odvečne manjave aktivnosti v razpoznavanju.

COBISS.SI-ID: 22619414
3.
Binokularna fazno kodirana vizualna stimulacija za vmesnike med možgani in računalnikom na osnovi vizualno izzvanih potencialov ustaljenega stanja

Zasnovana je bila nova metoda ustvarjanja binokularne fazno kodirane vizualne stimulacije za ne-invazivne neposredne vmesnike med možgani in strojem na osnovi dvo-kanalnega zajema elektroencefalografskih signalov v zatilju glave na levem in desnem okcipitalnem režnju možganov in nadaljnje zaznave ritmičnih ter manj ritmičnih kortičnih nihanj oziroma razpoznave vizualno izzvanih potencialov, kot posledice vizualnega vzbujanja. Binokularno fazno kodirano vizualno stimulacijo smo izvedli na osnovi fazne modulacije več prostorsko porazdeljenih svetlobnih izvorov hrbtne osvetlitve levega in desnega zaslona naglavnih vmesnikov za navidezno ali razširjeno resničnost. Rezultati so pokazali, da je možno ustvariti nov uporabniku prikrit komunikacijski kanal, ki nima neposrednega vpliva na prikazan vizualen tridimenzionalen kontekst znotraj aplikacij navidezne ali razširjene resničnosti. Pri tem smo dosegli osnovo za vzpostavitev nove modalnosti z namenom doseganja bolj intuitivne interakcije.

COBISS.SI-ID: 22315030
4.
Govorno krmiljena platforma za inteligentna okolja s porazdeljeno arhitekturo

V članku je predstavljena platforma za inteligentna oz. podporna okolja. Platforma temelji na porazdeljeni arhitekturi, ki omogoča razširjeno povezljivost in storitve v razširjenjem podpornem okolju. Integralni del platforme predstavlja mobilna enota Genesis, ki omogoča interakcijo med uporabniki in podpornim okoljem. Nadalje sofisticirana platforma odjemalec/strežnik vključuje robustno razpoznavo govora in text-to-speech sintezo govora, kar uporabnikom omogoča bolj naravno interakcijo z mobilno enoto Genesis. Tako razpoznava govora, kot sinteza govora sta primerna za večjezičnost. Čeprav je sistem v osnovi podpira slovenski jezik, se ga lahko hitro prilagodi tudi za ostale jezike, v kolikor so na voljo ustrezni jezikovni viri. Ob visoki uspešnosti razpoznave govora in neodvisnosti od govorca, ter nizki zakasnitvi med govorno komando ter operacijo se je Genesis izkazal z dobro okretnostjo in vodljivostjo tudi v primeru manj izkušenih uporabnikov.

COBISS.SI-ID: 20686358
5.
Nov postopek optimizacije izbire enot za sisteme korpusne sinteze govora, ki uporablja tehniko kompresije podatkov RBF

Pomembna slabost korpusne sinteze govora je uporaba velikega akustičnega inventarja, pri čemer je trenutno eden največjih izzivov optimalna predstavitev konkatenacijskih cenilk, ki so pridružene enotam akustičnega inventarja. Konkatenacijske cenilke uporabljamo pri oceni spektralnega neujemanja med akustičnimi enotami, ki jih želimo združiti. Kombinatorika cenilk narašča eksponentno z velikostjo akustičnega inventarja in lahko rezultira v stotine milijonov ali celo milijard konkatenacijskih cenilk, ki jih moramo procesirati. V članku predstavljamo nov optimizacijski postopek izbire enot sinteze, ki minimizira velikost konkatenacijske cenilke s pomočjo kompresijske tehnike, zasnovane na vektorski kvantizaciji. Predlagan optimizacijski algoritem je zasnovan tako, da ga lahko uporabimo kot objektivno mero za optimizacijo učinkovitosti funkcije cenilke izbire enot glede na kvaliteto izhodnega govornega signala in za oceno učinka uporabljenega kompresijskega postopka, zasnovanega na vektorski kvantizaciji, na sam postopek. Dobljeni rezultati kažejo, da je tudi v primeru, ko je kompresija podatkov nad 50% učinek na kvaliteto sintetiziranega govora zanemarljiv.

COBISS.SI-ID: 22512150