Nalaganje ...
Projekti / Programi vir: ARIS

Napovedno razvrščanje na podatkovnih tokovih

Raziskovalna dejavnost

Koda Veda Področje Podpodročje
2.07.07  Tehnika  Računalništvo in informatika  Inteligentni sistemi - programska oprema 

Koda Veda Področje
1.02  Naravoslovne vede  Računalništvo in informatika 
Ključne besede
rudarjenje podatkov, spremenljivi podatkovni tokovi, več-ciljna regresija, več-označna klasifikacija, pol-nadzorovano učenje, zaznavanje sprememb
Vrednotenje (metodologija)
vir: COBISS
Organizacije (2) , Raziskovalci (16)
0106  Institut "Jožef Stefan"
št. Evidenčna št. Ime in priimek Razisk. področje Vloga Obdobje Štev. publikacijŠtev. publikacij
1.  53798  Jure Brence  Računalništvo in informatika  Raziskovalec  2020 - 2024  24 
2.  36220  dr. Martin Breskvar  Računalništvo in informatika  Raziskovalec  2020 - 2023  37 
3.  11130  dr. Sašo Džeroski  Računalništvo in informatika  Vodja  2020 - 2024  1.251 
4.  57060  Boštjan Gec  Računalništvo in informatika  Raziskovalec  2022 - 2024  11 
5.  53530  Ana Kostovska  Računalništvo in informatika  Mladi raziskovalec  2020 - 2023  53 
6.  27800  dr. Zoran Levnajić  Fizika  Raziskovalec  2020 - 2024  144 
7.  36356  dr. Aljaž Osojnik  Računalništvo in informatika  Raziskovalec  2020 - 2024  48 
8.  38206  dr. Matej Petković  Računalništvo in informatika  Raziskovalec  2020 - 2023  70 
9.  34452  dr. Nikola Simidjievski  Računalništvo in informatika  Raziskovalec  2020 - 2024  58 
10.  39156  dr. Tomaž Stepišnik  Računalništvo in informatika  Mladi raziskovalec  2020  28 
11.  57192  Sintija Stevanoska  Računalništvo in informatika  Raziskovalec  2022 - 2024  15 
12.  16302  dr. Ljupčo Todorovski  Računalništvo in informatika  Raziskovalec  2020 - 2024  464 
2338  Mednarodna podiplomska šola Jožefa Stefana
št. Evidenčna št. Ime in priimek Razisk. področje Vloga Obdobje Štev. publikacijŠtev. publikacij
1.  31818  dr. Andreja Abina  Kemija  Raziskovalec  2023 - 2024  62 
2.  31050  dr. Dragi Kocev  Računalništvo in informatika  Raziskovalec  2020 - 2024  221 
3.  27759  dr. Panče Panov  Računalništvo in informatika  Raziskovalec  2020 - 2024  167 
4.  28893  mag. Sergeja Vogrinčič  Računalništvo in informatika  Tehnični sodelavec  2023 - 2024 
Povzetek
Podatkovni tokovi so visoko frekvenčni podatkovni viri, ki so v zadnjem času postali navzoči vsepovsod. Značilna zanje je visoka frekvenca prihoda novih podatkovnih primerov in njihova časovna urejenost. Ena ključnih lastnosti je možnost pojavitve sprememb (ang. concept drift), ki jih metode za rudarjenje podatkovnih tokov morajo zaznati ter se nanje prilagoditi. S povečano potrebo po rudarjenju podatkovnih tokov se je povečala še njihova kompleksnost, ki jo lahko opišemo v več dimenzijah. Ena izmed teh je kompleksnost vrednosti, ki jo napovedujemo. Vse pogosteje naletimo na naloge hkratnega napovedovanja več vrednosti, ki so zahtevnejše kot običajna klasifikacija ali regresija. Druga je obravnavanje podatkovnih primerov z manjkajočimi vrednostmi ciljnih spremenljivk. Takšne naloge rešujemo s pol-nadzorovanimi ali razvrščevalnimi metodami. Zadnja dimenzija je naravni del rudarjenja podatkovnih tokov, zadeva pa spremembe v podatkih, ki jih moramo čimprej zaznati in se nanje prilagoditi. V odogovor na potrebe po rudarjenju kompleksnih podatkovnih tokov, bomo v predlaganem projektu razvili metode za sprotno učenje iz podatkovnih tokov, ki 1) Rešujejo naloge tako običajne kot tudi hierarhične več-ciljne regresije in več-označne klasifikacije, 2) Učinkovito rešujejo naloge nenadzorovanega učenja (razvrščanja v podskupine), prav tako pa tudi polnadzorovanega učenja v kontekstu napovedovanja ene ali več vrednosti (ali celotne hierarhije), 3) Ocenjujejo pomembnosti značilk za zgoraj omenjene naloge napovednega modeliranja, 4) Zaznavajo in se primerno prilagajajo spremembam med učenjem napovednih modelov za zgoraj omenjene naloge napovednega modeliranja. Projekt bo razvite metode sistematično ovrednotil z uporabo primerne metodologije. Razvite metode bodo prosto dostopne kot del večje platforme za rudarjenje podatkovnih tokov. Njihovo uporabo bomo spodbujali tudi z anotacijami metod s termini iz ontologije podatkovnega rudarjenja. Uporabnost razvitih metod bomo nazorno prikazali na študijah primerov iz realnega življenja, natančneje s področij spremljanja okolja in zdravlja ter spremljanja in optimizacije delovanja vesoljskih sond.
Zgodovina ogledov
Priljubljeno