Rekonstrukcija 3D prostora iz vizualnih podatkov je eden večjih izzivov na področju računalniškega vida. Priljubljen pristop k reševanju tega problema najdemo v obliki tehnik rekonstrukcije od spodaj navzgor, ki zapletene 3D prizore modelirajo s konstelacijo manjših volumetričnih primitivov. Navdih za takšne metode najdemo v trenutnem razumevanje človeškega vidnega sistema in so z vidika sodobne nevroznanosti močno povezane s človeškim obdelovanjem vizualnih informacij. Čeprav 3D rekonstrukcija v zadnjih letih beleži velik napredek, nam to področje še vedno predstavlja velik izziv zaradi številnih možnih načinov predstavitve 3D podatkov, dvoumnosti določanja oblike in splošnega položaja v 3D prostoru ter težav pri učenju učinkovitih modelov za napoved volumetričnih primitivov. V tem članku obravnavamo omenjene izzive in predstavimo novo rešitev za obnovitev volumetričnih primitivov iz globinskih slik. Natančneje se osredotočamo na napovedovanje superkvadrikov, posebne vrste parametričnih modelov, ki lahko z le nekaj parametri opišejo široko paleto različnih 3D oblik. Predstavimo nov učni cilj, ki se opira na superkvadrično funkcijo (znotraj-zunaj) in razvijemo dve učni strategiji za učenje modelov konvolucijskih nevronskih mrež, ki so zmožni napovedovati superkvadrične parametre. Prvi način uporablja eksplicitni nadzor in računa razliko med napovedanimi in referenčnimi superkvadričnimi parametri. Druga strategija uporablja implicitni nadzor in računa razlike med vhodnimi globinskimi slikami in globinskimi slikami, upodobljenimi iz napovedanih parametrov. Različni modeli za napovedovanje superkvadričnih parametrov so naučeni s pomočjo obeh strategiji in ovrednoteni na velikem naboru sintetičnih in resničnih globinskih slik. Eksperimentalni rezultati kažejo, da se obe strategiji ugodno primerjata z obstoječimi sodobnimi metodami in proizvajata visokokakovostne 3D rekonstrukcije modeliranih prizorov v veliko krajšem času.
COBISS.SI-ID: 45630467
Članek predstavlja poglobljeno analizo najboljših postopkov za razpoznavo uhljev, ki skupino avtorjev dodatno utrjuje med najpomembnejšimi skupinami na tem področju. Slednje dokazuje tudi članek s tekmovanja na to temo v letu 2019 [COBISS.SI-ID 1538531011], ki smo ga organizirali na prestižni konferenci s področja biometrije.
COBISS.SI-ID: 1537788099
Predlagali smo metodologijo za vrednotenje dolgoročnih sledilnikov in novo podatkovno zbirko. Predlagane mere so bistveno bolj interpretativne in bolje razlikujejo med različnimi tipi sledilnikov, hkrati pa povezujejo domeno kratkoročnega sledenja z dolgoročnim. Nove mere so izredno robustne na časovno redkost anotacij in omogočajo anotacijo več stokrat daljših sekvenc ob enakem človeškem naporu. Predlagali smo novo evalvacijsko podatkovno zbirko, ki vsebuje obilo primerov izginotja tarče. Nova metodologija in podatkovna zbirka sta postali del največjega izziva vizualnega sledenja objektov v računalniškem vidu, VOT. Pričujoči članek je del prispevka, ki ga je ARRS v akciji "Odlični v znanosti" nagradila kot odlični dosežek v letu 2020. Tudi ostalo naše delo na vizualnem sledenju objektov, specifično, nove metode temelječen na diskriminativnih korelacijskih filtrih, je bilo izbrano s strani ARRS za odlični raziskovalni dosežek tudi v letu 2019.
COBISS.SI-ID: 1538564803
Predlagali smo novo rekonstrukcijsko metodo za nenadzorovano detekcijo anomalij na slikah. Z uporabo rekonstrukcije preko iterativnega procesa vrisovanja smo naslovili problem generalizacije, ki je pogost v drugih rekonstrukcijskih metodah. Rekonstrukcija anomalije v naši metodi ni odvisna od samih slikovnih elementov, ki pripadajo anomaliji na vhodni sliki, temveč njihove okolice. Zaradi tega je verjetnost, da bo metoda anomalije dobro rekonstruirala, nizka. Detekcija anomalij v rekonstrukcijskih metodah poteka preko primerjave vhodne slike z njeno rekonstrukcijo z uporabo funkcij podobnosti. Predlagani pristop za funkcijo podobnosti uporablja podobnost slikovnih gradientov pri različnih velikostih, kar zmanjša število napačnih detekcij v regijah z naključnimi vzorci. Naš pristop doseže boljše rezultate od ostalih nedavno predlaganih metod na široko uporabljeni bazi za detekcijo anomalij MVTec. Dobre rezultate dosega tudi na standardnih bazah za detekcijo anomalij na video posnetkih. Metoda je opisana v članku objavljenem v reviji Pattern Recognition (IF: 7.196). Ker metoda ne potrebuje označenih primerov, temveč se preko vrisovanja nauči natančen vizualni model objekta, je primerna za uporabo v primerih, kjer je pridobivanje slik anomalij izjemno zahtevno.
COBISS.SI-ID: 49664003
V članku smo predlagali novo premikajočo agregacijsko enoto (DAU) za globoke konvolucijske mreže, ki v globoke modele uvaja nove kompozicionalne lastnosti. V nasprotju s klasičnimi filtri z enotami (kot slikovnimi elementi) nameščenimi na togi mreži, so premiki enot v filtru DAU naučeni, kar privede do globokih mrež z novimi lastnostmi, kot je neodvisnost št. parametrov od velikosti dovzetnega polja, učenje velikosti dovzetnega polja ter samodejno prilagajanje prostorskega fokusa značilk. Nove lastnosti so tako privedle do učinkovitih globokih nevronskih mrež z manjšim številom operacij in parametrov, ter omogočile novo analizo parametrov in prostorske pokritosti značilk. Prednosti filtra DAU so bile nazorno prikazane na nalogah klasifikacije, semantične segmentacije in zamegljevanja slik. Rezultati so pokazali boljšo učinkovitost uporabe parametrov v modelih s filtrom DAU, kar je privedlo do 4-krat bolj kompaktnih globokih nevronskih mrež pri podobni ali celo boljši natančnosti in točnosti. Predlagana metoda je torej primerna za vizualno modeliranje slikovne informacije tako v polnokovolucijskih modelih za segmentacijo kot tudi za generativne modele, saj se velikost dovzetnega polja veliko enostavneje prilagaja vsebini slik, oz. konsistentnosti vsebine množice slik, kot standarna konvolucija.
COBISS.SI-ID: 1538492611