J2-5480 — Zaključno poročilo
1.
Combinatorial algorithm for counting small induced graphs and orbits

Razvili smo nov algoritem za preštevanje frekvenc grafkov (graphlets) in njihovih orbit v velikih redkih grafih. Algoritem ima številne aplikacije predvsem na področju bioinformatike. Algoritem je za velikostni razred hitrejši od obstoječih algoritmov; v praksi to pomeni približno stokrat hitrejše izvajanje na tipičnih grafih, s kakršnimi se srečujemo v bioinformatiki. V preteklosti smo objavili algoritem, ki rešuje omejeno različico problema, v tem članku pa smo ga uspešno posplošili na grafke poljubne velikosti.

COBISS.SI-ID: 1537349315
2.
Jumping across biomedical contexts using compressive data fusion

Rast obsežnih in raznolikih zbirk bioloških podatkov omogoča analizo interakcij med različnimi tipi objektov, kot so geni, kemične spojine, molekulski profili, bolezni in vplivi iz okolja. Par objektov - na primer gen in bolezen - je pogosto lahko povezan na različne načine, na primer z neposredno povezavo med genom in boleznijo ali posredno, prek funkcijske anotacije, kemične spojine ali poti. Različni načini imajo lahko različen pomen. Običajne metode analize interakcij to semantiko zanemarjajo. V članku predstavljamo algoritem Medusa, ki s pomočjo sočasne matrične faktorizacije izpelje različne semantike. V sistematični študiji 310 bolezni smo pokazali njeno učinkovitost pri iskanju povezav med geni in boleznimi ter prepoznavanju skupin bolezni. Zaradi upoštevanja različnih semantik je algoritem natančnejši od drugih sorodnih algoritmov.

COBISS.SI-ID: 1537026243
3.
Assessment of machine learning reliability methods for quantifying the applicability domain of QSAR regression models

Ogromna razsežnost prostora možnih učinkovin in zelo majhno pokritje tega prostora z eksperimentalnimi podatki narekuje potrebo po uporabi metod, ki napovedi obnašanja teh učinkovin opremijo z oceno zanesljivosti. V članku predlagamo, da morajo te mere biti odvisne od učinkovine, in ne, kot v dosedanji literaturi, od podobnosti nabora učinkovin, za katere napovedujemo obnašanje z učinkovinami, na katerem smo se napovednega modela učili.

COBISS.SI-ID: 10466388
4.
Gene network inference by probabilistic scoring of relationships from a factorized model of interactions

Analiza epistaze je osnovno orodje klasične genetike. V članku predlagamo nov verjetnostni pristop k odkrivanju genskih mrež iz kvantitativnih podatkov o interakcijah. Pristop temelji na skupni obravnavi podatkov o mutantih s pomočjo faktorizacije in verjetnosti za povezave med geni, ki jih izpeljemo iz latentnih podatkov o genih. Rezultati so pokazali, da predlagani pristop uspešno rekonstruira znane genske poti in po točnosti preseže trenutne pristope.

COBISS.SI-ID: 10624852
5.
Small network completion using frequent subnetworks

Napovedovanje manjkajočih ali potencialnih vozlišč in povezav je ena od osnovnih nalog analize omrežij. V članku definiramo problem dopolnjevanja majhnih omrežij z ali brez zabeležene pretekle dinamike. Obstoječi algoritmi in načini evalvacije za ta problem niso primerni. V članku definiramo nov algoritme, Hyspan, ki išče pogoste vzorce v majhnih omrežjih in jih uporablja za napovedovanje manjkajočih vozlišč in povezav v novih omrežjih.

COBISS.SI-ID: 1536144835