Pogojev za vključitev v delo ni.
Strojno učenje za podatkovne vede 1
Tomaž Hočevar, Blaž Zupan
Linearni modeli. Linearna regresija.
Linearna diskriminantna analiza. Logistična
regresija. Gradientni sestop. Stohastični
gradientni sestop.
Pristop strojnega učenja. Cenovna
funkcija. Pristop z zmanjšanjem tveganja.
Maksimizacija verjetja. Vrednotenje
modelov. Prečno preverjanje.
Izbor značilk. Pristopi z iskanjem.
Regularizacija.
Drevesni modeli. Klasifikacijska in
regresijska drevesa. Naključni gozd. Pristop
bagging. Gradientni razvoj niza dreves.
Gručenje. Metoda voditeljev. Algoritem
EM.
Nelinearna regresija. Bazne funkcije.
Zlepki. Metoda podpornih vektorjev. Trik z
jedri.
Nevronske mreže. Perceptron. Aktivacijske
funkcije. Tehnika vzvratnega razširjanja
napak.
- T. Hastie, R. Tibshirani, J. Friedman: The elements of statistical learning : data mining, inference, and prediction, 2nd ed., New York : Springer, 2017.
Predmet je namenjen seznanitvi z
matematičnimi in algortimičnimi
osnovami strojnega učenja ter vidiki
uporabe strojnega učenja pri reševanju
praktičnih problemov. Predmet pripravi
študente na študij naprednejših metod iz
strojnega učenja.
Po uspešno zaključenem predmetu naj bi
bili študentje zmožni:
-
Uporabiti pristope strojnega
učenja k podatkovni analitiki. -
Evalvirati različne tehnike
modeliranja. -
Izbrati ustrezno tehniko za dani
problem in podatke. -
Interpretirati rezultate strojnega
učenja. -
Prepoznati potencialne probleme.
Predavanja, vaje, domače naloge in nabor
manjših projektov.
Sprotno preverjanje (domače naloge,
projekti)
Končno preverjanje (pisni izpit)
Ocene: 6-10 pozitivno, 5 negativno
Hočevar T, Zupan B, Stålring J (2021) Conformal Prediction with Orange. Journal of Statistical Software 98:1-22.
Hočevar T, Demšar J (2014) A combinatorial approach to graphlet counting. Bioinformatics 30(4):559-65.
Čopar A, Žitnik M, Zupan B (2017) Scalable non-negative matrix tri-factorization, BioData Mining 10:41.
Žitnik M, Zupan B (2016) Jumping across biomedical contexts using compressive data fusion, Bioinformatics 32(12):i90-i100.
Stražar M, Žitnik M, Zupan B, Ule J, Curk T (2016) Orthogonal matrix factorization enables integrative analysis of multiple RNA binding proteins, Bioinformatics 32(10): 1527-35.
Žitnik M, Nam EA, Dinh C, Kuspa A, Shaulsky G, Zupan B (2015) Gene prioritization by compressive data fusion and chaining, PLoS Computational Biology 11(10):e1004552.
Starič A, Demšar J, Zupan B (2015) Concurrent software architectures for exploratory data analysis. WIREs Data Mining and Knowledge Discovery 5(4):165-180.