Preskoči na glavno vsebino

Strojno učenje za podatkovne vede 1

2025/2026
Program:
Interdisciplinarni magistrski študijski program 2. stopnje Računalništvo in matematika
Letnik:
1 ali 2 letnik
Semester:
prvi ali drugi
Vrsta:
izbirni
ECTS:
6
Jezik:
slovenski, angleški
Nosilec predmeta:

Tomaž Hočevar, Blaž Zupan

Ure na teden – 1. ali 2. semester:
Predavanja
3
Seminar
0
Vaje
2
Laboratorij
0
Vsebina

Linearni modeli. Linearna regresija.
Linearna diskriminantna analiza. Logistična
regresija. Gradientni sestop. Stohastični
gradientni sestop.

Pristop strojnega učenja. Cenovna
funkcija. Pristop z zmanjšanjem tveganja.
Maksimizacija verjetja. Vrednotenje
modelov. Prečno preverjanje.

Izbor značilk. Pristopi z iskanjem.
Regularizacija.

Drevesni modeli. Klasifikacijska in
regresijska drevesa. Naključni gozd. Pristop
bagging. Gradientni razvoj niza dreves.

Gručenje. Metoda voditeljev. Algoritem
EM.

Nelinearna regresija. Bazne funkcije.
Zlepki. Metoda podpornih vektorjev. Trik z
jedri.

Nevronske mreže. Perceptron. Aktivacijske
funkcije. Tehnika vzvratnega razširjanja
napak.

Temeljni literatura in viri
  1. T. Hastie, R. Tibshirani, J. Friedman: The elements of statistical learning : data mining, inference, and prediction, 2nd ed., New York : Springer, 2017.
Cilji in kompetence

Predmet je namenjen seznanitvi z
matematičnimi in algortimičnimi
osnovami strojnega učenja ter vidiki
uporabe strojnega učenja pri reševanju
praktičnih problemov. Predmet pripravi
študente na študij naprednejših metod iz
strojnega učenja.

Predvideni študijski rezultati

Po uspešno zaključenem predmetu naj bi
bili študentje zmožni:

  • Uporabiti pristope strojnega
    učenja k podatkovni analitiki.

  • Evalvirati različne tehnike
    modeliranja.

  • Izbrati ustrezno tehniko za dani
    problem in podatke.

  • Interpretirati rezultate strojnega
    učenja.

  • Prepoznati potencialne probleme.

Metode poučevanja in učenja

Predavanja, vaje, domače naloge in nabor
manjših projektov.

Načini ocenjevanja

Sprotno preverjanje (domače naloge,
projekti)
Končno preverjanje (pisni izpit)
Ocene: 6-10 pozitivno, 5 negativno

Reference nosilca

Hočevar T, Zupan B, Stålring J (2021) Conformal Prediction with Orange. Journal of Statistical Software 98:1-22.
Hočevar T, Demšar J (2014) A combinatorial approach to graphlet counting. Bioinformatics 30(4):559-65.
Čopar A, Žitnik M, Zupan B (2017) Scalable non-negative matrix tri-factorization, BioData Mining 10:41.
Žitnik M, Zupan B (2016) Jumping across biomedical contexts using compressive data fusion, Bioinformatics 32(12):i90-i100.
Stražar M, Žitnik M, Zupan B, Ule J, Curk T (2016) Orthogonal matrix factorization enables integrative analysis of multiple RNA binding proteins, Bioinformatics 32(10): 1527-35.
Žitnik M, Nam EA, Dinh C, Kuspa A, Shaulsky G, Zupan B (2015) Gene prioritization by compressive data fusion and chaining, PLoS Computational Biology 11(10):e1004552.
Starič A, Demšar J, Zupan B (2015) Concurrent software architectures for exploratory data analysis. WIREs Data Mining and Knowledge Discovery 5(4):165-180.