Opravljen predmet Uvod v programiranje.
Izbrane teme iz analize podatkov
Uvod v strojno učenje, podatki, napovedni modeli, funkcije izgube, vrednotenje točnosti in splošnosti napovednih modelov, težave s preprileganjem in prekletstvo večdimenzionalnosti.
Algoritmi za nadzorovano strojno učenje različnih tipov napovednih modelov iz podatkov: odločitvena drevesa, modeli podpornih vektorjev, nevronske mreže in ansambli modelov.
Algoritmi za nenadzorovano učenje: razvrščanje v skupine, metoda glavnih komponent.
Uporaba strojnega učenja za analizo podatkov: krčenje razsežnosti podatkov, obravnava neznanih vrednosti, vpetja za obravnavo besedilnih podatkov.
Spoznali bomo delovanje algoritmov strojnega učenja in njihovo matematično ozadje z namenom njihove učinkovite uporabe za reševanje praktičnih nalog analize podatkov.
- P. Flach: Machine learning : the art and science of algorithms that make sense of data, Cambridge : Cambridge University Press, 2017.
- G. James … [et al.]: An introduction to statistical learning with applications in Python, Cham : Springer, 2023. Prosto dostopna na https://www.statlearning.com/
- M. Kuhn, K. Johnson: Applied predictive modeling, New York : Springer, cop. 2019.
- F. Pedregosa … Scikit-learn: Machine Learning in Python, Journal of Machine Learning Research 12(85) (2011), str. 2825-2830.
Študent na predavanjih spozna delovanje širokega nabora algoritmov za strojno učenje, od nadzorovanega učenja odločitvenih dreves, preko metode podpornih vektorjev in nevronskih mrež za regresijo in klasifikacijo do nenadzorovanega razvrščanja v skupine. Na vajah, s praktičnim delom na raznolikih izbranih podatkovnih zbirkah spozna osnove analize podatkov s strojnim učenjem.
Znanje in razumevanje: Študenti se spoznajo z različnimi algoritmi strojnega učenja, razumejo njihovo delovanje in vpliv njihovih nastavitev na dobljene napovedne modele in vzorce, ter znajo formulirati nalogo podatkovne analize z uporabo strojnega učenja.
Uporaba: Praktična uporaba algoritmov strojnega učenja za različne naloge analize podatkovnih zbirk. Ob tem nadgradi poznavanje osnovnih podatkovno-analitičnih prejemov.
Refleksija: Ugotavljanje prednosti in slabosti posameznih algoritmov strojnega učenja, implementacija enostavnih algoritmov strojnega učenja in nadgradnja njihovih implementacij, izbira ustreznega algoritma za podano nalogo podatkovne analize.
Prenosljive spretnosti – niso vezane le na en predmet: Delo z računalnikom, podatkovno-analitični in algoritmični način razmišljanja.
Predavanja, vaje, domače naloge, konzultacije
Domače naloge in projekt
Ustni izpit
(ocene: 5 (negativno), 6-10 (pozitivno), ob upoštevanju Statuta UL)
Alexander Keith Simpson:
– EGGER, Jeff, MØGELBERG, Rasmus Ejlers, SIMPSON, Alex. The enriched effect calculus: syntax and semantics. Journal of logic and computation, ISSN 0955-792X, 2014, vol. 24, iss. 3, str. 615-654 [COBISS-SI-ID 17090137]
– EGGER, Jeff, MØGELBERG, Rasmus Ejlers, SIMPSON, Alex. Linear-use CPS translations in the enriched effect calculus. Logical methods in computer science, ISSN 1860-5974, 2012, vol. 8, iss. 4, paper 2 (str. 1-27) [COBISS-SI-ID 17090905]
Ljupčo Todorovski:
– MEŽNAR, Sebastian, DŽEROSKI, Sašo, TODOROVSKI, Ljupčo. Efficient generator of mathematical expressions for symbolic regression. Machine learning. Nov. 2023, vol. 112, iss. 11, str. 4563-4596 [COBISS-SI-ID 176785923]
– BRENCE, Jure, DŽEROSKI, Sašo, TODOROVSKI, Ljupčo. Dimensionally-consistent equation discovery through probabilistic attribute grammars. Information Sciences. Jun. 2023, vol. 632, str. 742-756 [COBISS-SI-ID 151276803]
– BRENCE, Jure, TODOROVSKI, Ljupčo, DŽEROSKI, Sašo. Probabilistic grammars for equation discovery. Knowledge-based systems. [Print ed.]. 2021, vol. 224, str. 107077-1-107077-12. [COBISS-SI-ID 61709059]