Preskoči na glavno vsebino

Izbrane teme iz analize podatkov

2024/2025
Program:
Univerzitetni študijski program 1. stopnje Finančna matematika
Letnik:
3 letnik
Semester:
drugi
Vrsta:
izbirni
Skupina:
B
ECTS:
5
Jezik:
slovenski
Izvajalec (kontaktna oseba):
Ure na teden – 2. semester:
Predavanja
2
Seminar
0
Vaje
2
Laboratorij
0
Vsebina

Uvod v strojno učenje, podatki, napovedni modeli, funkcije izgube, vrednotenje točnosti in splošnosti napovednih modelov, težave s preprileganjem in prekletstvo večdimenzionalnosti.
Algoritmi za nadzorovano strojno učenje različnih tipov napovednih modelov iz podatkov: odločitvena drevesa, modeli podpornih vektorjev, nevronske mreže in ansambli modelov.
Algoritmi za nenadzorovano učenje: razvrščanje v skupine, metoda glavnih komponent.
Uporaba strojnega učenja za analizo podatkov: krčenje razsežnosti podatkov, obravnava neznanih vrednosti, vpetja za obravnavo besedilnih podatkov.
Spoznali bomo delovanje algoritmov strojnega učenja in njihovo matematično ozadje z namenom njihove učinkovite uporabe za reševanje praktičnih nalog analize podatkov.

Temeljni literatura in viri
  1. P. Flach: Machine learning : the art and science of algorithms that make sense of data, Cambridge : Cambridge University Press, 2017.
  2. G. James … [et al.]: An introduction to statistical learning with applications in Python, Cham : Springer, 2023. Prosto dostopna na https://www.statlearning.com/
  3. M. Kuhn, K. Johnson: Applied predictive modeling, New York : Springer, cop. 2019.
  4. F. Pedregosa … Scikit-learn: Machine Learning in Python, Journal of Machine Learning Research 12(85) (2011), str. 2825-2830.
Cilji in kompetence

Študent na predavanjih spozna delovanje širokega nabora algoritmov za strojno učenje, od nadzorovanega učenja odločitvenih dreves, preko metode podpornih vektorjev in nevronskih mrež za regresijo in klasifikacijo do nenadzorovanega razvrščanja v skupine. Na vajah, s praktičnim delom na raznolikih izbranih podatkovnih zbirkah spozna osnove analize podatkov s strojnim učenjem.

Predvideni študijski rezultati

Znanje in razumevanje: Študenti se spoznajo z različnimi algoritmi strojnega učenja, razumejo njihovo delovanje in vpliv njihovih nastavitev na dobljene napovedne modele in vzorce, ter znajo formulirati nalogo podatkovne analize z uporabo strojnega učenja.

Uporaba: Praktična uporaba algoritmov strojnega učenja za različne naloge analize podatkovnih zbirk. Ob tem nadgradi poznavanje osnovnih podatkovno-analitičnih prejemov.

Refleksija: Ugotavljanje prednosti in slabosti posameznih algoritmov strojnega učenja, implementacija enostavnih algoritmov strojnega učenja in nadgradnja njihovih implementacij, izbira ustreznega algoritma za podano nalogo podatkovne analize.

Prenosljive spretnosti – niso vezane le na en predmet: Delo z računalnikom, podatkovno-analitični in algoritmični način razmišljanja.

Metode poučevanja in učenja

Predavanja, vaje, domače naloge, konzultacije

Načini ocenjevanja

Domače naloge in projekt
Ustni izpit
(ocene: 5 (negativno), 6-10 (pozitivno), ob upoštevanju Statuta UL)

Reference nosilca

Alexander Keith Simpson:
– EGGER, Jeff, MØGELBERG, Rasmus Ejlers, SIMPSON, Alex. The enriched effect calculus: syntax and semantics. Journal of logic and computation, ISSN 0955-792X, 2014, vol. 24, iss. 3, str. 615-654 [COBISS-SI-ID 17090137]
– EGGER, Jeff, MØGELBERG, Rasmus Ejlers, SIMPSON, Alex. Linear-use CPS translations in the enriched effect calculus. Logical methods in computer science, ISSN 1860-5974, 2012, vol. 8, iss. 4, paper 2 (str. 1-27) [COBISS-SI-ID 17090905]

Ljupčo Todorovski:
– MEŽNAR, Sebastian, DŽEROSKI, Sašo, TODOROVSKI, Ljupčo. Efficient generator of mathematical expressions for symbolic regression. Machine learning. Nov. 2023, vol. 112, iss. 11, str. 4563-4596 [COBISS-SI-ID 176785923]
– BRENCE, Jure, DŽEROSKI, Sašo, TODOROVSKI, Ljupčo. Dimensionally-consistent equation discovery through probabilistic attribute grammars. Information Sciences. Jun. 2023, vol. 632, str. 742-756 [COBISS-SI-ID 151276803]
– BRENCE, Jure, TODOROVSKI, Ljupčo, DŽEROSKI, Sašo. Probabilistic grammars for equation discovery. Knowledge-based systems. [Print ed.]. 2021, vol. 224, str. 107077-1-107077-12. [COBISS-SI-ID 61709059]