Preskoči na glavno vsebino

Analiza podatkov s programom R

2024/2025
Program:
Univerzitetni študijski program 1. stopnje Finančna matematika
Letnik:
2 letnik
Semester:
prvi
Vrsta:
obvezni
ECTS:
5
Jezik:
slovenski
Izvajalec (kontaktna oseba):
Ure na teden – 1. semester:
Predavanja
2
Seminar
0
Vaje
0
Laboratorij
2
Vsebina

Uvod. R kot računalo.
Razpredelnice, enote, spremenljivke. Merske lestvice. Priprava in urejanje podatkov. Excel, CSV. Branje in shranjevanje.
Skalarji in osnovni podatkovni tipi v R-u. Samodejna (prisilna) pretvorba tipov, neznane vrednosti, NA.Vektorji, njihove lastnosti, matrike in indeksiranje. Seznami in podatkovne tabele.
Urejenostni in imenski podatki. Zapis v R-u. Urejanje podatkov v tabele. Uvoz in čiščenje podatkov iz preglednic in iz spletnih strani. Regularni izrazi.
Analiza tabelaričnih podatkov z osnovami poizvedovalnega jezika SQL, grupiranje in sumarizacija.
Vizualizacija podatkov, slovnica statističnih diagramov ggplot2, estetske lastnosti, estetske preslikave, lestvice in legende. Prikazi podatkov na zemljevidu.
Razvrščanje v skupine. Različnosti med objekti in skupinami. Metoda hierarhičnega razvrščanja in metoda voditeljev. Vrednotenje kvalitete razvrščanja in obrisi.

Temeljni literatura in viri
  1. E. Jones, S. Harden, M. J. Crawley: The R book, 3rd ed., Chichester : Wiley, 2022.
  2. P. Murrell: R graphics, 3rd ed., Routledge : CRC Press, 2021.
  3. H. Wickham: Advanced R, 2nd ed., Boca Raton : CRC Press, 2019. Prosto dostopna na https://adv-r.hadley.nz/
  4. H. Wickham, M. Çetinkaya-Rundel, G. Grolemund: R for Data Science, 2nd ed., Beijing : O’Reilly, 2023. Prosto dostopna na https://r4ds.hadley.nz/
  5. Spletni strani https://www.r-project.org in https://posit.co/download/rstudio-desktop/
Cilji in kompetence

Študent spozna programski jezik R skupaj s pripadajočim okoljem in ob tem osnove slikovnega prikaza ter statističnih obdelav podatkov.

Predvideni študijski rezultati

Znanje in razumevanje: Študent dobro spozna programski paket R ustvarjen za statistično analizo in prikaze podatkov. Ob tem nadgradi poznavanje osnovnih programerskih prijemov in spozna nekatere posebnosti jezika R.
Uporaba: Priprava lastnih knjižnic, izdelava grafikonov, preprosta analiza podatkov.
Refleksija: Pomen sodobne informacijske tehnologije za analizo večjih količin podatkov, pomen slikovnih prikazov pri pregledovanju podatkov in pri predstavitvi rezultatov.
Prenosljive spretnosti – niso vezane le na en predmet: Delo z računalnikom, algoritmični način razmišljanja.

Metode poučevanja in učenja

Predavanja, vaje, domače naloge, konzultacije

Načini ocenjevanja

Domače naloge, zaključni projekt
Izpit iz teorije
(ocene: 5 (negativno), 6-10 (pozitivno), ob upoštevanju Statuta UL)

Reference nosilca

Andrej Bauer:
– BAUER, Andrej, BIRKEDAL, Lars. Continuous functionals of dependent types and equilogical spaces. V: CLOTE, Peter G. (ur.). Computer science logic : 14th international workshop, CSL 2000, annual conference of the EACSL, Fischbachau, Germany, August 21-26, 2000 : proceedings, (Lecture notes in computer science, ISSN 0302-9743, 1862). Berlin [etc.]: Springer, 2000, vol. 1862, str. 202-216 [COBISS-SI-ID 10606681]
– BAUER, Andrej, TAYLOR, Paul. The Dedekind reals in abstract Stone duality. Mathematical structures in computer science, ISSN 0960-1295, 2009, vol. 19, iss. 4, str. 757-838 [COBISS-SI-ID 15322201]
– BAUER, Andrej, STONE, Christopher A. RZ: a tool for bringing constructive and computable mathematics closer to programming practice. Journal of logic and computation, ISSN 0955-792X, 2009, vol. 19, no. 1, str. 17-43 [COBISS-SI-ID 15325785]

Ljupčo Todorovski:
– MEŽNAR, Sebastian, DŽEROSKI, Sašo, TODOROVSKI, Ljupčo. Efficient generator of mathematical expressions for symbolic regression. Machine learning. Nov. 2023, vol. 112, iss. 11, str. 4563-4596 [COBISS-SI-ID 176785923]
– BRENCE, Jure, DŽEROSKI, Sašo, TODOROVSKI, Ljupčo. Dimensionally-consistent equation discovery through probabilistic attribute grammars. Information Sciences. Jun. 2023, vol. 632, str. 742-756 [COBISS-SI-ID 151276803]
– BRENCE, Jure, TODOROVSKI, Ljupčo, DŽEROSKI, Sašo. Probabilistic grammars for equation discovery. Knowledge-based systems. [Print ed.]. 2021, vol. 224, str. 107077-1-107077-12. [COBISS-SI-ID 61709059]