Uvod v odkrivanje znanj iz podatkov

2022/2023
Program:
Interdisciplinarni univerzitetni študijski program 1. stopnje Računalništvo in matematika
Letnik:
3 letnik
Semester:
drugi
Vrsta:
izbirni
Skupina:
Modul: Informacijski sistemi
ECTS:
6
Jezik:
slovenski, angleški
Nosilci predmeta:

Blaž Zupan

Ure na teden – 2. semester:
Predavanja
3
Seminar
1.33
Vaje
0
Laboratorij
0.67
Vsebina

Predmet bo v teoriji in na praktičnih primerih obravnaval sledeče vsebine:
Kaj je poslovna inteligenca? Predstavitev področja skozi pregled značilnih aplikacij. Vloga tehnologij in pristopov poslovne inteligence v informacijskih sistemih in elektronskem poslovanju. Tehnologije znanja.
Računalniško podprto odločanje. Predstavitev in zajemanje znanja. Odločitveni modeli. Obravnavanje nepopolnih in negotovih odločitvenih podatkov. Razlaga in analiza odločitev.
Metode in tehnike za računalniško podporo odločanje v skupinah.
Uvod v tehnike odkrivanja znanj iz večdimenzionalnih podatkov. Vloga podatkovnih skladišč in predobdelave podatkov. Uvod v tehnike strojne gradnje modelov odločanja in napovednih modelov.
Vizualizacija podatkov in modelov.
Razvrščanje v skupine.
Tehnike poslovne inteligence na spletu. rangiranje spletnih strani. Analiza podatkov iz družabnih mrež.
Priporočilni sistemi.
Orodja in razvoj sistemov poslovne inteligence. Integracija v informacijskih sistemih. Snovanje uporabniških vmesnikov za pomoč pri odločanju.
Psihosociološki in etični vidiki poslovne inteligence.

Temeljni literatura in viri

Tan, P.-N., Steinbach, M., and Kumar, V. (2006) Introduction to Data Mining, Pearson Education.
Segaran, T. (2007) Programming Collective Intelligence, O'Reilly.
Dokumentacija prosto dostopnih programov za podatkovno analitiko (Orange, na strani http://orange.biolab.si, scikit-learn na strani http://scikit-learn.org in numpy na strani http://www.numpy.org).

Cilji in kompetence

Cilj predmeta je spoznati metodološke osnove inteligentnih sistemov, ki so bili razviti na področju računalništva. Študente bomo naučili v praksi prepoznati njihove možne aplikacije ter tekom predmeta v okviru laboratorijskega dela naučeno znanje uporabiti na praktičnih primerih. Še posebej podrobno si bomo ogledali tehnike razvrščanja v skupine, priporočilnih sistemov, iskanja vzorcev v podatkih, gradnje napovednih modelov iz strukturiranih in tekstovnih zapisov in tehnike gradnje odločitvenih modelov.

Predvideni študijski rezultati

Znanje in razumevanje:
Poznavanje računalniških tehnologij in računalniških metodologij za uporabo in razvoj komponent in sistemov računalniškega zaznavanja.
Uporaba:
Uporaba računalniških tehnologij in računalniških metodologij pri specifičnih aplikacijah avtonomnih inteligentnih kognitivnih sistemov.
Refleksija:
Spoznavanje in razumevanje uglašenosti med teorijo in njeno aplikacijo na konkretnih primerih s področja modeliranja umetnih inteligentnih spoznavnih/zaznavnih sistemov.
Prenosljive spretnosti - niso vezane le na en
predmet:
Reševanje drugih konceptualno sorodnih problemov (npr. na drugih modalnostih) na osnovi modelov računalniškega in kognitivnega zaznavanja.

Metode poučevanja in učenja

Predavanja s podporo avdio-vizualne opreme, laboratorijske vaje v računalniški učilnici z osnovno računalniško opremo. Delo posamezno in v skupinah. Velik poudarek na praktičnem delu in reševanju problemov.

Načini ocenjevanja

Domače naloge
Končno preverjanje (pisni izpit)
(ocene: 5 (negativno), 6-10 (pozitivno), ob upoštevanju Statuta UL)

Reference nosilca

TOPLAK, Marko, MOČNIK, Rok, POLAJNAR, Matija, BOSNIĆ, Zoran, CARLSSON, Lars, HASSELGREN, Catrin, DEMŠAR, Janez, BOYER, Scott, ZUPAN, Blaž, STÅLRING, Jonna. Assessment of machine learning reliability methods for quantifying the applicability domain of QSAR regression models. Journal of chemical information and modeling, ISSN 1549-9596. [Print ed.], Feb. 2014, vol. 54, no. 2, str. 431-441, graf. prikazi. [COBISS-SI-ID 10466388]
ŽITNIK, Marinka, JANJIĆ, Vuk, LARMINIE, Chris, ZUPAN, Blaž, PRŽULJ, Nataša. Discovering disease-disease associations by fusing systems-level molecular data. Scientific reports, ISSN 2045-2322, 2013, str. 1-9, ilustr. [COBISS-SI-ID 10253396]
DEMŠAR, Janez, CURK, Tomaž, ERJAVEC, Aleš, GORUP, Črtomir, HOČEVAR, Tomaž, MILUTINOVIĆ, Mitar, MOŽINA, Martin, POLAJNAR, Matija, TOPLAK, Marko, STARIČ, Anže, ŠTAJDOHAR, Miha, UMEK, Lan, ŽAGAR, Lan, ŽBONTAR, Jure, ŽITNIK, Marinka, ZUPAN, Blaž. Orange : data mining toolbox in Python. Journal of machine learning research, ISSN 1532-4435. [Print ed.], Aug. 2013, vol. 14, str. 2349-2353. [COBISS-SI-ID 10118740]
ŽITNIK, Marinka, ZUPAN, Blaž. NIMFA : a Python library for nonnegative matrix factorization. Journal of machine learning research, ISSN 1532-4435. [Print ed.], Mar. 2012, vol. 13, str. 849-853. [COBISS-SI-ID 9067604]