Uvod v bioinformatiko

2021/2022
Program:
Interdisciplinarni magistrski študijski program 2. stopnje Računalništvo in matematika
Letnik:
1 in 2 letnik
Semester:
prvi
Vrsta:
izbirni
ECTS:
6
Jezik:
slovenski, angleški
Nosilec predmeta:

Blaž Zupan

Izvajalec (kontaktna oseba):

Tomaž Curk, Blaž Zupan

Ure na teden – 1. semester:
Predavanja
3
Seminar
1.33
Vaje
0.67
Laboratorij
0
Vsebina

Kako podobna so si med seboj živa bitja? Smo ljudje res potomci neandertalcev? Kako so se živalske vrste lahko prilagodile na življenjska
okolja? Kateri geni so odgovorni za pojav različnih bolezni? Zakaj vsako leto potrebujemo drugo cepivo proti gripi?
Današnja biologija je polna zanimivih vprašanj in nikoli prej nismo bili tako blizu odgovorom. Nedavno razvite eksperimentalne biotehnologije omogočajo pridobivanje velikih količine eksperimentalnih podatkov: o genomih različnih vrst in osebkov, o genskih izrazih, koncentracij proteinov, vplivih učinkovin na delovanje celice, ipd. Tovrstni podatki so danes dostopni v javnih spletnih podatkovnih bazah in jih je potrebno statistično in matematično obdelati, v njih poiskati skrite vzorce in jih primeren način prikazati. Temu so namenjena orodja bioinformatike, področja, brez katerega danes ne bi mogli več odgovoriti niti na eno od zgoraj zapisanih vprašanj.
Gre za interdisciplinarno področje, ki združuje metode iz statistike, matematike, vizualizacije podatkov, strojnega učenja in umetne inteligence.
Pri predmetu si bomo v teoriji in na praktičnih primerih ogledali osnovne bioinformatične metode ter se spoznali s sledečimi vsebinami:
Osnove celične biologije
Statistične lastnosti nukleotidnih zaporedij
Računske tehnike za iskanje genov v nukleotidnih zaporedjih
Tehnike poravnave zaporedij, algoritem BLAST
Verjetnostni modeli zaporedij, markovske verige
Računske tehnike ocenjevanja genskih razlik med predstavniki osebkov iste vrste in osebkov različnih vrst
Filogenetska analiza, računski pristopi k odkrivanju evolucijskih dreves
Računske primerjave genomov
Analiza podatkov o genskih izrazih, uporaba tehnik uvrščanja in razvrščanja v skupine, genski izrazi v medicinski diagnostiki in prognostiki, analiza obogatenosti genskih skupin, vizualizacijske tehnike, genske mreže
Integrativna bioinformatika: uporaba različnih baz podatkov in baz znanj v namene odkrivanja smiselnih vzorcev v biomedicinskih podatkih
Teoretično predstavitev računskih pristopov in tehnik bo spremljal pregled javno dostopnih baz podatkov s področja, prikaz delovanja ustrezne odprtokodne programske opreme in prikaz uporabe tehnik in orodij pri reševanju praktičnih problemov s področja biomedicine in sistemske biologije. Pri analizi podatkov bomo uporabljali moderna skriptna okolja (npr. Python) in že razvite bioinformatične knjižnice (npr. Biopython in Orange). Uvod v uporabo bioinformatične programske opreme bo podan na predavanjih, praktično pa bomo ta orodja spoznali na vajah in pri projektnem delu.

Temeljni literatura in viri

Christianinni N, Hahn MW (2007) Introduction to Computational Genomics: A Case Study Approach. Cambridge University Press, Cambrige.
Durbin et al. (1998) Biological sequence analysis, Cambridge University Press
James D. Watson, Andrew Berry (2004) DNA: The Secret of Life, Arrow Books, UK. (also in Slovene: DNK, skrivnost življenja, Modrijan, Ljubljana, 2007).

Cilji in kompetence

Cilj predmeta je študente seznaniti z osnovnimi računskimi tehnikami, orodji in prosto dostopnimi bazami podatkov s področja bioinformatike. V okviru predmeta bodo predstavljene osnove biologije in genomike, ki bodo študentom računalništva omogočale razumevanje problemske domene tako, da lahko nato s pomočjo matematičnih, statističnih in računskih pristopov, ki
jih bo študent spoznal pri predmetu, poišče odgovore na sicer kompleksna vprašanja s področij evolucije in razvoja živih bitij, povezav med geni in biološkimi procesi, vpliv genskih predispozicij na razvoj bolezni, in podobnih.

Predvideni študijski rezultati

Po uspešnem zaklučku predmeta bo študent:
razumel osnovne pojme iz molekularne biologije in evolucije,
vedel, do kakšnih podatkov lahko dostopamo na področju molekularne biologije in kje na spletu je moč te podatke dobiti,
poznal osnovno matematične pristope in računske tehnike za modeliranje zaporedij,
poznal tehnke za filogenetsko analizo, analizo genskih izrazov in primerjavo genomov,
znal analizirati podatke s področja molekularne biologije z snovanjem in uporabe knjižnic v programskem jeziku Python,
lahko prepoznal priložnosti, ki jih uporaba računskih postopkov nudi na področju znanosti o življenju.

Metode poučevanja in učenja

Predavanja s podporo avdio-vizualne opreme, sprotni razvoj programskih rešitev, laboratorijske vaje v računalniški učilnici z ustrezno programsko opremo. Delo posamezno in v skupinah. Velik poudarek na praktičnem delu (npr. razvoj skript za pregledovanje in analizo podatkov) in reševanju praktičnih problemov.

Načini ocenjevanja

Sprotno preverjanje (domače naloge, kolokviji in projektno delo)
Končno preverjanje (pisni in ustni izpit)
(ocene: 5 (negativno), 6-10 (pozitivno), ob upoštevanju Statuta UL)

Reference nosilca

Pet najpomembnejših del:
Stajdohar M, Rosengarten RD, Kokosar J, Jeran L, Blenkus D, Shaulsky G, Zupan B (2017) dictyExpress: a web-based platform for sequence data management and analytics in Dictyostelium and beyond, BMC Bioinformatics. 2017 Jun 2,18(1):291.
Zitnik M, Zupan B (2016) Jumping across biomedical contexts using compressive data fusion, Bioinformatics 15,32(12):i90-i100.
Zitnik M, Nam EA, Dinh C, Kuspa A, Shaulsky G, Zupan B (2015) Gene prioritization by compressive data fusion and chaining, PLoS Computational Biology 11(10):e1004552.
Staric A, Demsar J, Zupan B (2015) Concurrent software architectures for exploratory data analysis. WIREs Data Mining and Knowledge Discovery 5(4):165-180.
Zitnik M, Zupan B (2015) Data fusion by matrix factorization. IEEE Transactions on Pattern Analysis and Machine Intelligence 37(1):41-53.
Celotna bibliografija je dostopna na SICRISu:
http://sicris.izum.si/search/rsr.aspx?lang=slv&,id=7764.