Preskoči na glavno vsebino

J1-3010 Razvoj metod strojnega učenja za analizo podatkov na Velikem hadronskem trkalniku (LHC)

FMF_ARRS

Raziskovalni projekt (so)financira Javna agencija za raziskovalno dejavnost RS.

Članica UL: Fakulteta za matematiko in fiziko

Šifra projekta: J1-3010

Naziv projekta: Razvoj metod strojnega učenja za analizo podatkov na Velikem hadronskem trkalniku (LHC)

Obdobje: 1. 10. 2021 - 30. 9. 2024

Letni obseg: 1 FTE, cenovna kategorija: F

Vodja: Borut Paul Kerševan

Veda: Naravoslovje
Sodelujoče RO, sestava projektne skupine in bibliografske reference

Vsebinski opis projekta :

Z naraščajočo zapletenostjo raziskav v eksperimentalni fiziki osnovnih delcev, iskanju procesov nove fizike v postopno večjih in kompleksnejših naborih podatkov, ki se analizirajo pri eksperimentih LHC, je treba raziskati nove pristope k analizi podatkov, od rekonstrukcije do simulacije. Glavni cilj tega projekta je razviti in preizkusiti najsodobnejša znanstvena orodja za simulacijo, rekonstrukcijo in analizo podatkov HEP z uporabo programskih tehnologij, ki temeljijo na strojnem učenju (Machine Learning), zlasti na poglobljenem učenju (Deep Learning). Ta orodja se bodo izvajala na najnovejših (strojno pospešenih) tehnoloških orodjih v HPC super‐računalniških gručah in s tem učinkovito odgovorila na izzive hitrosti in natančnosti, ki so ključnega pomena za obstoječo in novo generacijo eksperimentov na trkalnikih z visoko energijo (HEP).

Rezultati in dosežki projekta:

Z naraščajočo zapletenostjo raziskav v eksperimentalni fiziki osnovnih delcev, iskanju procesov nove fizike v postopno večjih in kompleksnejših naborih podatkov, ki se analizirajo pri eksperimentih na Velikem hadronskem trkalniku (Large Hadron Collider, LHC) v Evropskem laboratoriju za jedrske raziskave CERN v Ženevi, je treba raziskati nove pristope k analizi podatkov, od rekonstrukcije do simulacije. Glavni cilj tega projekta je razviti in preizkusiti najsodobnejša znanstvena orodja za simulacijo, rekonstrukcijo in analizo podatkov HEP z uporabo programskih tehnologij, ki temeljijo na strojnem učenju (Machine Learning), zlasti na poglobljenem učenju (Deep Learning).

Projekt je strukturiran v obliki dveh nalog:

Naloga 1: Razvoj novih orodij na osnovi strojnega učenja (machine learning, ML) za označevanje težkih resonanc v zahtevnem okolju analize podatkov na LHC kar vključuje razpade več težkih resonanc, ki nastanejo v istem dogodku (trku protonov), kar ima za posledico prekrivanje produktov razpada (npr. par Higgsovih bozonov, ki razpade v kvarke b ali šibke bozone, nastanek težkih delcev vrste SUSY (super-simetrija) ipd.). Projekt preučuje optimalno uporab pristopov strojnega učenja pri končnih stanjih z mešanico leptonov in pljuskov delcev kompleksnih razpadnih verigah težkih resonanc (npr. razpadi parov težkih novih delcev (resonanc), semi-leptonska razpadna veriga para) in posledično izboljšavo kinematične rekonstrukcije in razreševanja različnih kombinatoričnih hipotez zaradi prekrivanja razpadnih verig. Raziskave v okviru projekta združujejo uporabo "standardnih" globokih nevronskih mrež (DNN) v inovativnih kombinacijah, kjer na primer uporabljamo konkurenčne (kontradiktorne) napovedi DNN za različne hipoteze (več vrst ozadja in signalov) da tekmujejo v razrešitvi dvoumnosti več razpadnih verig in to sestavljamo v optimalno konfiguracijo za napoved hipoteze za posamezni analizirani trk protonov.

Pristopi, raziskovani v tem projektu, so bili uporabljeni v analizi podatkov pri iskanju razpada para Higgsovih bozonov v težke kvarke – par kvark b in anti-b ( ) [1] .

Naloga 2: Zelo hitra simulacija detektorja na osnovi ML. Projekt v okviru te naloge raziskuje potencial metod strojnega učenja glede dosegljive natančnosti in hitrosti za zelo hitro simulacijo odziva detektorja ATLAS, torej simulirano napoved dogajanja pri trkih protonov na LHC. Simulirani podatki so bistveni pri analizi podatkov iz LHC, saj nam omogočajo določitev verjetnostnih porazdelitev (hipotez) v končni statistični analizi zajetih podatkov. Trenutno je v uporabi (pre)počasna natančna simulacija odziva detektorja, ki temelji na programskem orodju GEANT, ki pa nam zaradi počasnosti, kljub velikim računskim kapacitetam, ki so na voljo, omogoča sorazmerno majhno statistiko simuliranih dogodkov, kar bistveno prispeva k merski natančnosti pri analizi podatkov. Tako so v razvoju in uporabi tudi hitrejše metode za simulacijo, kjer se v okviru raziskav (in tudi tega projekta) implementirajo metode strojnega učenja. Te nove simulacije se preizkušajo na komponentah geometrije in poddetektorja v primeru geometrije detektorja ATLAS, vendar pa so uporabljena orodja in metode prenosljiva na druge geometrije detektorjev (npr. CMS) in bolj splošne primere uporabe. Naloga raziskuje potencial uporabe takšnih orodij v različnih simulacijskih konfiguracijah oziroma pristopih:

- inkluzivni opis odziva celotne simulacijske verige ali pa,

- zamenjava dele simulacije detektorja z algoritmi strojnega učenja, pri čemer je bistveni element simulacija kalorimetrov v detektorju ATLAS (predvsem elektromagnetnega), ki so najbolj računsko potratni v klasični implementaciji.

Kot je navedeno tudi v naslednji točki, so raziskave v okviru tega projekta prispevale k razvoju nove generacije orodja za hitro simulacijo odziva detektorja ATLAS na fizikalne procese z imenom AtlFast3 [2], to orodje je tudi že v uporabi v mednarodni kolaboraciji ATLAS za analizo novih podatkov na Velikem hadronskem trkalniku LHC iz leta 2022.

  1. AAD, G., CINDRO, Vladimir, FILIPČIČ, Andrej, GORIŠEK, Andrej, HITI, Bojan, KERŠEVAN, Borut Paul, KRAMBERGER, Gregor, LEBAN, Blaž, MAČEK, Boštjan, MANDIĆ, Igor, MIJOVIĆ, Liza, MIKUŽ, Marko, MUŠKINJA, Miha, NOVAK, Jakob, NOVAK, Tadej, et al., Atlas Collaboration. Search for resonant pair production of Higgs bosons in the b anti-b b anti-b final state using p collisions at \sqrt{s}=13 TeV with the ATLAS detector. Physical review. D. 2022, vol. 105, no. 9, str. 092002-1-092002-36. ISSN 2470-0010. DOI: 10.1103/PhysRevD.105.092002. [COBISS.SI-ID 129408771],
  2. AAD, G., LEBAN, Blaž, CINDRO, Vladimir, FILIPČIČ, Andrej, GORIŠEK, Andrej, HITI, Bojan, KERŠEVAN, Borut Paul, KRAMBERGER, Gregor, MAČEK, Boštjan, MANDIĆ, Igor, M MIKUŽ, Marko, MUŠKINJA, Miha, NOVAK, Jakob, NOVAK, Tadej, et al., ATLAS Collaboration. AtlFast3 : the next generation of fast simulation in ATLAS. Computing and software for big science. 2022, no. 1, vol. 6, str. 7-1-7-54. ISSN 2510-2044. DOI: 10.1007/s41781-021-00079-7. [COBISS.SI-ID 104757507]