lectures: complete notes.md
This commit is contained in:
parent
d0d03d521e
commit
5331587f71
@ -319,9 +319,9 @@ Vediamo un po' di metodi.
|
|||||||
sceglie un terzo punto x', per esempio tra a e x: se f(x') > f(x), allora
|
sceglie un terzo punto x', per esempio tra a e x: se f(x') > f(x), allora
|
||||||
tengo l'intervallo [x', b], altrimenti tengo [a, x] (cioè devono sempre
|
tengo l'intervallo [x', b], altrimenti tengo [a, x] (cioè devono sempre
|
||||||
esserci tre punti dentro, compresi gli estremi).
|
esserci tre punti dentro, compresi gli estremi).
|
||||||
- Se si uilizza il `rapporto aureo` (3 - √5)/2, allora la convergenza è
|
- Se si utilizza il `rapporto aureo` (3 - √5)/2, allora la convergenza è
|
||||||
ottimale. È una convergenza lineare, nel senso che il numero di cifre
|
ottimale. È una convergenza lineare, nel senso che il numero di cifre
|
||||||
significative che si ottengno del minimo cresce linearmente col numero
|
significative che si ottengo del minimo cresce linearmente col numero
|
||||||
di iterazioni.
|
di iterazioni.
|
||||||
- Se la funzione è particolarmente semplice, si può usare il `metodo della
|
- Se la funzione è particolarmente semplice, si può usare il `metodo della
|
||||||
parabola`: si fittano i tre punti con una parabola e si trova il minimo
|
parabola`: si fittano i tre punti con una parabola e si trova il minimo
|
||||||
@ -351,9 +351,9 @@ alcune funzioni di test patologiche.
|
|||||||
|
|
||||||
@8 ----------------------------------------------------------------------------
|
@8 ----------------------------------------------------------------------------
|
||||||
|
|
||||||
# Tecniche MonteCarlo
|
# Tecniche Monte Carlo
|
||||||
|
|
||||||
Una tecnica MonteCarlo è una qualsiasi tecnica che preveda la generazione di
|
Una tecnica Monte Carlo è una qualsiasi tecnica che preveda la generazione di
|
||||||
numeri casuali.
|
numeri casuali.
|
||||||
Si possono usare per stimare il valore dell'integrale e la convergenza è
|
Si possono usare per stimare il valore dell'integrale e la convergenza è
|
||||||
dell'ordine 1/√N. Il vantaggio rispetto alle tecniche numeriche è che la
|
dell'ordine 1/√N. Il vantaggio rispetto alle tecniche numeriche è che la
|
||||||
@ -377,7 +377,7 @@ covarianza perché i punti sono stati generati in modo correlato.
|
|||||||
|
|
||||||
# Numeri casuali e pseudocasuali
|
# Numeri casuali e pseudocasuali
|
||||||
|
|
||||||
Generare numeri veramente casuali è molto più compelsso di generare `numeri
|
Generare numeri veramente casuali è molto più complesso di generare `numeri
|
||||||
pseudocasuali`. Infatti il computer, per generarli, utilizza una formula ben
|
pseudocasuali`. Infatti il computer, per generarli, utilizza una formula ben
|
||||||
precisa che ha lo scopo di rendere dei numeri apparentemente casuali. In
|
precisa che ha lo scopo di rendere dei numeri apparentemente casuali. In
|
||||||
realtà hanno anche un periodo. I generatori attualmente usati sono
|
realtà hanno anche un periodo. I generatori attualmente usati sono
|
||||||
@ -402,25 +402,25 @@ su dei piani (o su iperpiani in N-dimensioni).
|
|||||||
|
|
||||||
# Numeri casuali secondo pdf generiche
|
# Numeri casuali secondo pdf generiche
|
||||||
|
|
||||||
Se si disponde di un generatore di numeri casuali uniformi, esistono tre
|
Se si dispone di un generatore di numeri casuali uniformi, esistono tre
|
||||||
metodi per generare numeri secondo una pdf generica:
|
metodi per generare numeri secondo una pdf generica:
|
||||||
|
|
||||||
- Reverse sampling:
|
- `Reverse sampling`:
|
||||||
Consideriamo la cdf F(x) di una variabile x distribuita secondo f(x) come
|
Consideriamo la cdf F(x) di una variabile x distribuita secondo f(x) come
|
||||||
una variabile casuale a sua volta. Si può facilmente dimostrare che la pdf
|
una variabile casuale a sua volta. Si può facilmente dimostrare che la pdf
|
||||||
di questa variabile è uniforme.
|
di questa variabile è uniforme.
|
||||||
Si possono quindi pescare numeri uniformemente tra 0 e 1 e poi calcolarne
|
Si possono quindi pescare numeri uniformemente tra 0 e 1 e poi calcolarne
|
||||||
la quantile (cioè l'inversa della F(x): si ottengono puntidistribuiti come
|
la quantile (cioè l'inversa della F(x): si ottengono punti distribuiti come
|
||||||
f(x)).
|
f(x)).
|
||||||
|
|
||||||
- Metodo di composizione:
|
- `Metodo di composizione`:
|
||||||
Si suddivide la pdf nella somma di due o più pdf (ognuna delle quali deve
|
Si suddivide la pdf nella somma di due o più pdf (ognuna delle quali deve
|
||||||
risultare normalizzata e quindi avrà il suo opportuno coefficiente
|
risultare normalizzata e quindi avrà il suo opportuno coefficiente
|
||||||
moltiplicativo). I coefficienti moltiplicativi verranno utilizzati per
|
moltiplicativo). I coefficienti moltiplicativi verranno utilizzati per
|
||||||
decidere quando pescare secondo una o l'altra pdf pescando un primo numero
|
decidere quando pescare secondo una o l'altra pdf pescando un primo numero
|
||||||
random. Un secondo numero random verrà poi usato tramite reverse sampling.
|
random. Un secondo numero random verrà poi usato tramite reverse sampling.
|
||||||
|
|
||||||
- Metodo hit-miss:
|
- `Metodo hit-miss`:
|
||||||
Si pescano numeri a caso in un'area che contiene la funzione e poi si
|
Si pescano numeri a caso in un'area che contiene la funzione e poi si
|
||||||
tengono se sono sotto alla funzione e si scartano se sono sopra.
|
tengono se sono sotto alla funzione e si scartano se sono sopra.
|
||||||
|
|
||||||
@ -432,20 +432,139 @@ modifiche alle strumentazioni sperimentali oppure no.
|
|||||||
|
|
||||||
@9 ----------------------------------------------------------------------------
|
@9 ----------------------------------------------------------------------------
|
||||||
|
|
||||||
# Tecniche di unfolding
|
# Tecniche di deconvoluzione
|
||||||
|
|
||||||
Esistono diverse tecniche di unfolding dei dati.
|
Esistono diverse tecniche di deconvoluzione dei dati.
|
||||||
|
|
||||||
- Matrice di correzione:
|
- `Matrice di correzione`:
|
||||||
Si suppone che i dati osservati derivino da quelli veri in questo modo:
|
Si suppone che i dati osservati derivino da quelli veri in questo modo:
|
||||||
|
|
||||||
ν = R * μ + β → ν_i = R_ij μ_j + β_i
|
ν = R * μ + β → νi = Rij μj + βi
|
||||||
|
|
||||||
dove β è un eventuale fondo e R è la matrice di correzione.
|
dove β è un eventuale fondo e R è la matrice di correzione.
|
||||||
Notare che Σj di R_ij dà l'efficienza con cui il segnale μ_j viene
|
Notare che Σj di R_ij dà l'efficienza con cui il segnale μ_j viene
|
||||||
trasformato in segnale osservato.
|
trasformato in segnale osservato.
|
||||||
|
In realtà i segnali osservati sono n_i, ognuno dei quali appartiene ad una
|
||||||
|
poissoniana di media ν_i. Si può massimizzare la Likelihood per trovare i
|
||||||
|
parametri ν_i e poi invertire la matrice e sottrarre il fondo.
|
||||||
|
|
||||||
In realtà i segnali osservati sono n_i, ognuno dei quali appartiene ad una
|
μj = (νi - βi) Rij^-1 ~ (ni - βi) Rij^-1
|
||||||
poissoniana di media ν_i. Si può massimizzare la likelihood per trovare i
|
|
||||||
parametri ν_i e poi invertire la matrice e sottrarre il fondo.
|
|
||||||
|
|
||||||
|
Massimizzando la Likelihood, si ottengono stimatori unbias e con varianza
|
||||||
|
minima n_i = ν_i. Se si fa così, però, non assomigliano affatto a quelli
|
||||||
|
corretti. Si deve accettare di minimizzare la varianza: `procedura di
|
||||||
|
unfolding generalizzata`.
|
||||||
|
|
||||||
|
- `Metodo dei fattori di correzione`:
|
||||||
|
I valori veri vengono stimati come:
|
||||||
|
|
||||||
|
μi = Ci (ni - βi)
|
||||||
|
|
||||||
|
dove Ci può essere stimato tramite simulazioni MC come:
|
||||||
|
|
||||||
|
μi = Ci νi → Ci = μi/νi
|
||||||
|
|
||||||
|
dove μi e νi sono creati attraverso due simulazioni MC:i primi simulando
|
||||||
|
solo la fisica del sistema e i secondi simulando anche la risposta della
|
||||||
|
strumentazione utilizzata (ma senza simulare il fondo).
|
||||||
|
In pratica, il fattore Ci ci dice quanta parte di quanto osservato nel bin
|
||||||
|
i-esimo appartiene effettivamente al bin i-esimo.
|
||||||
|
Questo metodo funziona bene se non c'è molta migrazione tra bin e bin: è
|
||||||
|
valido per dare una prima idea.
|
||||||
|
|
||||||
|
- `Unfolding generalizzato`:
|
||||||
|
In questo caso si cerca sempre uno stimatore bias con varianza maggiore ma
|
||||||
|
si cerca di ottenere una soluzione più liscia: lo si fa ponendo un limite Δ
|
||||||
|
alla differenza tra L_max e L(μ) usato:
|
||||||
|
|
||||||
|
L(μ) >= Lmax - ΔL
|
||||||
|
|
||||||
|
Dove L(μ) = Lmax se è soddisfatta la soluzione ML.
|
||||||
|
Tra le soluzioni che soddisfano questa equazione, si prende quella con la
|
||||||
|
maggiore smoothness. La smoothness è definita tramite una funzione S(μ)
|
||||||
|
chiamata funzione di regolarizzazione. Bisogna cioè massimizzare la
|
||||||
|
funzione:
|
||||||
|
|
||||||
|
f(μ) = αL(μ) + S(μ)
|
||||||
|
|
||||||
|
Per cominciare si fissa α, considerando che:
|
||||||
|
- per α = 0 si ottiene la soluzione più smooth che però ignora i dati;
|
||||||
|
- per α → ∞ la soluzione non è smooth, perché massimizzare f(μ) equivale
|
||||||
|
semplicemente a scegliere L(μ) = Lmax.
|
||||||
|
Poi si massimizza per μ, imponendo anche il constraint:
|
||||||
|
|
||||||
|
Σi νi = Σij Rij μj = Ntot
|
||||||
|
|
||||||
|
E quindi ci ri riduce al metodo dei moltiplicatori di Laplace, ovvero si
|
||||||
|
deve massimizzare:
|
||||||
|
|
||||||
|
f(μ) = αL(μ) + S(μ) + λ[Ntot - Σij Rij μj]
|
||||||
|
|
||||||
|
Esistono poi diversi metodi per scegliere α e S(μ).
|
||||||
|
|
||||||
|
- `Regolarizzazione di Tikhonov`:
|
||||||
|
Si prende come S(h) l'opposto della rms della derivata k-esima della
|
||||||
|
'funzione' μ, dove il segno meno è messo perché così, più la derivata
|
||||||
|
tende a 0, più la funzione è liscia. Chiaramente, trattandosi di dati
|
||||||
|
discreti, si fa la derivata numerica tra bin consecutivi.
|
||||||
|
|
||||||
|
- `Regolarizzazione col Max Ent`:
|
||||||
|
Si usa la definizione di entropia per un set di probabilità pi:
|
||||||
|
|
||||||
|
H = - Σi pi ln(pi)
|
||||||
|
|
||||||
|
e l'entropia è massima se tutte le probabilità sono uguali ed è minima
|
||||||
|
se una è unitaria e le altre sono tutte zero. L'idea è di usare H come
|
||||||
|
funzione di regolarizzazione, dove:
|
||||||
|
|
||||||
|
pi = μi/Ntot
|
||||||
|
|
||||||
|
Per quanto riguarda la scelta di α, in genere lo si sceglie minimizzando
|
||||||
|
la matrice di covarianza, cioè il χ².
|
||||||
|
|
||||||
|
@10 ---------------------------------------------------------------------------
|
||||||
|
|
||||||
|
# Catena di acquisizione
|
||||||
|
|
||||||
|
La grandezza da misurare viene convertita in segnale elettronico da un
|
||||||
|
trasduttore (per esempio un fotomoltiplicatore che converte l'energia di un
|
||||||
|
fotone in tensione); dopodiché il segnale viene digitalizzato da un ADC
|
||||||
|
(Analogical to Digital Converter) ed elaborato (per esempio con filtri e
|
||||||
|
amplificatori) e infine i dati vengono acquisiti da un'unità di acquisizione
|
||||||
|
dati, il DAQ (DAta acQuisition), e memorizzati.
|
||||||
|
Un sistema di acquisizione può influenzare i dati stessi se è implementato
|
||||||
|
un sistema di feedback nel circuito di amplificazione.
|
||||||
|
L'ADC comincia a registrare i dati dopo un segnale di `triggering`, ovvero
|
||||||
|
quando una certa soglia è stata superata, indicando che un segnale è stato
|
||||||
|
rilevato.
|
||||||
|
|
||||||
|
In un pc, i dati vengono salvati in formato binario. Mentre per i numeri la
|
||||||
|
conversione è immediata, per il linguaggio alfanumerico sono state inventate
|
||||||
|
delle `codifiche` come per esempio il codice ASCII o l'UTF8. La tabella unicode
|
||||||
|
contiene tutti codepoint e descrive come eventualmente si fondono.
|
||||||
|
|
||||||
|
Il `bus` è l'insieme delle linee elettriche che collega vari dispositivi,
|
||||||
|
ognuno dei quali è identificato univocamente da un indirizzo. I dispositivi
|
||||||
|
possono essere masters o slaves o entrambe le cose. Gli slaves possono solo
|
||||||
|
rispondere, mentre i masters possono decidere di mandare cose a chi vogliano.
|
||||||
|
|
||||||
|
Gli `ADC` possono essere peak-sensing (digitalizzano il valore di picco del
|
||||||
|
segnale) o flesh (campionando la forma del segnale). Alcuni parametri
|
||||||
|
caratterizzano un ADC:
|
||||||
|
|
||||||
|
- risoluzione: quantità di bit a disposizione;
|
||||||
|
- tempi di conversione: tempo impiegato a digitalizzare un segnale;
|
||||||
|
- precisione di conversione (derive termiche, ecc).
|
||||||
|
|
||||||
|
Il `trigger` determina che il segnale arrivato sia effettivamente segnale e
|
||||||
|
non fondo. È possibile che ci siano diversi parametri che devono essere
|
||||||
|
soddisfatti affinché il segnale possa essere ritenuto valido e ci vuole del
|
||||||
|
tempo per verificarli tutti. Questi diversi trigger sono dunque affiancati da
|
||||||
|
dei buffer che immagazzinano momentaneamente la grande quantità di segnali in
|
||||||
|
arrivo.
|
||||||
|
Ogni processore, infatti, ha un deadtime, cioè un tempo in cui non è in grado
|
||||||
|
di cominciare a processare altri segnali perché sta processando l'ultimo
|
||||||
|
arrivato. Quindi anche il processore finale, che è il vero collo di bottiglia,
|
||||||
|
ha un buffer.
|
||||||
|
|
||||||
|
-------------------------------------------------------------------------------
|
||||||
|
Loading…
Reference in New Issue
Block a user