lectures: went on writing notes.md
This commit is contained in:
parent
7683d9e2dd
commit
ea6b28f76b
@ -136,3 +136,40 @@ purezza una volta fissata l'efficienza è il rapporto delle Likelihood:
|
|||||||
|
|
||||||
o comunque il rapporto delle probabilità di ottenere il campione misurato
|
o comunque il rapporto delle probabilità di ottenere il campione misurato
|
||||||
secondo le due ipotesi.
|
secondo le due ipotesi.
|
||||||
|
Nel caso in cui le due pdf siano gaussiane, il discriminante di Fisher porta
|
||||||
|
allo stesso risultato che si otterrebbe con il rapporto delle likelihood.
|
||||||
|
|
||||||
|
# Confronto di due datasets
|
||||||
|
|
||||||
|
Il test di `Kolmogorov-Smirnov` serve per confrontare dati non binnati: o un set
|
||||||
|
di dati con una funzione attesa, oppure due set di dati tra loro. Siccome
|
||||||
|
confronta tra loro le cumulative, va bene nel confrontare shifts dei dati o
|
||||||
|
grandi variazioni ma non piccoli dip nelle pdf. Per farlo in più dimensioni,
|
||||||
|
esistono varie idee ma non c'è n'è una standard e soprautto la distribuzione
|
||||||
|
della statistica non è nota e va simulata.
|
||||||
|
Se i dati sono binnati, invece, allora si può usare il `test del χ²`:
|
||||||
|
|
||||||
|
(ni - νi)²
|
||||||
|
χ² = Σ ---------
|
||||||
|
νi
|
||||||
|
|
||||||
|
e si guarda qual è il p-value della sua distribuzione, che è nota.
|
||||||
|
|
||||||
|
Il `p-value` è la probabilità di misurare un valore che si allontani ancora di
|
||||||
|
più del valore trovato rispetto alla statistica di test prevista dall'ipotesi
|
||||||
|
nulla. Ovvero:
|
||||||
|
|
||||||
|
- se H0 dice che il valore medio di t è t0
|
||||||
|
- ed io ho misurato un valore la cui statistica di test vale tx < t0
|
||||||
|
- il p-value è dato dall'integrale da -∞ a tx della pdf della statistica di
|
||||||
|
test nel caso in cui l'ipotesi nulla sia vera.
|
||||||
|
|
||||||
|
deve essere grande affinché l'ipotesi nulla possa essere ritenuta vera, dato
|
||||||
|
il dato controllato e quindi la significanza α dovrebbe essere grande (invece
|
||||||
|
la si mette sempre a 0.5 perché è standard). Oppure deve essere piccolo se
|
||||||
|
voglio confutarla (e quindi metterò una piccola significanza di riferimento).
|
||||||
|
Attenzione al `look-elsewhere effect`: se mi sforzo di trovare un p-value
|
||||||
|
minore di α (significanza), se faccio tante prove, prima o poi lo troverò, ma
|
||||||
|
non vuol dire che sia significativo.
|
||||||
|
|
||||||
|
@4 ----------------------------------------------------------------------------
|
||||||
|
Loading…
Reference in New Issue
Block a user