Mistura di distribuzioni
Da Wikipedia, l'enciclopedia libera.
Una mistura di distribuzioni è una variabile casuale la cui funzione di probabilità (nel caso di una variabile casuale discreta) o funzione di densità di probabilità (nel caso di una variabile casuale continua) è data da una media ponderata di funzioni di probabilità o densità di altre variabili casuali.
Nel caso di una mistura finita di distribuzioni continue la funzione di densità di probabilità (f.d.p.) è descritta in generale da
con il vincolo che e dove gi sono k f.d.p., le quali possono a loro volta avere dei parametri che le caratterizzano.
Ad esempio una mistura di due distribuzioni normali ha come funzione di densità di probabilità
- f(x;π1,μ1,σ1,μ2,σ2) = π1φ(x;μ1,σ1) + π2φ(x;μ2,σ2)
dove π2 = 1 − π1 e φ(x;μ,σ) è la funzione di densità di probabilità di una variabile casuale normale.
Uno dei casi nei quali si ricorre ad un mistrua di distribuzioni è quello delle subpopolazioni, ovvero quando una popolazione (di valori) è composta da più sottopopolazioni ciascuna con una propria distribuzione dei calori. Ad esempio, se si ritiene che sia l'altezza degli uomini che l'altezza delle donne è distribuita come una normale ma con la media per gli uomini maggiore della media delle donne, allora l'altezza degli individui senza distinzione di sesso è una mistura di due distribuzioni normali.
[modifica] Voci correlate
- distribuzione composta
- algoritmo EM