Come calcolare la distribuzione marginale
Introduzione
All'interno dei paradigmi di probabilità e di statistica, la distribuzione marginale è un sottoinsieme di una collezione di variabili causali la cui distribuzione di probabilità delle variabili vengono contenute all'interno del sottoinsieme stesso. Il termine marginale deriva dal fatto che i valori ottenuti sono determinati sommando, in una tabella, le righe oppure le colonne della stessa e poi trascrivendo questi dati a margine, rispettivamente della colonna o riga sommata. Seguendo la guida capirete come calcolare, in modo metodico e preciso, la distribuzione marginale.
Il processo di marginalizzazione
Il primo fattore da tenere in considerazione quando si esegue il calcolo di una distribuzione marginale è la marginalizzazione, ossia lo scarto delle variabili superflue (cioè da scartare) che dovrete inserire fuori dall'apposita tabella, dette per tale motivo fuori marginalizzate. L'analisi dei dati deve tenere conto delle variabili casuali stanto attenti a limitare il numero delle stesse, prestando attenzione al caso in esame. Il primo passaggio consiste, quindi, in un'analisi del problema e in una creazione di un sottoinsieme di variabili, scartando quelle originali e riducendo il numero delle stesse. Con tale processo le variabili originali prenderanno il nome di variabili marginali.
Confronto tra modello matematico e reale
Una volta individuato le variabili marginali è utile mettere a confronto il modello matematico con un caso reale. Immaginate, quindi, di voler calcolare, ad esempio, quante probabilità esistono che un giorno, facendo una passeggiata, si venga colpiti all'improvviso da un fulmine. È importante tenere in considerazione la variabile casuale delle condizioni climatiche (bel tempo, cattivo tempo e rischio fulmini pericolosi) e quante possibilità ci sono che il fulmine colpisca proprio voi e non una zona limitrofa. A questo punto abbiamo da una parte la variabile A, ossia le condizioni climatiche, e dall'altra parte la variabile C, ossia le possibilità di essere colpiti o meno.
Simulazione reale
Prendendo in esame questo caso e chiamandolo L, sappiamo che questo dipenderà da A e che il valore di C potrà variare a seconda dell'andamento di A. È facile comprendere come sia molto più probabile essere colpiti da un fulmine qualora le condizioni climatiche prevedano una scarica di fulmini pericolosi sulla superficie terrestre, rispetto al caso in cui il clima sia sereno. Facendo il percorso inverso, cioè Invertendo i valori della distribuzione coniugata di A e C, si può arrivare a determinare la probabilità che questa coppia di eventi si verifichi automaticamente. Un consiglio, quindi, è quello di eseguire una simulazione reale sul problema che che si sta valutando, per arrivare ad un calcolo della distribuzione marginale ottimale, in modo da limitare le difficoltà nel calcolo della stessa e nell'inserimento dati del vostro quesito.
La Teoria delle Probabilità e la Statistica
La Distribuzione marginale rientra nei concetti che possono essere espressi all'interno delle concetti relativi alla Probabilità ed alla statistica. A conclusione di questa breve guida, appare necessario porre un breve cenno e descrivere di cosa si occupano queste due discipline, molto spesso in relazione tra di loro. Per Teoria di Probabilità si intende uno studio matematico delle probabilità di accadimento di un evento la cui ricorrenza è casuale. Per variabile casuale si intende una variabile che può assumere un'eterogeneità di valori in relazione ad un fenomeno di natura aleatoria. Un esempio di variabile casuale è l'evento lancio di un dado.La statistica di caratterizza come quella scienza che ha l'obiettivo di studiare ed analizzare in maniera approfondita, sia in termini quantitativi che qualitativi, un particolare fenomeno che abbia tra le sue caratteristiche fondamentali l'essere non completamente definito, ovvero che manchi della completa conoscenza di sè stesso. In generale, la statistica si suddivide in statistica descrittiva, che sintetizza dati mediante indici o grafici, e quella inferenziale, ha la finalità di stabilire come determinate caratteristiche di dati o di misure rilevate possano essere generalizzate in presenza di un errore stabilito a priori.
Guarda il video
Consigli
- Leggere sull'argomento su di un manuale di statistica e probabilità, in modo più approfondito.