Come calcolare la devianza
Introduzione
La devianza costituisce un indice di dispersione dei dati, il quale determina la somma dei quadrati degli scarti della media di una variabile rappresentante una distribuzione di dati: in termini maggiormente semplici, essa fornisce un grado di dispersione di una certa variabile dal proprio valore mediano. Oltre ad essere un indicatore statistico abbastanza impiegato, la devianza viene adoperata anche per calcolare ulteriori indici di dispersione estremamente utili (come la varianza e lo scarto quadratico medio). Nella seguente dettagliata e speciale guida che verrà enunciata nei passaggi successivi, quindi, vi spiegherò bene come bisogna calcolare esattamente la devianza e quali formule matematiche sono necessarie da applicare, prevedendo anche un esempio numerico.
Occorrente
- Variabile "X"
- "N" valori
Trovare il medio
Il calcolo della devianza (somma dei quadrati degli scarti della media di una determinata variabile) è molto facile da compiere e bisognerà ipotizzare di avere una variabile "X" rappresentante una distribuzione di dati che potrebbero assumere "N" valori. Innanzitutto, sarà necessario trovare il valore medio della seguente distribuzione dei dati (indicato come "Xm"), il quale costituisce la media aritmetica dei valori assunti dalla "X" e si calcola come la somma degli "N" valori divisi per il numero dei valori "N".
Montare i parametri
Qui vengono indicati i valori montati dai parametri nel modello M0. Mentre i parametri montati per il modello saturo vengono entrambi applicati ai set di valori montati. Quindi sono implicitamente funzioni delle osservazioni y. Qui, il modello saturato è un modello con un parametro per ogni osservazione. In questo modo i dati si installano esattamente. Questa espressione è semplicemente. Quindi per calcolare la devianza bisogna applicare 2 volte il rapporto del logaritmo del modello. Ma bisogna applicare quello ridotto rispetto al modello completo. La devianza viene utilizzata per confrontare due modelli. In particolare nel caso di modelli lineari generalizzati (GLM) dove ha un ruolo simile alla varianza. Ma si tratta comunque di varianza residua da ANOVA nei modelli lineari (RSS). Supponiamo che nel quadro del GLM troviamo due modelli nidificati. Quindi M1 e M2. In particolare, supponiamo che M1 contenga i parametri in M2 e k parametri aggiuntivi. A questo punto calcolare la devianza sarà una passeggiata.
Determinare le differenze
Dopodichè, sarà necessario determinare le differenze fra ciascun valore di "X" e la media "Xm", ottenendo "D1 = 3 - 28,8 = -25,8", "D2 = 9 - 28,8 = -19,8", "D3 = 33 - 28,8 = 4,2", "D4 = 34 - 28,8 = 5,2" e "D5 = 65 - 28,8 = 36,2". Successivamente, si dovranno trovare i quadrati delle differenze e cosi si otterrà "Q1 = D1^2 = 665,64", "Q2 = D2^2 = 392,04", "Q3 = D3^2 = 17,64", "Q4 = D4^2 = 27,04" e "Q5 = D5^2 = 1310,44". Adesso, sarà finalmente possibile determinare la devianza, effettuando la somma dei quadrati appena ottenuti: in questo modo, si avrà "D = Q1 + Q2 + Q3 + Q4 + Q5 = 2412,8".
Guarda il video
