Come si calcola la devianza in statistica
Introduzione
La statistica è quella parte di scienza che si occupa delle probabilità. Lo studio della statica è fondamentale e riguarda molti più ambiti di quelli che si possa pensare. Viene usata infatti dalle aziende che producono dispositivi elettronici per determinare il tasso di rottura e la vita media dei dispositivi, dalle aziende farmaceutiche, dai produttori di generi alimentari, oltre che dagli azionisti, dalle banche e da tutto il mondo che ruoto intorno all'economia. I concetti che stanno alla base della statistica sono quelli di media e di devianza, che viene usata per il calcolo della varianza (devianza divisa per il numero di eventi). Ma vediamo insieme cosa sono questi parametri per capire meglio come si calcola la devianza.
Occorrente
- Calcolatrice
- Carta e penna
Conoscere il concetto di popolazione
La statistica si basa su quelli che vengono definiti "campioni" o "popolazioni". Una popolazione è un insieme di eventi sotto test a partire dal quale si vuole determinare una legge che grosso modo può essere applicata ad una popolazione molto maggiore. Ad esempio, se si vuole sapere il numero di dispositivi elettronici che si rompono in un anno, se ne analizza una popolazione di 100. Se in un anno solo un dispositivo risulta rotto si può ritenere che la probabilità è di 1/100. Ciò permette di capire quanti dispositivi possono rompersi su un milione prodotti. Tale concetto sembra semplice, purtroppo non è proprio così. Infatti la rottura di un solo dispositivo su 100 è puramente casuale e costituisce per tanto una probabilità. Rifacendo l'esperimento con una seconda popolazione di dispositivi (sempre 100), potrebbe verificarsi la rottura di un numero maggiore di dispositivi.
Calcolare la media
Si capisce bene che allora parlare della probabilità di rottura sviluppata su una singola popolazione (per quanto numerosa essa sia) non ha troppo senso. Si ricorre allora al concetto di media. Ovvero si esegue l'esperimento su N popolazioni (tutte con lo stesso numero di dispositivi), e si determina per ognuna di esse il numero di dispositivi rotti. Se ne calcola quindi la media algebrica di tali numeri (dividendola per il numero di popolazioni N e non per il numero di elementi appartenenti ad ogni popolazione). Supponiamo che tale media sia quindi uguale ad x. Si può supporre quindi con molta più esattezza quanto maggiore è il numero di N, che la probabilità di rottura di un dispositivo è x/N.
Calcolare la devianza
Solo dopo aver calcolato la media si può procedere al calcolo della devianza. Questa fisicamente rappresenta lo scostamento del parametro reale da quello atteso (media). Ovvero, supponiamo che la media su 100 campioni sia 6, ovvero che la probabilità di rottura sia 6/100. Eseguiamo di nuovo il test su di una nuova popolazione, uscirà esattamente 6? Non è detto. 6 risulta il numero più probabile, il valore atteso (media), ma non quello necessariamente verificabile. La devianza allora ci dà un'indicazione su quanto la media sia più probabile rispetto a tutti gli altri valori. La si calcola prendendo in considerazione i singoli numeri di dispositivi rotti (xi) e si sottrae ad ognuno il valore della media (x). La differenza viene elevata al quadrato. Si sommano quindi tutte le differenze.