Come calcolare l'errore quadratico medio di un campione di misure
Introduzione
Calcolare l'errore quadratico medio di un campione, insieme al calcolo di scarto, deviazione standard, covarianza e correlazione, è uno dei passi fondamentali durante il calcolo degli errori. In statistica risulta di estrema importanza il calcolo dell'errore quadratico medio, poiché esso ci consente di capire quanto le nostre misurazioni ci hanno fatto erroneamente discostare da un dato valore atteso. Vediamo insieme come calcolare il suddetto errore quadratico medio di un campione di misure, fornendo anche delucidazioni sulle varie definizioni matematiche coinvolte (come tipi di errori e di variabili casuali).
Errore casuale ed errore sistematico
Prima di iniziare, diamo uno sguardo alle definizioni standard di errore: possiamo distinguere l'errore casuale, "componente dell'errore che varia in modo imprevedibile se si replica la misura" (cioè dipendenti dal caso, non controllabili o arginabili), dall'errore sistematico, "componente dell'errore che rimane costante o varia in modo prevedibile" (strumenti per la misurazione non correttamente funzionanti o misurazione condotta in modo errato ripertuto dal principio). L'errore quadratico medio di un campione di misure ci dà un'idea di quanto questi probabili errori abbiano variato il risultato derivante dalle nostre misurazioni.
Variabile casuale unidimensionale discreta, continua o multidimensionale
Successivamente, è bene rispolverare le definizioni di variabile casuale unidimensionale discreta, variabile casuale unidimensionale continua e variabili casuali multidimensionali.
Per "variabile" intendiamo un elemento che può assumere una data serie di valori; per "casuale" (o aleatoria) intendiamo dire che il suddetto valore assunto dalla variabile (nella data serie di valori possibili) è stabilito da un processo casuale; per "unidimensionale discreta" intendiamo una variabile che può assumere dati valori appartenenti ad un dato gruppo di valori finito, mentre per "unidimensionale continua" intendiamo una variabile che può assumere valori appartenenti ad un dato insieme continuo (ovvero un gruppo di valori dove è sempre possibile trovare un terzo valore tra due, quindi un gruppo composto da infiniti valori). Se abbiamo davanti un evento casuale complesso che è stato possibile scomporre in più eventi semplici, ognuno di questi potrà essere descritto da una variabile chiamata "casuale multidimensionale" poiché facente riferimento, assieme alle variabili degli altri eventi semplici, ad una scomposizione di un evento complesso.
L'errore quadratico medio
Come definiamo, a questo punto, l'errore quadratico medio? Ebbene, esso non è altro che una misura matematica indicante gli errori commessi durante la misurazione di grandezze fisiche o durante la loro elaborazione mediante relazioni funzionali. Grazie a questa misura noi possiamo osservare la discrepanza tra ciò che è stato rilevato e ciò che invece era stimato.
L'errore quadratico medio è definito, matematicamente, come la somma tra la varianza dello stimatore e il quadrato dello scostamento (distorsione) dello stimatore. In sostanza, l'errore quadratico medio permette di giudicare la qualità dello stimatore attraverso la correttezza delle sue misurazioni riguardo un certo parametro prestabilito. Generalmente non è mai possibile supporre di poter condurre delle osservazioni perfette, da qui la grande utilità del poter calcolare l'errore quadratico medio successivamente ad una serie di osservazioni.
Il calcolo matematico dell'errore quadratico medio
Il calcolo dell'errore quadratico medio è applicabile solamente alle variabili unidimensionali discrete e alle variabili unidimensionali continue. L'errore quadratico medio della media di un campione (e quindi, per estensione, mediamente di tutti i campioni) si calcola mettendo a rapporto il quadrato della sommatoria della differenza tra ogni misurazione e il valore atteso, e il numero di misurazioni effettuate.