Statistica: come standardizzare una distribuzione normale

Tramite: O2O
Difficoltà: media
18

Introduzione

Nella teoria delle probabilità, la distribuzione normale è una distribuzione di probabilità continue, ovvero una funzione che indica la probabilità che un evento possa accadere tra due limiti reali o numeri reali, man mano la curva si avvicina a zero su entrambi i lati. Le distribuzioni normali sono estremamente importanti per le statistiche e sono spesso utilizzate nello studio delle scienze naturali e sociali, per determinare i valori reali variabili e casuali. Per standardizzare una distribuzione normale, alcune procedure devono essere utilizzate per preparare i dati alla modellazione. Vediamo insieme nella seguente guida come procedere per standardizzare una distribuzione normale.

28

Coefficienti

I dati, dunque, devono essere normalizzati o standardizzati per far sì che tutte le variabili si trovino in proporzione tra loro. Ad esempio, se una variabile è 100 volte più grande di un'altra, allora il modello potrebbe essere migliore se si normalizzano queste variabili per renderle grossomodo equivalenti. Tecnicamente però, se normalizzati, i coefficienti associati a ciascuna variabile dovranno scalare in modo appropriato per regolare la disparità nelle dimensioni variabili. Tuttavia, in questo modo i coefficienti rifletteranno le attività più significative tra ciascuna variabile.

38

Contributo

Considerando che i dati non standardizzati rifletteranno il contributo positivo o negativo verso la funzione obiettivo, sarà molto più difficile da interpretarli in termini di impatto relativo sulla funzione obiettivo. I dati qualitativi non numerici devono pertanto essere convertiti in dati quantitativi numerici e standardizzati. Normalizzare i dati significa adattarli all'interno di un'unità, in modo che ognuno di essi avrà un valore compreso tra da 0 e 1.

Continua la lettura
48

Standarizzazione

Poiché alcuni modelli si annullano quando raggiungono lo zero, a volte viene impostato un intervallo arbitrario tra 0,1 e 0,9 è. L'equazione standard, è quella che dovrebbe essere utilizzata per implementare una normalizzazione basata sull'unità. X Min rappresenta i minimi tra tutti i punti dati; X Max i massimi tra tutti i punti dati; X i, da 0 a 1 indica il punto medio dei dati i normalizzati tra 0 e 1; mentre X i indica invece qualsiasi punto di i. I dati devono dunque essere standardizzati per rimuovere la loro scala dalla modellazione. Ricordate che la standardizzazione della distribuzione normale resta il metodo preferito dal momento che produce informazioni significative su ogni punto di dati.

58

Punteggi standard

Quando una distribuzione di frequenza è distribuita normalmente, possiamo scoprire la probabilità che un punteggio si verifichi standardizzando i punteggi, noti come punteggi standard (o punteggi z). La normale distribuzione standard converte semplicemente il gruppo di dati nella nostra distribuzione di frequenza, in modo tale che la media sia 0 e la deviazione standard sia 1. I punteggi Z sono espressi in termini di deviazioni standard dalle loro medie. Risultante, questi punteggi z hanno una distribuzione con una media di 0 e una deviazione standard di 1. La media dei valori standardizzati sarà sempre zero e la deviazione standard sarà sempre una. Il grafico dei valori standard avrà esattamente la stessa forma del grafico dei dati grezzi, ma potrebbe avere dimensioni diverse e avere coordinate differenti.

68

Variabile causale

Si supponga di avere una variabile casuale distribuita normalmente e si desideri calcolare la probabilità che il suo valore si verifichi nell'intervallo delle deviazioni medie più o meno .5 standard. Un metodo è quello di standardizzare la variabile casuale. La standardizzazione di una variabile casuale distribuita normalmente consente ad un'analista o ricercatore di determinare con facilità la probabilità associata ad un intervallo di valori per quella variabile, utilizzando una tabella di distribuzione standardizzata. Una variabile casuale distribuita normalmente può essere standardizzata usando una formula. La lettera Z rappresenta la variabile casuale standardizzata e le probabilità associate agli intervalli di valori di Z possono essere trovate in una tabella di distribuzione Z. E il punteggio Z di x è zero, allora il valore di x è uguale alla media. Se il punteggio Z di x è uno, allora il valore di x è una deviazione standard superiore alla media. Se il punteggio Z è -1, il valore di x è una deviazione standard al di sotto della media. Se il punteggio Z di x è due, allora il valore di x è due deviazioni standard al di sopra della media.

78

Guarda il video

Potrebbe interessarti anche

Segnala contenuti non appropriati

Tipo di contenuto
Devi scegliere almeno una delle opzioni
Descrivi il problema
Devi inserire una descrizione del problema
Si è verificato un errore nel sistema. Riprova più tardi.
Segnala il video che ritieni inappropriato
Devi selezionare il video che desideri segnalare
Verifica la tua identità
Devi verificare la tua identità
chiudi
Grazie per averci aiutato a migliorare la qualità dei nostri contenuti

Guide simili

Università e Master

Come verificare che la distribuzione in una serie di dati sia normale

In moltissimi settori, dall'industria all'economia, fino ai molteplici esperimenti scientifici, occorre spesso effettuare dei test statistici. I test statistici sono spesso finalizzati alla verifica dell'aleatorietá dell'incertezza legata alle misure...
Università e Master

Come trovare un percentile da una distribuzione normale

Se dopo un test si vuole confrontare la propria attitudine rispetto agli altri studenti, il percentile consente di confrontare i numeri in un insieme di dati, i quali forniscono la percentuale di punti dati sotto un numero specifico. Se si è al 50°...
Università e Master

Come calcolare la distribuzione marginale

All'interno dei paradigmi di probabilità e di statistica, la distribuzione marginale è un sottoinsieme di una collezione di variabili causali la cui distribuzione di probabilità delle variabili vengono contenute all'interno del sottoinsieme stesso....
Università e Master

Appunti di probabilità e statistica

La statistica è quella materia che studia, partendo dall'osservazione di specifici gruppi di soggetti, come i fenomeni si verificano, i metodi di rilevazione e le leggi che regolano ciò. La Probabilità è proprio quella sezione della statistica che...
Università e Master

Come prepararsi all'esame di Statistica

Tra le materie universitarie più ostiche da preparare per un esame sicuramente la Statistica ha un posto primario. La statistica è una materia molto complessa perché, oltre ad avere moltissimi dati da memorizzare, necessita anche di un piano di studi...
Università e Master

Come preparare l'esame di statistica

La Statistica è senza dubbio una delle materie più difficili per gli studenti che si iscrivono all'università: infatti la percentuale di quelli che superano l'esame è sempre bassa da sessione a sessione, non per questo, però, bisogna abbattersi....
Università e Master

Appunti di statistica

La presente guida fornirà tutte le spiegazioni riguardanti gli appunti di statistica, una scienza complessa molto affascinante. Questa consente di valutare, studiare e conoscere dei fenomeni sociali di enorme interesse e portata. L'obiettivo è quello...
Università e Master

Come fare una semplice analisi statistica dei dati

La statistica è una disciplina che ha il fine di sintetizzare un insieme più o meno vasto di dati o, più in generale, di informazioni attraverso l'uso di grafici, valori tabellati o parametri specifici. Con l'analisi statistica dei dati otterremo quindi,...
I presenti contributi sono stati redatti dagli autori ivi menzionati a solo scopo informativo tramite l’utilizzo della piattaforma www.o2o.it e possono essere modificati dagli stessi in qualsiasi momento. Il sito web, www.o2o.it e Arnoldo Mondadori Editore S.p.A. (già Banzai Media S.r.l. fusa per incorporazione in Arnoldo Mondadori Editore S.p.A.), non garantiscono la veridicità, correttezza e completezza di tali contributi e, pertanto, non si assumono alcuna responsabilità in merito all’utilizzo delle informazioni ivi riportate. Per maggiori informazioni leggi il “Disclaimer »”.