Statistica descrittiva e inferenziale
Introduzione
La statistica è l'insieme delle metodologie utilizzate per studiare i fenomeni che hanno l'attitudine a variare. L'obiettivo di questa disciplina è quello di sintetizzare i dati, cercando di non smarrire troppe informazioni sui dati raccolti. In questa guida verranno forniti alcuni appunti di base di statistica descrittiva e di statistica inferenziale.
Differenze tra statistica descrittiva e inferenziale
La statistica descrittiva parte da dati certi e matematici per illustrare il contenuto probabile del campione osservato. La statistica inferenziale, invece, parte dall'analisi dei dati campionari, osservati per indurre le proprietà e le caratteristiche probabili della popolazione, ad esempio. Ma ciò che verrà calcolato, dunque, non sarà esaustivo e certo, bensì probabile, poiché saranno conclusioni tratte a partire da un campione che, proprio perché tale, è affetto da una componente aleatoria e casuale che fa sì che i dati analizzati contengano un determinato margine di errore.
Due famiglie di variabili
In statistica, la raccolta dei dati è fatta di unità e variabili che generano una matrice di dati. Ci sono due grandi famiglie di variabili: quella quantitativa, che assume valori numerici e descrive una variabile statistica, e quella qualitativa, che non assume valori numerici, ma ammette gradi e attributi distinti. Essa descrive una statistica variabile e può essere ordinabile o sconnessa.
La distribuzione di frequenza
Una volta che tutti i dati vengono raccolti, essi devono essere elaborati e presentati. Uno dei modi più comuni per fare ciò è la distribuzione di frequenza, che è possibile realizzare raggruppando in classi le unità statistiche N secondo le modalità K. La i-esima classe viene individuata attraverso il numero di n-i di unità statistiche che ad essa appartengono; la distribuzione di frequenza può essere di ampiezza uguale o diversa. Un altro modo per presentare i dati è attraverso dei grafici: solitamente vengono impiegati gli istogrammi e i diagrammi circolari (detti anche "a torta").
Indici sintetici
Con i dati statistici si possono fare confronti nel tempo e nello spazio. Per fare questi confronti non si possono utilizzare solo le tabelle grafiche, ma c'è bisogno anche di altri strumenti. Per facilitare il confronto con altri fenomeni, è importante ricorrere a dei numeri utilizzando degli indici sintetici che possono essere di posizione (media, mediana, percentili), di variabilità (varianza, scarto quadratico medio, etc.) e di forma (simmetria, asimmetria positiva, asimmetria negativa, indice normalizzato di asimmetria, etc.).