L'analisi della varianza, o ANOVA (analisi della varianza), sono tecniche di analisi delle dipendenze multivariate utilizzate per determinare se esistono differenze significative tra le medie di tre o più gruppi di popolazione.
Pertanto, con questa analisi scopriremo se ci sono differenze tra determinati gruppi quando modifichiamo una o più caratteristiche. Per scoprirlo, usiamo il valore della media dei dati.
Il suo uso è molto frequente in campi come l'economia o la medicina.
Precedenti ipotesi dell'analisi della varianza
Ci sono una serie di prerequisiti per eseguire l'ANOVA che dovrebbero essere conosciuti. Questi sono essenziali affinché i risultati siano adeguati.
- Innanzitutto, la popolazione deve seguire una distribuzione normale. Si tratta quindi di un tipo di contrasto parametrico, essendo noti i parametri di popolazione della media e della deviazione standard.
- Inoltre, i campioni utilizzati devono essere indipendenti l'uno dall'altro. Ciò significa che una modifica in uno di essi non deve influire sul valore degli altri.
- D'altra parte, le varianze delle popolazioni oggetto di studio devono essere uguali. Questa si chiama omoschedasticità.
Classificazione dell'analisi dei modelli della varianza
Per l'analisi dei modelli della varianza si possono utilizzare le tre classificazioni sotto riportate:
- Modello a effetti fissi: Le popolazioni sono normali e differiscono solo per il valore delle rispettive medie.
- Modello ad effetti casuali: In questo caso, i dati hanno una gerarchia e le differenze di popolazione dipendono da essa.
- Modello ad effetti misti: Saremmo di fronte a un modello che è un misto dei due precedenti.
Esempio ANOVA: concetti importanti
Ci sono equazioni matematiche di una certa complessità per eseguire l'ANOVA. Tuttavia, in Economy-Wiki.com optiamo per l'economia semplice e, quindi, sfruttando la tecnologia, mostreremo come si potrebbe fare in un foglio di calcolo.
Immaginiamo di voler sapere se ci sono differenze significative tra i lettori di Economy-Wiki.com, in base all'affinità della loro laurea con l'economia.
Attenzione: i dati che utilizzeremo sono fittizi.
Dobbiamo andare su Dati, Analisi dati e sceglieremo l'analisi della varianza di un fattore.
Il rango sarebbe la matrice dei tre gruppi. Potrebbe essere più interessante includere i titoli in seguito e fornire la formattazione desiderata. Nel nostro caso, con il logo e il colore blu.
Vediamo che ci sono alcuni concetti come gradi di libertà e probabilità o significato. Il primo viene calcolato automaticamente ed è il numero di gruppi meno uno. Il secondo ci dice se le differenze sono significative o meno.
Di solito si parte da un livello di fiducia accettato. In economia è solitamente del 95% (0,95), che è correlato a una significatività di 0,05 (1-0,095). Pertanto, se tale probabilità o valore p è inferiore alla significatività accettata, le differenze sono significative.
In questo caso, sembra che il grado non influenzi il numero di lettori (significato > 0,05). Pertanto, l'analisi della varianza sembra indicare che Economy-Wiki.com interessa tutti, non solo i lettori specializzati. Certo che sono dati fittizi o no?