Funzione di autocorrelazione semplice - Esempio in R

Sommario:

Funzione di autocorrelazione semplice - Esempio in R
Funzione di autocorrelazione semplice - Esempio in R
Anonim

In altre parole, la Simple Autocorrelation Function (FAS), o dall'inglese, Funzione di autocorrelazione, È una funzione matematica che ci aiuta a sapere quanto i dati di un dato periodo siano dipendenti dagli stessi dati di k periodi precedenti.

Generiamo una serie temporale annuale X che segue una distribuzione normale più un'inerzia. Possiamo anche utilizzare dati reali.

Metodologia

I programmi sono essenziali per lavorare sull'analisi dell'autocorrelazione. È possibile utilizzare programmi come Python, ma per l'analisi statistica e la gestione dei dati consigliamo R, o la sua versione migliorata, R Studio. Qui lavoreremo con R.

Calcolo

E come scriviamo la formula FAS nel codice R?

Sia R che Python hanno librerie in cui le formule sono collegate a un nome. Quindi è sufficiente aver installato la libreria che contiene la formula che vogliamo usare e chiamarla nello script.

Nel quione di R dobbiamo scrivere:

La funzione acf è dentro la libreria statistiche.

X -> Serie temporali che usiamo come campione per calcolare il FAS.

acf (X, ylim = c (-1,1)) -> Funzione di Autocorrelazione Semplice su X con limiti sull'asse verticale compresi tra -1 e 1, che sono i valori che può assumere il coefficiente di autocorrelazione.

Verifica

Questo passaggio non è necessario se abbiamo utilizzato il codice precedente poiché calcola le bande di confidenza stesso.

Per determinare se i coefficienti di autocorrelazione calcolati sono statisticamente significativi, dovremo stabilire delle bande di confidenza con i valori critici. In questo modo, data una percentuale di significatività, possiamo dire con certezza statistica se nei dati vi è o meno la presenza di autocorrelazione.

Allo stesso modo del coefficiente di correlazione, anche il coefficiente di autocorrelazione assume normalità e, quindi, calcoleremo l'intervallo di confidenza come segue:

Definiamo test di ipotesi come:

Al 95% di confidenza con un livello di significatività del 5%, troviamo il famoso 1,96 nelle tabelle normali. Il valore critico è dato da:

Dove la varianza dei coefficienti è data dall'approssimazione:

Sebbene diamo la formula, consigliamo di utilizzare programmi statistici per una maggiore precisione e velocità.

Risultato

Tutte le righe che terminano al di fuori della banda di confidenza indicano che la serie temporale mostra un'autocorrelazione nel periodo indicato.

Quindi, in base al grafico, vediamo che c'è presenza di autocorrelazione in questa serie storica nei periodi in cui la linea sporge dalla banda discontinua.

La prima riga che è a 0 e spara verso 1 può essere ignorata poiché t deve essere strettamente maggiore di 0 e in questo caso non lo è. Non ha molto senso dover fare tutti i passaggi precedenti per conoscere l'autocorrelazione di now con now perché la conosciamo già: la correlazione di una variabile con se stessa è 1, quindi abbiamo già la risposta.