Bene, questo mese l’ho ufficialmente dedicato alla finanza.
Mi scuso con quelli di voi che non masticano molto l’argomento, e magari sarebbero stati benone anche senza masticarlo.
Tuttavia ne sono convinto: la finanza è per il patrimonio personale un puntello, un inevitabile moltiplicatore. Così come la statistica lo è per la politica e in generale per la conoscenza del mondo!
Quindi, non me ne vogliate, ma oggi finisco di parlare del concetto di multicollinearità.
Che cos’è la multicollinearità
La multicollinearità è una situazione che si verifica nell’analisi di regressione quando due o più variabili indipendenti (predittori) sono altamente correlate tra loro. In altre parole, la multicollinearità si manifesta quando una variabile indipendente può essere predetta in modo lineare da un’altra variabile indipendente con un alto grado di accuratezza. Questo fenomeno può creare problemi nell’interpretazione dei risultati di un modello di regressione.
La multicollinearità può causare diversi problemi nell’analisi di regressione.
Ad esempio, quando c’è multicollinearità i coefficienti stimati della regressione possono diventare molto sensibili a piccoli cambiamenti nei dati. Ciò significa che aggiungendo o rimuovendo un’osservazione dal dataset, i coefficienti potrebbero cambiare in modo significativo, rendendo il modello instabile e poco affidabile.
In presenza di multicollinearità diventa difficile interpretare i coefficienti di regressione perché non è chiaro quale variabile indipendente stia effettivamente influenzando la variabile dipendente. Ad esempio, se stiamo cercando di capire l’effetto dell’età e dei chilometri percorsi sul valore di un’auto, e queste due variabili sono altamente correlate (perché un’auto più vecchia ha probabilmente percorso più chilometri), diventa difficile isolare l’effetto di ciascuna variabile.
Aumento della varianza dei coefficienti
La multicollinearità aumenta la varianza delle stime dei coefficienti di regressione, rendendo più difficile la determinazione dell’effettiva significatività dei predittori. Ciò può portare a risultati in cui le variabili appaiono non significative quando, in realtà, potrebbero avere un effetto significativo.
È stato troppo tecnico?
Spero vivamente di no!