La guida completa sull'analisi di regressione

Pubblicato: 2020-03-18

Che cos'è l'analisi di regressione?

L'analisi di regressione è un metodo statistico utilizzato per eliminare una relazione tra una variabile dipendente e una variabile indipendente. È utile per accedere alla forza della relazione tra variabili.

Aiuta anche a modellare la relazione futura tra le variabili. L'analisi di regressione è composta da vari tipi tra cui lineare, non lineare e lineare multipla. Ma i più utili sono il semplice lineare e il multiplo lineare.

Tuttavia, l'analisi non lineare aiuta principalmente a gestire set di dati complicati. In insiemi di dati complicati, la variabile indipendente e quella dipendente mostrano una relazione non lineare.

In questo articolo:
  • Definizione
  • Usi dell'analisi di regressione
  • Quando utilizzare l'analisi di regressione
  • Come utilizzare l'analisi di regressione
  • Usi dell'analisi di regressione negli affari
  • Importanza dell'analisi di regressione
  • Scopo dell'analisi di regressione
  • Limiti dell'analisi di regressione
  • Tipi di analisi di regressione
  • Esempi di analisi di regressione
  • Strumenti di analisi di regressione

Perché dovresti usare l'analisi di regressione?

L'analisi di regressione è utile per fare varie cose. Di seguito discuteremo alcune ragioni principali per considerare l'analisi di regressione.

  1. Per analizzare un'ampia varietà di relazioni

    L'analisi di regressione può aiutare a gestire varie relazioni tra insiemi di dati. Puoi farlo in:

    • Modella più variabili indipendenti
    • Variabili continue e categoriali
    • Termini polinomiali per modellare le curvature
    • Accedere ai termini di interazione per determinare l'effetto di una variabile indipendente sul valore di un'altra variabile indipendente
  1. Per controllare variabili indipendenti

    Come notato, aiuta a descrivere il cambiamento in ciascuna variabile indipendente correlata alla variabile dipendente. Possiamo dire che controlla strategicamente tutte le variabili all'interno del modello.

    Definizione di controllo di una variabile: al termine dell'analisi di regressione, è necessario isolare il ruolo di ciascuna variabile. Per fare ciò, è necessario ridurre al minimo le variabili confondenti. Questo processo consente di conoscere meglio il ruolo di ciascuna variabile senza considerare le altre variabili.

    Come controllare altre variabili nella regressione: nell'analisi di regressione, mantieni costanti le altre variabili indipendenti includendole nel tuo modello. Gli studi dimostrano che una variabile rilevante può produrre risultati fuorvianti. Quindi, l'omissione di una variabile fa sì che il modello non sia controllato e il risultato è distorto verso la variabile che non è presente nel modello.

  1. Per interpretare l'output di regressione

    Nell'analisi di regressione, devi prima adattare e verificare di avere un buon modello. Dopo aver fatto ciò, devi guardare i coefficienti di regressione e i valori p. Quando hai un p-value inferiore a 0,05, la variabile indipendente è statisticamente significativa.

    Questo valore p ti aiuterà a determinare se la relazione che osservi nel campione funziona anche con la popolazione più ampia o meno.

  1. Per ottenere risultati di regressione affidabili

    Seguire i passaggi seguenti per ottenere un risultato di regressione affidabile.

    • Crea il modello corretto: se non sei in grado di includere l'intera variabile nel modello, il risultato può essere distorto.
    • Controllare i grafici residui: assicurarsi che il modello si adatti adeguatamente ai dati.
    • Correlazione: la correlazione tra le due variabili indipendenti è chiamata multicollinearità. La multicollinearità va bene, ma l'eccesso di multicollinearità può essere un problema.

Quando utilizzare l'analisi di regressione

Quando qualcuno dice analisi di regressione, spesso intende regressioni ordinarie dei minimi quadrati . Tuttavia, questo è appropriato quando esiste una variabile indipendente che è continua quando vengono soddisfatte determinate ipotesi.

Ma in realtà, ci sono vari tipi come regressioni di conteggio, regressione logistica, logistica multinomiale, logistica ordinale, quantile, multivariata e altri tipi.

L'analisi di regressione viene utilizzata principalmente per stimare una variabile target basata su un insieme di caratteristiche come la previsione dei prezzi delle case in base a cose come il numero di stanze per casa, l'età della casa, ecc.

Come eseguire l'analisi di regressione

Ora discuteremo di tutto ciò che riguarda la regressione, comprese le formule. Tutte le cose di base sono state discusse sopra.

Discuteremo come creare un grafico di regressione lineare in Excel e come eseguire la regressione in Excel usando le formule.

Come creare un grafico di regressione lineare in Excel

Disegnare un grafico di regressione lineare in Excel è molto semplice, basta seguire i passaggi seguenti per creare il grafico di regressione.

  • Seleziona le due colonne dei dati comprese le intestazioni.
  • Fai clic sulla scheda Inserisci e vai al gruppo chat, quindi fai clic sull'icona del grafico a dispersione. Dopo aver fatto ciò, fai clic sulla miniatura scatter. Questo inserirà un grafico a dispersione nel foglio di lavoro.
  • Ora traccia la retta di regressione dei minimi quadrati. Per fare ciò, fai clic su un punto qualsiasi e scegli aggiungi trendline dal menu contestuale.
  • Dal lato destro, il riquadro seleziona la forma della linea di tendenza lineare e controlla l'equazione di visualizzazione sul grafico per ottenere la formula di regressione.
  • Ora vai alla scheda Cambia e linea e personalizza la linea di conseguenza. Da qui puoi scegliere diverse linee e vari colori delle linee.
  • A questo punto, il tuo grafico sembrerà un grafico di regressione, ma devi comunque apportare alcuni miglioramenti.
  • Per fare i miglioramenti prima dovevi trascinare l'equazione per adattarla e poi aggiungere i titoli degli assi (se i punti dati iniziano dal centro dell'asse orizzontale o verticale, allora dovevi rimuovere lo spazio bianco in eccesso)

Come eseguire la regressione in Excel usando le formule

Excel ha alcune funzioni statistiche che possono aiutarti a eseguire l'analisi di regressione. Queste funzioni statistiche sono

  • REGR.LIN (C2:C25, B2:B25)
  • Pendenza (C2:C25, B2:B25)
  • INTERCETTA (C2:C25, B2:B25)
  • CORRELAZIONE (B2:B25,C2:C25)

Uso dell'analisi di regressione negli affari

L'analisi di regressione può essere molto utile per le aziende e di seguito abbiamo discusso alcuni degli usi principali.

  1. Analisi predittiva

    Aiuta a determinare i rischi e le opportunità future. È l'applicazione più utilizzata dell'analisi di regressione nel mondo degli affari.

    Ad esempio, un'azienda basata su prodotti può prevedere il numero di articoli che un consumatore acquisterà in futuro. Tuttavia, la regressione non si basa solo sulla variabile della domanda, ci sono vari altri fattori che creano un impatto diretto sul business. Quindi, la regressione ti aiuterà anche a considerare tutto e quindi a creare una decisione di successo per il futuro.

  1. Aumentare l'efficienza

    La regressione può aiutarti a ottimizzare il processo aziendale. Perché attraverso questo puoi creare le decisioni basate sui dati che eliminano le congetture, le politiche aziendali e le ipotesi dal processo decisionale.

    Pertanto, ciò migliorerà le prestazioni aziendali complessive fornendo un chiaro suggerimento delle aree che hanno il massimo impatto a causa dell'efficienza e delle entrate.

  1. Decisioni di supporto

    Al giorno d'oggi le aziende sono sovraccariche di dati finanziari, di acquisto e di altri dati relativi all'azienda. Quindi, è molto difficile ottenere alcune informazioni utili da esso. Ma con l'aiuto dell'analisi di regressione, puoi ottenere le informazioni utilizzabili dai big raw data.

    Quindi, questo è un modo più intelligente per creare decisioni più accurate per il futuro. Tuttavia, questo non significa che ora non ci sia bisogno del pensiero creativo. Questo è solo uno strumento per verificare l'ipotesi prima di uscire per l'esecuzione.

  1. Nuovi approfondimenti

    Nel tempo le aziende raccolgono molti dati. Ma il problema è che questi dati non sono organizzati. Inoltre, questi dati sono uno spreco senza fare la corretta analisi. Quindi, attraverso l'analisi di regressione, puoi mantenere lo stock ottimale.

Importanza dell'analisi di regressione negli affari

Ecco alcune applicazioni di regressione che ti aiuteranno a guidare la tua attività.

  1. Comprendere altri modelli

    Con l'aiuto dell'analisi di regressione, puoi comprendere tutti i tipi di modelli che compaiono nei dati. Inoltre, queste nuove intuizioni saranno molto preziose per te per capire come queste nuove intuizioni faranno la differenza nella tua attività.

  1. Correzione degli errori

    L'analisi di regressione non solo aiuta a creare una decisione migliore. Aiuta anche a trovare gli errori nei giudizi. Ti fornirà un supporto quantitativo per le decisioni e preverrà gli errori osservando vari fattori.

  1. Processo di ottimizzazione

    Comprendendo più dati, puoi aumentare la tua efficienza e perfezionare i processi per fornire tutti i vantaggi alla tua azienda. Inoltre, i processi ottimizzati dai dati aiuteranno le aziende a lavorare in modo più intelligente.

Se vuoi saperne di più su questo, dai un'occhiata a questo articolo: Importanza dell'analisi di regressione negli affari

Qual è lo scopo dell'analisi di regressione?

Lo scopo è quello di prevedere un risultato sulla base di dati storici. Questi dati storici sono compresi con l'aiuto dell'analisi di regressione.

Ad esempio, vuoi prevedere i dati del tipo di persone che acquistano il caffè. Quindi, in questo caso, troverai i dati della persona che acquista il caffè e raccoglie informazioni come età, altezza, stato finanziario e altre cose.

Ora, dopo aver analizzato questi dati, creerai un modello per prevedere se una persona acquisterà il caffè o meno. Quindi, possiamo dire che l'analisi di regressione viene utilizzata per prevedere il comportamento della variabile dipendente in base alle grandi variabili indipendenti.

Limitazione dell'analisi di regressione

Ci sono quattro limiti principali della regressione. Di seguito abbiamo discusso queste 4 limitazioni.

  • Si presume che la causa e l'effetto tra le relazioni rimarranno invariati.
  • La relazione funzionale che si ottiene tra due o più variabili sulla base di alcuni dati limitati potrebbe non essere valida se si prendono in considerazione più dati.
  • Implica un complicato e lungo processo di calcoli.
  • Non può essere utilizzato in caso di fenomeno qualitativo.

Tipi di regressione

Esistono in totale 7 tipi principali di regressione e di seguito abbiamo discusso in dettaglio questi 7 tipi.

  1. Regressione lineare

    Viene utilizzato per l'analisi predittiva. In questo è seguito un approccio lineare per modellare la relazione tra la risposta scalare e le variabili esplicative.

    Ciò si concentra principalmente sulla distribuzione di probabilità condizionata della risposta dato il valore dei predittori. Tuttavia, nella regressione lineare, esiste il pericolo di un adattamento eccessivo.

    L'equazione per la regressione lineare è Y' = bX + A.

  1. Regressione logistica

    Questa regressione viene utilizzata quando la variabile dipendente è dicotomica. Stima i parametri del modello logistico.

    Questa regressione aiuta a gestire i dati che hanno due possibili criteri.

    L'equazione per la regressione logistica è l = β 01 X 1 + β 2 X 2

  1. Regressione polinomiale

    Questa regressione viene utilizzata per i dati curvilinei. Si adatta perfettamente al metodo dei minimi quadrati. Questa analisi mira a modellare il valore atteso di una variabile dipendente y rispetto alla variabile indipendente x.

    L'equazione per la regressione polinomiale è l =β 00 X 1

  1. Regressione graduale

    Viene utilizzato per adattare il modello di regressione al modello predittivo. Questa regressione viene eseguita automaticamente. Tuttavia, ad ogni passaggio, la variabile viene aggiunta o sottratta dall'insieme delle variabili esplicative.

    In questo, c'è un approccio di selezione in avanti ed eliminazione all'indietro.

    La formula per la regressione graduale è b j.std = b j (S x * S Y -1 )

  1. Regressione della cresta

    Questa è una tecnica per analizzare più dati di regressione. In questo, quando si verifica la multicollinearità, le stime dei minimi quadrati sono imparziali.

    Un grado di distorsione viene aggiunto alle stime di regressione e per questo motivo la regressione della cresta riduce gli errori standard.

    L'equazione per la regressione della cresta è β = (X T X + λ * I) -1 X T Y

  1. Regressione con lazo

    In questo, vengono eseguiti sia i metodi di selezione delle variabili che di regolarizzazione. Utilizza la soglia morbida. Inoltre, seleziona solo un sottoinsieme delle covariate fornite da utilizzare nel modello finale.

    La formula per la regressione lazo è N -1i=1 N F (X i , Y i , α, β)

  1. Regressione della rete elastica

    È un metodo di regressione regolarizzato che combina linearmente le penalità dei metodi lazo e cresta. Viene utilizzato principalmente per supportare le macchine vettoriali, l'ottimizzazione del portfolio e l'apprendimento delle metriche.

    L'equazione per la regressione della rete elastica è ||β|| 1 = ∑ p j=1j |

Oltre ai tipi di cui sopra, dai un'occhiata a questi 20 tipi di analisi di regressione per la previsione

Esempi di analisi di regressione

Ora discuteremo quattro esempi di analisi di regressione di cui due sono relativi alla finanza e due non sono relativi alla finanza.

Ecco gli esempi relativi alla finanza.

  • Beat e CAPM: in finanza, utilizziamo l'analisi di regressione per calcolare il BETA per un'azione. Inoltre, può essere fatto facilmente con l'aiuto di Excel.
  • Previsione di entrate e spese: in finanza, utilizziamo anche l'analisi di regressione per prevedere i rendiconti finanziari delle aziende. In questo modo possiamo determinare quali cambiamenti nelle ipotesi di business influenzeranno le spese e le entrate future.

Ecco gli esempi che vengono praticati al di fuori della finanza.

  • Attraverso l'analisi di regressione, puoi trovare la relazione tra il numero di ore guidate dal conducente e l'età del conducente.
  • Con l'aiuto dell'analisi di regressione, puoi conoscere la relazione tra la percentuale di voti superati in una classe e il numero di anni di esperienza di un insegnante.

Strumenti di analisi di regressione

Esistono vari strumenti di analisi della regressione, ma di seguito sono riportati i 5 migliori strumenti migliori.

  1. Statistica massima

    Prezzo: 39€ per gli studenti e 79€ per gli altri utenti

    È uno strumento facile da usare e conveniente disponibile online. Sono necessari solo tre passaggi per completare l'analisi all'interno di un'unica finestra di dialogo. Poiché fornisce un'analisi passo dopo passo, è molto utile per studenti e giovani studiosi.

    Per saperne di più clicca qui (1) .

  1. AcaStat

    Prezzo: parte da $ 9,99 ma il prezzo aumenta con funzionalità aggiuntive.

    È uno dei migliori strumenti di analisi statistica. La caratteristica principale di questo è che analizza i dati utilizzando tecniche molto semplici. Inoltre, esegue l'analisi molto velocemente.

    Per saperne di più clicca qui (2) .

  1. NCSS

    Prezzo: l'abbonamento annuale è disponibile a $ 239.

    Un'ampia varietà di strumenti statistici e grafici è disponibile sul software NCSS per analizzare i dati. Offre anche altre strutture come l'organizzazione della documentazione, video di formazione gratuiti e un team di supporto via e-mail 24 ore su 24, 7 giorni su 7.

    Per saperne di più clicca qui (3) .

  1. XL Stat

    Prezzo: Il prezzo annuale di questo software è di $ 275. Ma puoi ottenerne una prova gratuita .

    È un software statistico che ha molte funzionalità per soddisfare le esigenze dell'utente. È anche compatibile con Microsoft Excel e puoi usarlo sia su PC che su Mac.

    Per saperne di più clicca qui (4) .

  1. SAS

    Prezzo: Puoi quotare un prezzo personalizzato in base alle tue esigenze. Inoltre, è disponibile una prova gratuita.

    È perfetto per l'analisi tradizionale della regressione lineare. Soddisfa le esigenze statistiche sia specializzate che a livello aziendale.

    Per saperne di più clicca qui (5) .

Domande frequenti sull'analisi di regressione

D. Che cos'è la formula di analisi di regressione?

A. La formula è Y = MX + b

Dove,

  • Y è la variabile dipendente dell'equazione di regressione.
  • M è la pendenza dell'equazione di regressione.
  • X è la variabile dipendente dell'equazione di regressione.
  • b è la costante dell'equazione.

D. Che cos'è l'analisi di regressione multipla

R. L'analisi di regressione multipla è un metodo statistico utilizzato per prevedere il valore della variabile dipendente con l'aiuto di due o più variabili indipendenti.

D. Esempi di analisi di regressione multipla

R. Con l'esempio della regressione multipla, puoi prevedere la pressione sanguigna di un individuo considerando la sua altezza, peso ed età. Qui la pressione sanguigna è la variabile dipendente e le altre sono la variabile indipendente.

D. Che cos'è l'analisi di regressione semplice

R. L'analisi di regressione semplice è uno strumento statistico per trovare la relazione tra una variabile dipendente e una indipendente sulla base di osservazioni passate.

D. Quali sono le applicazioni dell'analisi di regressione

R. Ecco le applicazioni dell'analisi di regressione:

  • Puoi prevedere decisioni future.
  • Aiuta ad ottimizzare il processo.
  • Aiuta a correggere gli errori.
  • Attraverso l'analisi di regressione, puoi ottenere informazioni migliori.

Pensieri finali

La prossima volta che qualcuno nella tua organizzazione pone un'ipotesi in cui un fattore avrà un impatto su un altro fattore, forse dovresti considerare di eseguire un'analisi di regressione per determinare il risultato. Un processo decisionale aziendale informato può aiutare ad allocare le risorse in modo efficiente e aumentare le entrate a lungo termine.