Ghidul complet pentru analiza regresiei

Publicat: 2020-03-18

Ce este analiza de regresie?

Analiza regresiei este o metodă statistică utilizată pentru eliminarea unei relații dintre o variabilă dependentă și o variabilă independentă. Este util în accesarea puterii relației dintre variabile.

De asemenea, ajută la modelarea relației viitoare dintre variabile. Analiza de regresie constă din diferite tipuri, inclusiv liniară, neliniară și liniară multiplă. Dar cele mai utile sunt liniara simplă și liniara multiplă.

Cu toate acestea, analiza neliniară ajută în principal la tratarea seturilor de date complicate. În seturile de date complicate, variabila independentă și dependentă prezintă o relație neliniară.

În acest articol:
  • Definiție
  • Utilizări ale analizei de regresie
  • Când să utilizați analiza de regresie
  • Cum se utilizează analiza de regresie
  • Utilizări ale analizei de regresie în afaceri
  • Importanța analizei de regresie
  • Scopul analizei de regresie
  • Limitările analizei de regresie
  • Tipuri de analiză de regresie
  • Exemple de analiză de regresie
  • Instrumente de analiză de regresie

De ce ar trebui să utilizați analiza de regresie?

Analiza regresiei este utilă pentru a face diverse lucruri. Mai jos vom discuta câteva motive principale pentru a lua în considerare analiza de regresie.

  1. Pentru a analiza o mare varietate de relații

    Analiza de regresie poate ajuta la gestionarea diferitelor relații dintre seturile de date. Il poti in:

    • Modelați mai multe variabile independente
    • Variabile continue și categoriale
    • Termeni polinomi pentru modelarea curburelor
    • Accesați termenii de interacțiune pentru a determina efectul unei variabile independente asupra valorii altei variabile independente
  1. Pentru a controla variabile independente

    După cum sa menționat, ajută la descrierea modificării fiecărei variabile independente legate de variabila dependentă. Putem spune că controlează strategic toate variabilele din cadrul modelului.

    Definiția controlului unei variabile: Când se face analiza de regresie, trebuie să izolam rolul fiecărei variabile. Pentru a face acest lucru, trebuie să minimizați variabilele de confuzie. Acest proces vă permite să aflați mai multe despre rolul fiecărei variabile fără a lua în considerare celelalte variabile.

    Cum să controlați alte variabile în regresie: în analiza de regresie, mențineți celelalte variabile independente constante incluzându-le în modelul dvs. Studiile arată că o variabilă relevantă poate produce rezultate înșelătoare. Deci, omiterea unei variabile face ca modelul să fie necontrolat, iar rezultatul este părtinitor către variabila care nu este prezentă în model.

  1. Pentru a interpreta rezultatul regresiei

    În analiza de regresie, trebuie mai întâi să vă potriviți și să verificați dacă aveți un model bun. După ce faceți acest lucru, trebuie să vă uitați la coeficienții de regresie și la valorile p. Când aveți o valoare p mai mică de 0,05, atunci variabila independentă este semnificativă statistic.

    Această valoare p vă va ajuta să determinați dacă relația pe care o observați în eșantion funcționează și cu populația mai mare sau nu.

  1. Pentru a obține rezultate de regresie de încredere

    Urmați pașii de mai jos pentru a obține un rezultat de regresie de încredere.

    • Creați modelul corect: dacă nu puteți include întreaga variabilă în model, atunci rezultatul poate fi părtinitor.
    • Verificați parcelele reziduale: asigurați-vă că modelul se potrivește în mod adecvat cu datele.
    • Corelație: Corelația dintre cele două variabile independente se numește multicoliniaritate. Multicoliniaritatea este bine, dar excesul de multicoliniaritate poate fi o problemă.

Când să utilizați analiza de regresie

Când cineva spune analiză de regresie, ele înseamnă adesea regresii obișnuite cu cel mai mic pătrat . Cu toate acestea, acest lucru este adecvat atunci când există o variabilă independentă care este continuă atunci când anumite ipoteze sunt îndeplinite.

Dar, în realitate, există diferite tipuri, cum ar fi regresii de numărare, regresii logistice, logistică multinomială, logistică ordinală, cuantilă, multivariată și alte tipuri.

Analiza de regresie este utilizată în principal pentru a estima o variabilă țintă pe baza unui set de caracteristici, cum ar fi predicția prețurilor locuințelor pe baza unor lucruri precum numărul de camere pe casă, vârsta casei etc.

Cum se face o analiză de regresie

Acum vom discuta totul despre regresie, inclusiv formule. Toate lucrurile de bază au fost discutate mai sus.

Vom discuta cum se face un grafic de regresie liniară în Excel și cum se face regresie în Excel folosind formule.

Cum se face un grafic de regresie liniară în Excel

Desenarea unei diagrame de regresie liniară în Excel este foarte ușor, trebuie doar să urmați pașii de mai jos pentru a crea diagrama de regresie.

  • Selectați cele două coloane de date, inclusiv anteturile.
  • Faceți clic pe fila Inserare și accesați grupul de chat, apoi faceți clic pe pictograma diagramă de dispersie. După ce faceți acest lucru, faceți clic pe miniatura scatter. Aceasta va insera un grafic de dispersie în foaia de lucru.
  • Acum trageți linia de regresie cel mai mic pătrat. Pentru a face acest lucru, faceți clic pe orice punct și alegeți adăugare linie de tendință din meniul contextual.
  • Din partea dreaptă, panoul selectează forma liniei de tendință liniară și verifică ecuația de afișare pe diagramă pentru a obține formula de regresie.
  • Acum accesați fila comutare și linie și personalizați linia în consecință. De aici puteți alege linii diferite și culori diferite.
  • În acest moment, diagrama dvs. va arăta ca un grafic de regresie, dar totuși, trebuie să faceți unele îmbunătățiri.
  • Pentru a face îmbunătățirile mai întâi a trebuit să trageți ecuația pentru a se potrivi și apoi a trebuit să adăugați titluri de axe (Dacă punctele de date încep de la mijlocul axei orizontale sau verticale, atunci a trebuit să eliminați spațiul alb excesiv)

Cum se face regresia în Excel folosind formule

Excel are câteva funcții statistice care vă pot ajuta să faceți analiza de regresie. Aceste funcţii statistice sunt

  • LINIE (C2:C25, B2:B25)
  • Pantă (C2:C25, B2:B25)
  • INTERCEPTARE (C2:C25, B2:B25)
  • COREL (B2:B25,C2:C25)

Utilizarea analizei de regresie în afaceri

Analiza regresiei poate fi foarte utilă pentru afaceri și mai jos am discutat câteva dintre principalele utilizări.

  1. Analize predictive

    Ajută la determinarea riscurilor și oportunităților viitoare. Este cea mai utilizată aplicație a analizei de regresie în afaceri.

    De exemplu, o companie bazată pe produse poate prezice numărul de articole pe care un consumator le va cumpăra în viitor. Cu toate acestea, regresia nu se bazează doar pe variabila cerere, există diverși alți factori care creează un impact direct asupra afacerii. Deci, regresia vă va ajuta și să luați în considerare totul și apoi să creați o decizie de succes pentru viitor.

  1. Creșterea eficienței

    Regresia vă poate ajuta să optimizați procesul de afaceri. Pentru că prin aceasta puteți crea decizii bazate pe date care elimină presupunerile, politica corporativă și ipotezele din luarea deciziilor.

    Deci, acest lucru vă va îmbunătăți performanța generală a afacerii, oferind o sugestie clară a zonelor care au un impact maxim datorită eficienței și veniturilor.

  1. Decizii de sprijin

    În zilele noastre, afacerile sunt supraîncărcate cu date de finanțare, achiziții și alte date legate de companie. Deci, este foarte dificil să obții câteva informații utile din el. Dar, cu ajutorul analizei de regresie, puteți obține informații acționabile din datele brute mari.

    Deci, aceasta este o modalitate mai inteligentă de a crea decizii mai precise pentru viitor. Totuși, asta nu înseamnă că acum nu mai este nevoie de gândire creativă. Acesta este doar un instrument pentru a testa ipoteza înainte de a ieși pentru execuție.

  1. Noi perspective

    De-a lungul timpului, companiile colectează o mulțime de date. Dar problema este că aceste date sunt neorganizate. În plus, aceste date sunt o risipă fără a face o analiză adecvată. Deci, prin analiza de regresie, puteți menține stocul optim.

Importanța analizei de regresie în afaceri

Iată câteva aplicații ale regresiei care vă vor ajuta să vă ghidați afacerea.

  1. Înțelegerea altor modele

    Cu ajutorul analizei de regresie, puteți înțelege tot felul de modele care apar în date. În plus, aceste noi perspective vor fi foarte valoroase pentru a înțelege modul în care aceste noi perspective vor face diferența în afacerea dvs.

  1. Corectarea erorilor

    Analiza de regresie nu numai că ajută la crearea unei decizii mai bune. De asemenea, ajută la găsirea erorilor din hotărâri. Vă va oferi suport cantitativ pentru decizii și vă va preveni greșelile analizând diferiți factori.

  1. Proces de optimizare

    Înțelegând mai multe date, vă puteți crește eficiența și perfecționa procesele pentru a oferi beneficii complete afacerii dvs. În plus, procesele care sunt optimizate prin date vor ajuta companiile să lucreze mai inteligent.

Dacă doriți să aflați mai multe despre acest lucru, consultați acest articol: Importanța analizei regresiei în afaceri

Care este scopul analizei de regresie?

Scopul este de a prezice un rezultat pe baza datelor istorice. Aceste date istorice sunt înțelese cu ajutorul analizei de regresie.

De exemplu, doriți să preziceți datele despre ce tip de oameni cumpără cafeaua. Deci, în acest caz, veți găsi datele persoanei care cumpără cafea și colectează informații precum vârsta, înălțimea, situația financiară și alte lucruri.

Acum, după ce ați analizat aceste date, veți crea un model pentru a prezice dacă o persoană va cumpăra cafeaua sau nu. Deci, putem spune că analiza de regresie este utilizată pentru a prezice comportamentul variabilei dependente pe baza variabilelor independente mari.

Limitarea analizei de regresie

Există patru limitări principale ale regresiei. Mai jos am discutat aceste 4 limitări.

  • Se presupune că cauza și efectul dintre relații vor rămâne neschimbate.
  • Relația funcțională care se obține între două sau mai multe variabile pe baza unor date limitate poate să nu fie valabilă dacă se iau în considerare mai multe date.
  • Implica un proces complicat și lung de calcule.
  • Nu poate fi folosit în cazul unui fenomen calitativ.

Tipuri de regresie

Există un total de 7 tipuri principale de regresie și mai jos am discutat aceste 7 tipuri în detaliu.

  1. Regresie liniara

    Acesta este folosit pentru analiza predictivă. Este urmată o abordare liniară pentru modelarea relației dintre răspunsul scalar și variabilele explicative.

    Aceasta se concentrează în principal pe distribuția probabilității condiționate a răspunsului, având în vedere valoarea predictorilor. Cu toate acestea, în regresia liniară, există pericolul de supraajustare.

    Ecuația pentru regresia liniară este Y' = bX + A.

  1. Regresie logistică

    Această regresie este utilizată atunci când variabila dependentă este dihotomică. Estimează parametrii modelului logistic.

    Această regresie ajută la tratarea datelor care au două criterii posibile.

    Ecuația pentru regresia logistică este l = β 01 X 1 + β 2 X 2

  1. Regresia polinomială

    Această regresie este utilizată pentru datele curbilinii. Se potrivește perfect cu metoda celor mai mici pătrate. Această analiză își propune să modeleze valoarea așteptată a unei variabile dependente y în raport cu variabila independentă x.

    Ecuația pentru regresia polinomială este l =β 00 X 1

  1. Regresie în trepte

    Este folosit pentru potrivirea modelului de regresie cu modelul predictiv. Această regresie este efectuată automat. Cu toate acestea, cu fiecare pas, variabila este adăugată sau scăzută din setul de variabile explicative.

    În aceasta, există o abordare a selecției înainte și a eliminării înapoi.

    Formula pentru regresia în trepte este b j.std = b j (S x * S Y -1 )

  1. Regresia crestei

    Aceasta este o tehnică de analiză a datelor de regresie multiplă. În acest caz, atunci când apare multicoliniaritatea, estimările celor mai mici pătrate sunt nepărtinitoare.

    Estimărilor de regresie se adaugă un grad de părtinire și, din acest motiv, regresia creste reduce erorile standard.

    Ecuația pentru regresia crestei este β = (X T X + λ * I) -1 X T Y

  1. Regresia Lasso

    În aceasta se efectuează atât selecția variabilelor, cât și metodele de regularizare. Utilizează un prag moale. În plus, selectează doar un subset de covariabile furnizate pentru a le utiliza în modelul final.

    Formula pentru regresia lazo este N -1i=1 N F (X i , Y i , α, β)

  1. Regresia netă elastică

    Este o metodă de regresie regularizată care combină liniar penalitățile metodelor lasso și creasta. Este folosit în principal pentru mașinile vectoriale de suport, optimizarea portofoliului și învățarea metrică.

    Ecuația pentru regresia netă elastică este ||β|| 1 = ∑ p j=1j |

În afară de tipurile de mai sus, consultați aceste 20 de tipuri de analiză de regresie pentru prognoză

Exemple de analiză de regresie

Acum vom discuta patru exemple de analiză de regresie, dintre care două sunt legate de finanțe și două nu sunt legate de finanțe.

Iată exemplele legate de Finanțe.

  • Beat și CAPM: în finanțe, folosim analiza de regresie pentru a calcula BETA pentru un stoc. Mai mult, se poate face cu ușurință cu ajutorul Excel.
  • Prognoza veniturilor și cheltuielilor: în finanțe, folosim și analiza de regresie pentru a estima situațiile financiare pentru companii. Astfel, putem determina ce schimbări în ipotezele de afaceri vor avea un impact asupra cheltuielilor și veniturilor viitoare.

Iată exemplele care se practică în afara finanțelor.

  • Prin analiza de regresie, puteți găsi relația dintre numărul de ore conduse de șofer și vârsta șoferului.
  • Cu ajutorul analizei de regresie, puteți cunoaște relația dintre procentul de note de trecere într-o clasă și numărul de ani de experiență pe care un profesor are.

Instrumente de analiză de regresie

Există diverse instrumente de analiză de regresie, dar mai jos sunt cele mai bune 5 instrumente.

  1. Stat max

    Preț: 39 € pentru studenți și 79 € pentru alți utilizatori

    Este un instrument ușor de utilizat și accesibil online. Sunt necesari doar trei pași pentru a finaliza analiza într-o singură casetă de dialog. Deoarece oferă o analiză pas cu pas, este foarte util pentru studenți și tinerii savanți.

    Pentru a afla mai multe despre el, faceți clic aici (1) .

  1. AcaStat

    Preț: Pornește de la 9,99 USD, dar prețul crește cu funcții suplimentare.

    Este unul dintre cele mai bune instrumente de analiză statistică. Caracteristica principală a acestui lucru este că analizează datele folosind tehnici foarte simple. În plus, face analiza foarte rapid.

    Pentru a afla mai multe despre el, faceți clic aici (2) .

  1. NCSS

    Preț: Abonamentul anual este disponibil la 239 USD.

    O mare varietate de instrumente statistice și grafice sunt disponibile pe software-ul NCSS pentru a analiza datele. Oferă, de asemenea, alte facilități, cum ar fi organizarea documentației, videoclipuri de formare gratuite și o echipă de asistență prin e-mail non-stop.

    Pentru a afla mai multe despre el, faceți clic aici (3) .

  1. XL Stat

    Preț: prețul anual al acestui software este de 275 USD. Dar puteți obține o încercare gratuită a acestuia .

    Este un software statistic care are o mulțime de caracteristici pentru a satisface nevoile utilizatorului. De asemenea, este compatibil cu Microsoft Excel și îl puteți utiliza atât pe PC, cât și pe Mac.

    Pentru a afla mai multe despre el, faceți clic aici (4) .

  1. SAS

    Preț: Puteți cota un preț personalizat în funcție de cerințele dumneavoastră. De asemenea, este disponibilă o încercare gratuită.

    Este perfect pentru analiza tradițională a regresiei liniare. Îndeplinește atât nevoile statistice specializate, cât și la nivelul întregii întreprinderi.

    Pentru a afla mai multe despre el, faceți clic aici (5) .

Întrebări frecvente despre analiza regresiei

Î . Ce este Formula de analiză de regresie?

A. Formula este Y = MX + b

Unde,

  • Y este variabila dependentă a ecuației de regresie.
  • M este panta ecuației de regresie.
  • X este variabila dependentă a ecuației de regresie.
  • b este constanta ecuației.

Î . Ce este analiza de regresie multiplă

A. Analiza de regresie multiplă este o metodă statistică utilizată în prezicerea valorii variabilei dependente cu ajutorul a două sau mai multe variabile independente.

Q. Exemple de analize de regresie multiplă

A. Cu exemplul regresiei multiple, puteți prezice tensiunea arterială a unui individ luând în considerare înălțimea, greutatea și vârsta acestuia. Aici tensiunea arterială este variabila dependentă, iar altele sunt variabila independentă.

Î . Ce este analiza de regresie simplă

A. Analiza de regresie simplă este un instrument statistic pentru a găsi relația dintre o variabilă dependentă și o variabilă independentă pe baza observațiilor anterioare.

Î . Care sunt aplicațiile analizei de regresie

A. Iată aplicațiile analizei de regresie:

  • Puteți prezice deciziile viitoare.
  • Ajută la optimizarea procesului.
  • Ajută la corectarea erorilor.
  • Prin analiza de regresie, puteți obține informații mai bune.

Gânduri finale

Data viitoare când cineva din organizația dvs. prezintă o ipoteză în care un factor va avea un impact asupra altui factor, poate că ar trebui să luați în considerare efectuarea unei analize de regresie pentru a determina rezultatul. Un proces informat de luare a deciziilor de afaceri poate ajuta la alocarea eficientă a resurselor și la creșterea veniturilor pe termen lung.