Der vollständige Leitfaden zur Regressionsanalyse

Veröffentlicht: 2020-03-18

Was ist Regressionsanalyse?

Die Regressionsanalyse ist eine statistische Methode, die zur Eliminierung einer Beziehung zwischen einer abhängigen Variablen und einer unabhängigen Variablen verwendet wird. Es ist nützlich, um auf die Stärke der Beziehung zwischen Variablen zuzugreifen.

Es hilft auch bei der Modellierung der zukünftigen Beziehung zwischen den Variablen. Die Regressionsanalyse besteht aus verschiedenen Typen, darunter linear, nichtlinear und mehrfach linear. Aber die nützlichsten sind die einfachen linearen und mehrfachen linearen.

Die nichtlineare Analyse hilft jedoch hauptsächlich beim Umgang mit komplizierten Datensätzen. In komplizierten Datensätzen zeigen die unabhängige und die abhängige Variable eine nichtlineare Beziehung.

In diesem Artikel:
  • Definition
  • Anwendungen der Regressionsanalyse
  • Wann sollte die Regressionsanalyse verwendet werden?
  • So verwenden Sie die Regressionsanalyse
  • Anwendungen der Regressionsanalyse in der Wirtschaft
  • Bedeutung der Regressionsanalyse
  • Zweck der Regressionsanalyse
  • Einschränkungen der Regressionsanalyse
  • Arten der Regressionsanalyse
  • Beispiele für Regressionsanalysen
  • Regressionsanalyse-Tools

Warum sollten Sie die Regressionsanalyse verwenden?

Die Regressionsanalyse ist nützlich, um verschiedene Dinge zu tun. Im Folgenden werden wir einige Hauptgründe diskutieren, warum eine Regressionsanalyse in Erwägung gezogen werden sollte.

  1. Um eine Vielzahl von Beziehungen zu analysieren

    Die Regressionsanalyse kann beim Umgang mit verschiedenen Beziehungen zwischen Datensätzen helfen. Sie können es in:

    • Modellieren Sie mehrere unabhängige Variablen
    • Kontinuierliche und kategoriale Variablen
    • Polynomterme zum Modellieren von Krümmungen
    • Greifen Sie auf Interaktionsterme zu, um den Effekt einer unabhängigen Variablen auf den Wert einer anderen unabhängigen Variablen zu bestimmen
  1. Um unabhängige Variablen zu steuern

    Wie bereits erwähnt, hilft es bei der Beschreibung der Änderung jeder unabhängigen Variablen in Bezug auf die abhängige Variable. Wir können sagen, dass es alle Variablen innerhalb des Modells strategisch steuert.

    Definition der Steuerung einer Variablen: Wenn die Regressionsanalyse durchgeführt wird, müssen wir die Rolle jeder Variablen isolieren. Dazu müssen Sie die Störvariablen minimieren. Dieser Prozess ermöglicht es Ihnen, mehr über die Rolle der einzelnen Variablen zu erfahren, ohne die anderen Variablen zu berücksichtigen.

    So steuern Sie andere Variablen in der Regression: In der Regressionsanalyse halten Sie die anderen unabhängigen Variablen konstant, indem Sie sie in Ihr Modell aufnehmen. Studien zeigen, dass eine relevante Variable zu irreführenden Ergebnissen führen kann. Das Weglassen einer Variablen führt also dazu, dass das Modell unkontrolliert ist und das Ergebnis in Richtung der Variablen verzerrt wird, die nicht im Modell vorhanden ist.

  1. So interpretieren Sie die Regressionsausgabe

    Bei der Regressionsanalyse müssen Sie zuerst anpassen und überprüfen, ob Sie ein gutes Modell haben. Danach müssen Sie sich die Regressionskoeffizienten und die p-Werte ansehen. Wenn Sie einen p-Wert von weniger als 0,05 haben, ist die unabhängige Variable statistisch signifikant.

    Anhand dieses p-Werts können Sie feststellen, ob die Beziehung, die Sie in der Stichprobe beobachten, auch bei der größeren Population funktioniert oder nicht.

  1. So erhalten Sie vertrauenswürdige Regressionsergebnisse

    Führen Sie die folgenden Schritte aus, um ein vertrauenswürdiges Regressionsergebnis zu erhalten.

    • Erstellen Sie das richtige Modell: Wenn Sie nicht die gesamte Variable in das Modell aufnehmen können, kann das Ergebnis verzerrt sein.
    • Überprüfen Sie die Residuendiagramme: Stellen Sie sicher, dass das Modell angemessen zu den Daten passt.
    • Korrelation: Die Korrelation zwischen den beiden unabhängigen Variablen wird als Multikollinearität bezeichnet. Multikollinearität ist in Ordnung, aber das Übermaß an Multikollinearität kann ein Problem darstellen.

Wann sollte die Regressionsanalyse verwendet werden?

Wenn jemand Regressionsanalyse sagt, meint er oft gewöhnliche Regressionen der kleinsten Quadrate . Dies ist jedoch angemessen, wenn es eine unabhängige Variable gibt, die stetig ist, wenn bestimmte Annahmen erfüllt sind.

Tatsächlich gibt es jedoch verschiedene Typen wie Zählregressionen, logistische Regression, multinomiale Logistik, ordinale Logistik, Quantile, multivariate und andere Typen.

Die Regressionsanalyse wird hauptsächlich verwendet, um eine Zielvariable auf der Grundlage einer Reihe von Merkmalen zu schätzen, z. B. die Vorhersage von Immobilienpreisen auf der Grundlage von Dingen wie der Anzahl der Zimmer pro Haus, dem Alter des Hauses usw.

Wie man eine Regressionsanalyse durchführt

Jetzt werden wir alles über die Regression einschließlich Formeln besprechen. Alle grundlegenden Dinge wurden oben besprochen.

Wir werden besprechen, wie man ein lineares Regressionsdiagramm in Excel erstellt und wie man eine Regression in Excel mithilfe von Formeln durchführt.

So erstellen Sie ein lineares Regressionsdiagramm in Excel

Das Zeichnen eines linearen Regressionsdiagramms in Excel ist sehr einfach. Befolgen Sie einfach die folgenden Schritte, um das Regressionsdiagramm zu erstellen.

  • Wählen Sie die beiden Spalten der Daten einschließlich der Kopfzeilen aus.
  • Klicken Sie auf die Registerkarte „Einfügen“ und gehen Sie zur Gruppe „Chats“. Klicken Sie dann auf das Symbol für das Streudiagramm. Klicken Sie danach auf das Scatter-Thumbnail. Dadurch wird ein Streudiagramm in Ihr Arbeitsblatt eingefügt.
  • Zeichnen Sie nun die Regressionsgerade der kleinsten Quadrate. Klicken Sie dazu auf einen beliebigen Punkt und wählen Sie im Kontextmenü Trendlinie hinzufügen.
  • Auf der rechten Seite wählt der Bereich die lineare Trendlinienform aus und überprüft die Anzeigegleichung im Diagramm, um die Regressionsformel zu erhalten.
  • Gehen Sie nun auf die Registerkarte Schalter und Leitung und passen Sie die Leitung entsprechend an. Von hier aus können Sie verschiedene Linien und verschiedene Linienfarben auswählen.
  • An diesem Punkt sieht Ihr Diagramm wie ein Regressionsdiagramm aus, aber Sie müssen noch einige Verbesserungen daran vornehmen.
  • Um die Verbesserungen vorzunehmen, mussten Sie zuerst die Gleichung ziehen, um sie anzupassen, und dann mussten Sie Achsentitel hinzufügen (Wenn die Datenpunkte in der Mitte der horizontalen oder vertikalen Achse beginnen, mussten Sie den übermäßigen Leerraum entfernen).

So führen Sie eine Regression in Excel mithilfe von Formeln durch

Excel verfügt über einige statistische Funktionen, die Ihnen bei der Durchführung der Regressionsanalyse helfen können. Diese statistischen Funktionen sind

  • RGP (C2:C25, B2:B25)
  • Steigung (C2:C25, B2:B25)
  • ABGANG (C2:C25, B2:B25)
  • KORREL (B2:B25,C2:C25)

Verwendung der Regressionsanalyse in der Wirtschaft

Die Regressionsanalyse kann für Unternehmen sehr hilfreich sein, und im Folgenden haben wir einige der wichtigsten Verwendungszwecke besprochen.

  1. Vorausschauende Analytik

    Es hilft bei der Bestimmung der zukünftigen Risiken und Chancen. Es ist die am häufigsten verwendete Anwendung der Regressionsanalyse in der Wirtschaft.

    Beispielsweise kann ein produktbasiertes Unternehmen die Anzahl der Artikel vorhersagen, die ein Verbraucher in Zukunft kaufen wird. Die Regression basiert jedoch nicht nur auf der Nachfragevariablen, sondern es gibt verschiedene andere Faktoren, die sich direkt auf das Geschäft auswirken. Regression hilft Ihnen also auch, alles zu überdenken und dann eine erfolgreiche Entscheidung für die Zukunft zu treffen.

  1. Effizienz erhöhen

    Die Regression kann Ihnen helfen, den Geschäftsprozess zu optimieren. Denn dadurch können Sie datengesteuerte Entscheidungen treffen, die Spekulationen, Unternehmenspolitik und Hypothesen aus der Entscheidungsfindung eliminieren.

    Dies wird also Ihre gesamte Geschäftsleistung verbessern, indem es einen klaren Vorschlag der Bereiche gibt, die aufgrund von Effizienz und Umsatz die maximale Wirkung haben.

  1. Entscheidungen unterstützen

    Heutzutage sind Unternehmen mit Finanz-, Einkaufs- und anderen unternehmensbezogenen Daten überlastet. Daher ist es sehr schwierig, nützliche Informationen daraus zu erhalten. Aber mit Hilfe der Regressionsanalyse können Sie die umsetzbaren Informationen aus den großen Rohdaten gewinnen.

    Dies ist also eine intelligentere Methode, um genauere Entscheidungen für die Zukunft zu treffen. Dies bedeutet jedoch nicht, dass jetzt kein kreatives Denken mehr erforderlich ist. Dies ist nur ein Werkzeug, um die Hypothese zu testen, bevor man sich an die Ausführung macht.

  1. Neue Erkenntnisse

    Im Laufe der Zeit sammeln Unternehmen viele Daten. Das Problem ist jedoch, dass diese Daten unorganisiert sind. Darüber hinaus sind diese Daten ohne die richtige Analyse Verschwendung. Durch die Regressionsanalyse können Sie also einen optimalen Bestand aufrechterhalten.

Bedeutung der Regressionsanalyse in der Wirtschaft

Hier sind einige Anwendungen der Regression, die Ihnen helfen werden, Ihr Unternehmen zu führen.

  1. Andere Muster verstehen

    Mit Hilfe der Regressionsanalyse können Sie alle Arten von Mustern verstehen, die in den Daten auftauchen. Darüber hinaus werden diese neuen Erkenntnisse für Sie sehr wertvoll sein, um zu verstehen, wie diese neuen Erkenntnisse Ihr Unternehmen verändern werden.

  1. Korrigieren von Fehlern

    Die Regressionsanalyse hilft nicht nur dabei, eine bessere Entscheidung zu treffen. Es hilft auch dabei, die Fehler in den Urteilen zu finden. Es unterstützt Sie quantitativ bei Entscheidungen und beugt Fehlern durch die Betrachtung verschiedener Faktoren vor.

  1. Optimierungsprozess

    Indem Sie mehr Daten verstehen, können Sie Ihre Effizienz steigern und Prozesse verfeinern, um Ihrem Unternehmen den vollen Nutzen zu bieten. Darüber hinaus werden durch Daten optimierte Prozesse den Unternehmen helfen, intelligenter zu arbeiten.

Wenn Sie mehr darüber erfahren möchten, lesen Sie diesen Artikel: Bedeutung der Regressionsanalyse im Geschäftsleben

Was ist der Zweck der Regressionsanalyse?

Der Zweck besteht darin, ein Ergebnis basierend auf historischen Daten vorherzusagen. Diese historischen Daten werden mit Hilfe der Regressionsanalyse verstanden.

Beispielsweise möchten Sie die Daten darüber vorhersagen, welche Art von Menschen den Kaffee kaufen. In diesem Fall finden Sie also die Daten der Person, die Kaffee kauft und Informationen wie Alter, Größe, Finanzstatus und andere Dinge sammelt.

Nachdem Sie diese Daten analysiert haben, erstellen Sie ein Modell, um vorherzusagen, ob eine Person den Kaffee kaufen wird oder nicht. Wir können also sagen, dass die Regressionsanalyse verwendet wird, um das Verhalten der abhängigen Variablen basierend auf den großen unabhängigen Variablen vorherzusagen.

Einschränkung der Regressionsanalyse

Es gibt vier Haupteinschränkungen der Regression. Im Folgenden haben wir diese 4 Einschränkungen besprochen.

  • Es wird davon ausgegangen, dass Ursache und Wirkung zwischen den Beziehungen unverändert bleiben.
  • Die funktionale Beziehung, die zwischen zwei oder mehr Variablen auf der Grundlage einiger begrenzter Daten erhalten wird, ist möglicherweise nicht gültig, wenn mehr Daten berücksichtigt werden.
  • Es handelt sich um einen komplizierten und langwierigen Berechnungsprozess.
  • Es kann nicht im Falle eines qualitativen Phänomens verwendet werden.

Arten der Regression

Es gibt insgesamt 7 Haupttypen der Regression und im Folgenden haben wir diese 7 Typen im Detail besprochen.

  1. Lineare Regression

    Dies wird für die prädiktive Analyse verwendet. Dabei wird ein linearer Ansatz zur Modellierung der Beziehung zwischen der skalaren Antwort und den erklärenden Variablen verfolgt.

    Dies konzentriert sich hauptsächlich auf die bedingte Wahrscheinlichkeitsverteilung der Antwort unter Berücksichtigung des Werts von Prädiktoren. Bei der linearen Regression besteht jedoch die Gefahr einer Überanpassung.

    Die Gleichung für die lineare Regression lautet Y' = bX + A.

  1. Logistische Regression

    Diese Regression wird verwendet, wenn die abhängige Variable dichotom ist. Es schätzt die Parameter des logistischen Modells.

    Diese Regression hilft beim Umgang mit Daten, die zwei mögliche Kriterien haben.

    Die Gleichung für die logistische Regression lautet l = β 0 + β 1 X 1 + β 2 X 2

  1. Polynomiale Regression

    Diese Regression wird für krummlinige Daten verwendet. Es passt perfekt zur Methode der kleinsten Quadrate. Diese Analyse zielt darauf ab, den erwarteten Wert einer abhängigen Variablen y in Bezug auf die unabhängige Variable x zu modellieren.

    Die Gleichung für die polynomiale Regression ist l =β 00 X 1

  1. Schrittweise Regression

    Es wird zum Anpassen des Regressionsmodells an das Vorhersagemodell verwendet. Diese Regression wird automatisch durchgeführt. Allerdings wird bei jedem Schritt die Variable zu der Menge der erklärenden Variablen hinzugefügt oder von ihr abgezogen.

    Dabei gibt es einen Ansatz der Vorwärtsselektion und der Rückwärtseliminierung.

    Die Formel für die schrittweise Regression lautet b j.std = b j (S x * S Y -1 )

  1. Ridge-Regression

    Dies ist eine Technik zur Analyse multipler Regressionsdaten. In diesem Fall, wenn Multikollinearität auftritt, sind die Schätzungen der kleinsten Quadrate unverzerrt.

    Den Regressionsschätzungen wird ein gewisser Bias hinzugefügt, und aufgrund dessen reduziert die Ridge-Regression die Standardfehler.

    Die Gleichung für die Ridge-Regression lautet β = (X T X + λ * I) -1 X T Y

  1. Lasso-Regression

    Dabei werden sowohl Variablenauswahl- als auch Regularisierungsverfahren durchgeführt. Es verwendet weiche Schwellenwerte. Darüber hinaus wählt es nur eine Teilmenge der bereitgestellten Kovariaten zur Verwendung im endgültigen Modell aus.

    Die Formel für die Lasso-Regression lautet N -1i=1 N F (X i , Y i , α, β)

  1. Elastic Net-Regression

    Es ist eine regularisierte Regressionsmethode, die die Strafen der Lasso- und Ridge-Methoden linear kombiniert. Es wird hauptsächlich für Support-Vektor-Maschinen, Portfolio-Optimierung und Metrik-Lernen verwendet.

    Die Gleichung für die Elastic Net Regression lautet ||β|| 1 = ∑ p j=1j |

Abgesehen von den oben genannten Arten, sehen Sie sich diese 20 Arten der Regressionsanalyse für die Prognose an

Beispiele für Regressionsanalysen

Nun werden wir vier Beispiele für Regressionsanalysen erörtern, von denen sich zwei auf Finanzen und zwei nicht auf Finanzen beziehen.

Hier sind die Beispiele im Zusammenhang mit Finanzen.

  • Beat und CAPM: Im Finanzbereich verwenden wir die Regressionsanalyse, um das BETA für eine Aktie zu berechnen. Darüber hinaus kann es mit Hilfe von Excel einfach durchgeführt werden.
  • Prognose von Einnahmen und Ausgaben: Im Finanzbereich verwenden wir auch Regressionsanalysen, um Jahresabschlüsse für Unternehmen zu prognostizieren. So können wir feststellen, welche Änderungen der Geschäftsannahmen sich auf zukünftige Ausgaben und Einnahmen auswirken werden.

Hier sind die Beispiele, die außerhalb des Finanzwesens praktiziert werden.

  • Durch Regressionsanalyse können Sie die Beziehung zwischen der Anzahl der vom Fahrer gefahrenen Stunden und dem Alter des Fahrers ermitteln.
  • Mit Hilfe der Regressionsanalyse können Sie die Beziehung zwischen dem Prozentsatz der bestandenen Noten in einem Klassenzimmer und der Anzahl der Jahre Erfahrung eines Lehrers ermitteln.

Regressionsanalyse-Tools

Es gibt verschiedene Tools für die Regressionsanalyse, aber unten sind die 5 besten Tools aufgeführt.

  1. Max Stat

    Preis: 39 € für Studenten und 79 € für andere Benutzer

    Es ist ein einfach zu bedienendes und erschwingliches Tool, das online verfügbar ist. Es sind nur drei Schritte erforderlich, um die Analyse in einem einzigen Dialogfeld abzuschließen. Da es eine Schritt-für-Schritt-Analyse bietet, ist es sehr praktisch für Studenten und junge Wissenschaftler.

    Um mehr darüber zu erfahren, klicken Sie hier (1) .

  1. AcaStat

    Preis: Es beginnt bei 9,99 $, aber der Preis steigt mit zusätzlichen Funktionen.

    Es ist eines der besten statistischen Analysetools. Das Hauptmerkmal davon ist, dass es Daten mit sehr einfachen Techniken analysiert. Außerdem führt es die Analyse sehr schnell durch.

    Um mehr darüber zu erfahren, klicken Sie hier (2) .

  1. NCSS

    Preis: Das Jahresabonnement ist für 239 $ erhältlich.

    In der NCSS-Software steht eine Vielzahl statistischer und grafischer Tools zur Analyse der Daten zur Verfügung. Es bietet auch andere Einrichtungen wie das Organisieren von Dokumentation, kostenlose Schulungsvideos und ein 24/7-E-Mail-Support-Team.

    Um mehr darüber zu erfahren, klicken Sie hier (3) .

  1. XL Stat

    Preis: Der Jahrespreis dieser Software beträgt 275 $. Aber Sie können es kostenlos testen .

    Es ist eine statistische Software, die viele Funktionen hat, um die Bedürfnisse des Benutzers zu erfüllen. Es ist auch mit Microsoft Excel kompatibel und Sie können es sowohl auf PC als auch auf Mac verwenden.

    Um mehr darüber zu erfahren, klicken Sie hier (4) .

  1. SAS

    Preis: Sie können einen individuellen Preis nach Ihren Anforderungen angeben. Außerdem ist eine kostenlose Testversion verfügbar.

    Es ist perfekt für die traditionelle Analyse der linearen Regression. Es erfüllt sowohl spezialisierte als auch unternehmensweite statistische Anforderungen.

    Um mehr darüber zu erfahren, klicken Sie hier (5) .

Häufig gestellte Fragen zur Regressionsanalyse

F. Was ist eine Regressionsanalyseformel?

A. Die Formel lautet Y = MX + b

Wo,

  • Y ist die abhängige Variable der Regressionsgleichung.
  • M ist die Steigung der Regressionsgleichung.
  • X ist die abhängige Variable der Regressionsgleichung.
  • b ist die Konstante der Gleichung.

F. Was ist multiple Regressionsanalyse?

A. Die multiple Regressionsanalyse ist eine statistische Methode zur Vorhersage des Werts der abhängigen Variablen mit Hilfe von zwei oder mehr unabhängigen Variablen.

F. Beispiele für multiple Regressionsanalysen

A. Am Beispiel der multiplen Regression können Sie den Blutdruck einer Person vorhersagen, indem Sie ihre Größe, ihr Gewicht und ihr Alter berücksichtigen. Hier ist der Blutdruck die abhängige Variable und andere die unabhängige Variable.

F. Was ist eine einfache Regressionsanalyse?

A. Die einfache Regressionsanalyse ist ein statistisches Werkzeug, um die Beziehung zwischen einer abhängigen und einer unabhängigen Variablen basierend auf früheren Beobachtungen zu finden.

F. Was sind die Anwendungen der Regressionsanalyse?

A. Hier sind die Anwendungen der Regressionsanalyse:

  • Sie können zukünftige Entscheidungen vorhersagen.
  • Es hilft bei der Optimierung des Prozesses.
  • Es hilft bei der Korrektur der Fehler.
  • Durch Regressionsanalysen können Sie bessere Erkenntnisse gewinnen.

Abschließende Gedanken

Das nächste Mal, wenn jemand in Ihrer Organisation eine Hypothese aufstellt, bei der ein Faktor einen anderen Faktor beeinflussen wird, sollten Sie vielleicht eine Regressionsanalyse durchführen, um das Ergebnis zu bestimmen. Ein fundierter Geschäftsentscheidungsprozess kann helfen, Ressourcen effizient zuzuweisen und den Umsatz langfristig zu steigern.