回歸分析完整指南

已發表: 2020-03-18

什麼是回歸分析?

回歸分析是一種統計方法,用於消除因變量和自變量之間的關係。 它對於訪問變量之間關係的強度很有用。

它還有助於對變量之間的未來關係進行建模。 回歸分析包括各種類型,包括線性、非線性和多重線性。 但最有用的是簡單線性和多重線性。

然而,非線性分析主要有助於處理複雜的數據集。 在復雜的數據集中,自變量和因變量呈現非線性關係。

在這篇文章中:
  • 定義
  • 回歸分析的用途
  • 何時使用回歸分析
  • 如何使用回歸分析
  • 回歸分析在商業中的應用
  • 回歸分析的重要性
  • 回歸分析的目的
  • 回歸分析的局限性
  • 回歸分析的類型
  • 回歸分析示例
  • 回歸分析工具

為什麼要使用回歸分析?

回歸分析在做各種事情時很有用。 下面我們將討論考慮回歸分析的一些主要原因。

  1. 分析各種各樣的關係

    回歸分析可以幫助處理數據集之間的各種關係。 你可以在:

    • 對多個自變量建模
    • 連續變量和分類變量
    • 用於模擬曲率的多項式項
    • 訪問交互項以確定一個自變量對另一個自變量值的影響
  1. 控制自變量

    如前所述,它有助於描述與因變量相關的每個自變量的變化。 我們可以說它戰略性地控制了模型中的所有變量。

    控制變量的定義:當回歸分析完成時,我們必須隔離每個變量的作用。 為此,您需要最小化混雜變量。 此過程使您可以在不考慮其他變量的情況下更多地了解每個變量的作用。

    如何控制回歸中的其他變量:在回歸分析中,您可以通過將其他自變量包含在模型中來保持其他自變量不變。 研究表明,相關變量會產生誤導性結果。 因此,省略變量會導致模型不受控制,結果會偏向模型中不存在的變量。

  1. 解釋回歸輸出

    在回歸分析中,您必須首先擬合併驗證您有一個好的模型。 完成此操作後,您必須查看回歸係數和 p 值。 當您的 p 值小於 0.05 時,則自變量具有統計顯著性。

    此 p 值將幫助您確定您在樣本中觀察到的關係是否也適用於更大的總體。

  1. 獲得可信的回歸結果

    按照以下步驟獲得可信的回歸結果。

    • 創建正確的模型:如果您無法在模型中包含整個變量,則結果可能會出現偏差。
    • 檢查殘差圖:確保模型充分擬合數據。
    • 相關性:兩個自變量之間的相關性稱為多重共線性。 多重共線性很好,但過度的多重共線性可能是一個問題。

何時使用回歸分析

當有人說回歸分析時,他們通常指的是普通的最小二乘回歸。 但是,當滿足某些假設時存在一個連續的自變量時,這是合適的。

但實際上,有多種類型,如計數回歸、邏輯回歸、多項邏輯、序數邏輯、分位數、多元等類型。

回歸分析主要用於基於一組特徵來估計目標變量,例如根據每間房子的房間數量、房子的年齡等預測房價。

如何進行回歸分析

現在我們將討論有關回歸的所有內容,包括公式。 上面已經討論了所有基本的事情。

我們將討論如何在 Excel 中製作線性回歸圖以及如何在 Excel 中使用公式進行回歸。

如何在 Excel 中製作線性回歸圖

在 excel 中繪製線性回歸圖非常容易,只需按照以下步驟創建回歸圖。

  • 選擇包括標題在內的兩列數據。
  • 單擊插入選項卡並轉到聊天組,然後單擊散點圖圖標。 完成此操作後,單擊分散縮略圖。 這將在您的工作表中插入一個散點圖。
  • 現在畫出最小二乘回歸線。 為此,請單擊任意點並從上下文菜單中選擇添加趨勢線。
  • 從右側,窗格選擇線性趨勢線形狀並檢查圖表上的顯示方程以獲得回歸公式。
  • 現在轉到 switch 和 line 選項卡並相應地自定義行。 從這裡您可以選擇不同的線條和各種線條顏色。
  • 此時,您的圖表將看起來像一個回歸圖,但您仍然需要對其進行一些改進。
  • 要首先進行改進,您必須拖動方程以使其適合,然後您必須添加軸標題(如果數據點從水平或垂直軸的中間開始,那麼您必須刪除過多的空白)

如何使用公式在 Excel 中進行回歸

Excel 有一些統計功能可以幫助您進行回歸分析。 這些統計函數是

  • LINEST (C2:C25, B2:B25)
  • 坡度 (C2:C25, B2:B25)
  • 攔截(C2:C25,B2:B25)
  • 相關 (B2:B25,C2:C25)

在商業中使用回歸分析

回歸分析對業務非常有幫助,下面我們討論了一些主要用途。

  1. 預測分析

    它有助於確定未來的風險和機會。 它是商業中最常用的回歸分析應用。

    例如,一家以產品為基礎的公司可以預測消費者未來將購買的商品數量。 但是,回歸不僅基於需求變量,還有各種其他因素會對業務產生直接影響。 因此,回歸還將幫助您考慮一切,然後為未來做出成功的決定。

  1. 提高效率

    回歸可以幫助您優化業務流程。 因為通過這種方式,您可以創建數據驅動的決策,從而消除決策中的猜測、公司政治和假設。

    因此,這將通過明確建議因效率和收入而產生最大影響的領域來提高您的整體業務績效。

  1. 支持決定

    如今,企業的財務數據、採購數據和其他與公司相關的數據不堪重負。 因此,很難從中獲得一些有用的信息。 但是在回歸分析的幫助下,您可以從大的原始數據中獲得可操作的信息。

    因此,這是一種為未來製定更準確決策的更明智的方式。 然而,這並不意味著現在不需要創造性思維。 這只是在開始執行之前測試假設的工具。

  1. 新見解

    隨著時間的推移,企業會收集大量數據。 但問題是這些數據是雜亂無章的。 此外,如果沒有進行適當的分析,這些數據就是浪費。 因此,通過回歸分析,您可以保持最佳庫存。

回歸分析在商業中的重要性

以下是一些回歸應用程序,可幫助您指導您的業務。

  1. 了解其他模式

    借助回歸分析,您可以了解數據中出現的各種模式。 此外,這些新見解對於您了解這些新見解將如何對您的業務產生影響非常有價值。

  1. 糾正錯誤

    回歸分析不僅有助於做出更好的決策。 它還有助於發現判斷中的錯誤。 它將通過查看各種因素為您提供決策的定量支持並防止錯誤。

  1. 優化過程

    通過了解更多數據,您可以提高效率並改進流程,從而為您的業務提供全面收益。 此外,通過數據優化的流程將幫助企業更智能地工作。

如果您想了解有關此的更多信息,請查看這篇文章:回歸分析在業務中的重要性

回歸分析的目的是什麼?

目的是根據歷史數據預測結果。 在回歸分析的幫助下可以理解這些歷史數據。

例如,您想預測購買咖啡的人是什麼類型的數據。 因此,在這種情況下,您會找到購買咖啡的人的數據,並收集他們的年齡、身高、財務狀況等信息。

現在,在分析了這些數據之後,您將創建一個模型來預測一個人是否會購買咖啡。 因此,我們可以說回歸分析用於基於大自變量預測因變量的行為。

回歸分析的局限性

回歸有四個主要限制。 下面我們討論了這 4 個限制。

  • 假設關係之間的因果關係將保持不變。
  • 如果考慮更多數據,則基於一些有限數據獲得的兩個或多個變量之間的函數關係可能不成立。
  • 它涉及一個複雜而漫長的計算過程。
  • 它不能用於定性現象的情況。

回歸類型

共有 7 種主要的回歸類型,下面我們詳細討論了這 7 種類型。

  1. 線性回歸

    這用於預測分析。 這是一種線性方法,用於對標量響應和解釋變量之間的關係進行建模。

    這主要關注給定預測變量值的響應的條件概率分佈。 然而,在線性回歸中,存在過擬合的危險。

    線性回歸的方程是 Y' = bX + A。

  1. 邏輯回歸

    當因變量是二分法時,使用此回歸。 它估計邏輯模型的參數。

    這種回歸有助於處理具有兩個可能標準的數據。

    Logistic 回歸方程為l = β 01 X 1 + β 2 X 2

  1. 多項式回歸

    此回歸用於曲線數據。 它非常適合最小二乘法。 該分析旨在模擬因變量 y 相對於自變量 x 的預期值。

    多項式回歸方程為l =β 00 X 1

  1. 逐步回歸

    它用於將回歸模型與預測模型進行擬合。 這種回歸是自動進行的。 但是,隨著每一步,變量都會從解釋變量集中添加或減去。

    在這方面,有一種前向選擇和後向消除的方法。

    逐步回歸的公式是b j.std = b j (S x * S Y -1 )

  1. 嶺回歸

    這是一種分析多元回歸數據的技術。 在這種情況下,當多重共線性發生時,最小二乘估計是無偏的。

    一定程度的偏差被添加到回歸估計中,因此嶺回歸減少了標準誤差。

    嶺回歸方程為β = (X T X + λ * I) -1 X T Y

  1. 套索回歸

    在此,執行變量選擇和正則化方法。 它使用軟閾值。 此外,它僅選擇提供的協變量的子集用於最終模型。

    Lasso 回歸的公式是N -1i=1 N F (X i , Y i , α, β)

  1. 彈性網絡回歸

    它是一種正則化回歸方法,線性組合了 lasso 和 ridge 方法的懲罰。 它主要用於支持向量機、投資組合優化和度量學習。

    彈性網絡回歸的方程是||β|| 1 = ∑ p j=1j |

除了上述類型,請查看這 20 種預測回歸分析類型

回歸分析示例

現在我們將討論四個回歸分析的例子,其中兩個與金融有關,兩個與金融無關。

以下是與金融相關的示例。

  • Beat 和 CAPM:在金融領域,我們使用回歸分析來計算股票的 BETA。 此外,它可以在 Excel 的幫助下輕鬆完成。
  • 預測收入和費用:在金融領域,我們還使用回歸分析來預測公司的財務報表。 因此,我們可以確定業務假設的哪些變化將影響未來的費用和收入。

以下是在金融之外實踐的例子。

  • 通過回歸分析,可以發現司機駕駛小時數與司機年齡之間的關係。
  • 在回歸分析的幫助下,您可以知道課堂上及格分數的百分比與教師的經驗年限之間的關係。

回歸分析工具

有各種回歸分析工具,但以下是排名前 5 位的最佳工具。

  1. 最大統計

    價格:學生 39 歐元,其他用戶 79 歐元

    它易於使用且價格實惠,可在線獲得。 只需三個步驟即可在單個對話框中完成分析。 由於它提供了逐步分析,因此對於學生和年輕學者來說非常方便。

    要了解有關它的更多信息,請單擊此處(1)

  1. AcaStat

    價格:起價 9.99 美元,但價格會隨著附加功能的增加而上漲。

    它是最好的統計分析工具之一。 其主要特點是它使用非常簡單的技術分析數據。 此外,它的分析速度非常快。

    要了解更多信息,請單擊此處(2)

  1. NCSS

    價格:年度訂閱價格為 239 美元。

    NCSS 軟件提供了多種統計和圖形工具來分析數據。 它還提供其他設施,例如組織文檔、免費培訓視頻和 24/7 電子郵件支持團隊。

    要了解更多信息,請單擊此處(3)

  1. XL 統計

    價格:該軟件的年價格為 275 美元。 但是您可以免費試用它

    它是一種統計軟件,具有滿足用戶需求的許多功能。 它還與 Microsoft Excel 兼容,您可以在 PC 和 Mac 上使用它。

    要了解更多信息,請單擊此處(4)

  1. SAS

    價格:您可以根據您的要求報價個性化的價格。 此外,還提供免費試用。

    它非常適合傳統的線性回歸分析。 它滿足專業和企業範圍的統計需求。

    要了解更多信息,請單擊此處(5)

關於回歸分析的常見問題

Q.什麼是回歸分析公式?

A.公式為Y = MX + b

在哪裡,

  • Y是回歸方程的因變量。
  • M是回歸方程的斜率。
  • X是回歸方程的因變量。
  • b是方程的常數。

Q.什麼是多元回歸分析

A.多元回歸分析是一種統計方法,用於借助兩個或多個自變量來預測因變量的值。

Q.多元回歸分析示例

A.以多元回歸為例,您可以通過考慮一個人的身高、體重和年齡來預測他的血壓。 這裡血壓是因變量,其他是自變量。

Q.什麼是簡單回歸分析

A.簡單回歸分析是一種統計工具,用於根據過去的觀察結果找出一個因變量和一個自變量之間的關係。

Q.回歸分析有哪些應用

A.以下是回歸分析的應用:

  • 您可以預測未來的決定。
  • 它有助於優化流程。
  • 它有助於糾正錯誤。
  • 通過回歸分析,您可以獲得更好的洞察力。

最後的想法

下次當您組織中的某個人提出一個因素會影響另一個因素的假設時,也許您應該考慮執行回歸分析以確定結果。 明智的業務決策流程可以幫助有效地分配資源並增加長期收入。