回归分析完整指南
已发表: 2020-03-18什么是回归分析?
回归分析是一种统计方法,用于消除因变量和自变量之间的关系。 它对于访问变量之间关系的强度很有用。
它还有助于对变量之间的未来关系进行建模。 回归分析包括各种类型,包括线性、非线性和多重线性。 但最有用的是简单线性和多重线性。
然而,非线性分析主要有助于处理复杂的数据集。 在复杂的数据集中,自变量和因变量呈现非线性关系。
- 定义
- 回归分析的用途
- 何时使用回归分析
- 如何使用回归分析
- 回归分析在商业中的应用
- 回归分析的重要性
- 回归分析的目的
- 回归分析的局限性
- 回归分析的类型
- 回归分析示例
- 回归分析工具
为什么要使用回归分析?
回归分析在做各种事情时很有用。 下面我们将讨论考虑回归分析的一些主要原因。
分析各种各样的关系
回归分析可以帮助处理数据集之间的各种关系。 你可以在:
- 对多个自变量建模
- 连续变量和分类变量
- 用于模拟曲率的多项式项
- 访问交互项以确定一个自变量对另一个自变量值的影响
控制自变量
如前所述,它有助于描述与因变量相关的每个自变量的变化。 我们可以说它战略性地控制了模型中的所有变量。
控制变量的定义:当回归分析完成时,我们必须隔离每个变量的作用。 为此,您需要最小化混杂变量。 此过程使您可以在不考虑其他变量的情况下更多地了解每个变量的作用。
如何控制回归中的其他变量:在回归分析中,您可以通过将其他自变量包含在模型中来保持其他自变量不变。 研究表明,相关变量会产生误导性结果。 因此,省略变量会导致模型不受控制,结果会偏向模型中不存在的变量。
解释回归输出
在回归分析中,您必须首先拟合并验证您有一个好的模型。 完成此操作后,您必须查看回归系数和 p 值。 当您的 p 值小于 0.05 时,则自变量具有统计显着性。
此 p 值将帮助您确定您在样本中观察到的关系是否也适用于更大的总体。
获得可信的回归结果
按照以下步骤获得可信的回归结果。
- 创建正确的模型:如果您无法在模型中包含整个变量,则结果可能会出现偏差。
- 检查残差图:确保模型充分拟合数据。
- 相关性:两个自变量之间的相关性称为多重共线性。 多重共线性很好,但过度的多重共线性可能是一个问题。
何时使用回归分析
当有人说回归分析时,他们通常指的是普通的最小二乘回归。 但是,当满足某些假设时存在一个连续的自变量时,这是合适的。
但实际上,有多种类型,如计数回归、逻辑回归、多项逻辑、序数逻辑、分位数、多元等类型。
回归分析主要用于基于一组特征来估计目标变量,例如根据每间房子的房间数量、房子的年龄等预测房价。
如何进行回归分析
现在我们将讨论有关回归的所有内容,包括公式。 上面已经讨论了所有基本的事情。
我们将讨论如何在 Excel 中制作线性回归图以及如何在 Excel 中使用公式进行回归。
如何在 Excel 中制作线性回归图
在 excel 中绘制线性回归图非常容易,只需按照以下步骤创建回归图。
- 选择包括标题在内的两列数据。
- 单击插入选项卡并转到聊天组,然后单击散点图图标。 完成此操作后,单击分散缩略图。 这将在您的工作表中插入一个散点图。
- 现在画出最小二乘回归线。 为此,请单击任意点并从上下文菜单中选择添加趋势线。
- 从右侧,窗格选择线性趋势线形状并检查图表上的显示方程以获得回归公式。
- 现在转到 switch 和 line 选项卡并相应地自定义行。 从这里您可以选择不同的线条和各种线条颜色。
- 此时,您的图表将看起来像一个回归图,但您仍然需要对其进行一些改进。
- 要首先进行改进,您必须拖动方程以使其适合,然后您必须添加轴标题(如果数据点从水平或垂直轴的中间开始,那么您必须删除过多的空白)
如何使用公式在 Excel 中进行回归
Excel 有一些统计功能可以帮助您进行回归分析。 这些统计函数是
- LINEST (C2:C25, B2:B25)
- 坡度 (C2:C25, B2:B25)
- 拦截(C2:C25,B2:B25)
- 相关 (B2:B25,C2:C25)
在商业中使用回归分析
回归分析对业务非常有帮助,下面我们讨论了一些主要用途。
预测分析
它有助于确定未来的风险和机会。 它是商业中最常用的回归分析应用。
例如,一家以产品为基础的公司可以预测消费者未来将购买的商品数量。 但是,回归不仅基于需求变量,还有各种其他因素会对业务产生直接影响。 因此,回归还将帮助您考虑一切,然后为未来做出成功的决定。
提高效率
回归可以帮助您优化业务流程。 因为通过这种方式,您可以创建数据驱动的决策,从而消除决策中的猜测、公司政治和假设。
因此,这将通过明确建议因效率和收入而产生最大影响的领域来提高您的整体业务绩效。
支持决策
如今,企业的财务数据、采购数据和其他与公司相关的数据不堪重负。 因此,很难从中获得一些有用的信息。 但是在回归分析的帮助下,您可以从大的原始数据中获得可操作的信息。
因此,这是一种为未来制定更准确决策的更明智的方式。 然而,这并不意味着现在不需要创造性思维。 这只是在开始执行之前测试假设的工具。
新见解
随着时间的推移,企业会收集大量数据。 但问题是这些数据是杂乱无章的。 此外,如果没有进行适当的分析,这些数据就是浪费。 因此,通过回归分析,您可以保持最佳库存。
回归分析在商业中的重要性
以下是一些回归应用程序,可帮助您指导您的业务。
了解其他模式
借助回归分析,您可以了解数据中出现的各种模式。 此外,这些新见解对于您了解这些新见解将如何对您的业务产生影响非常有价值。
纠正错误
回归分析不仅有助于做出更好的决策。 它还有助于发现判断中的错误。 它将通过查看各种因素为您提供决策的定量支持并防止错误。
优化过程
通过了解更多数据,您可以提高效率并改进流程,从而为您的业务提供全面收益。 此外,通过数据优化的流程将帮助企业更智能地工作。
如果您想了解有关此的更多信息,请查看这篇文章:回归分析在业务中的重要性
回归分析的目的是什么?
目的是根据历史数据预测结果。 在回归分析的帮助下可以理解这些历史数据。
例如,您想预测购买咖啡的人是什么类型的数据。 因此,在这种情况下,您会找到购买咖啡的人的数据,并收集他们的年龄、身高、财务状况等信息。
现在,在分析了这些数据之后,您将创建一个模型来预测一个人是否会购买咖啡。 因此,我们可以说回归分析用于基于大自变量预测因变量的行为。
回归分析的局限性
回归有四个主要限制。 下面我们讨论了这 4 个限制。
- 假设关系之间的因果关系将保持不变。
- 如果考虑更多数据,则基于一些有限数据获得的两个或多个变量之间的函数关系可能不成立。
- 它涉及一个复杂而漫长的计算过程。
- 它不能用于定性现象的情况。
回归类型
共有 7 种主要的回归类型,下面我们详细讨论了这 7 种类型。
线性回归
这用于预测分析。 这是一种线性方法,用于对标量响应和解释变量之间的关系进行建模。
这主要关注给定预测变量值的响应的条件概率分布。 然而,在线性回归中,存在过拟合的危险。
线性回归的方程是 Y' = bX + A。
逻辑回归
当因变量是二分法时,使用此回归。 它估计逻辑模型的参数。
这种回归有助于处理具有两个可能标准的数据。
Logistic 回归方程为l = β 0 +β 1 X 1 + β 2 X 2
多项式回归
此回归用于曲线数据。 它非常适合最小二乘法。 该分析旨在模拟因变量 y 相对于自变量 x 的预期值。
多项式回归方程为l =β 0 +β 0 X 1 +ε
逐步回归
它用于将回归模型与预测模型进行拟合。 这种回归是自动进行的。 但是,随着每一步,变量都会从解释变量集中添加或减去。
在这方面,有一种前向选择和后向消除的方法。
逐步回归的公式是b j.std = b j (S x * S Y -1 )
岭回归
这是一种分析多元回归数据的技术。 在这种情况下,当多重共线性发生时,最小二乘估计是无偏的。
一定程度的偏差被添加到回归估计中,因此岭回归减少了标准误差。
岭回归方程为β = (X T X + λ * I) -1 X T Y
套索回归
在此,执行变量选择和正则化方法。 它使用软阈值。 此外,它仅选择提供的协变量的子集用于最终模型。
Lasso 回归的公式是N -1 ∑ i=1 N F (X i , Y i , α, β)
弹性网络回归
它是一种正则化回归方法,线性组合了 lasso 和 ridge 方法的惩罚。 它主要用于支持向量机、投资组合优化和度量学习。
弹性网络回归的方程是||β|| 1 = ∑ p j=1 |β j |
除了上述类型,请查看这 20 种预测回归分析类型
回归分析示例
现在我们将讨论四个回归分析的例子,其中两个与金融有关,两个与金融无关。
以下是与金融相关的示例。
- Beat 和 CAPM:在金融领域,我们使用回归分析来计算股票的 BETA。 此外,它可以在 Excel 的帮助下轻松完成。
- 预测收入和费用:在金融领域,我们还使用回归分析来预测公司的财务报表。 因此,我们可以确定业务假设的哪些变化将影响未来的费用和收入。
以下是在金融之外实践的例子。
- 通过回归分析,可以发现司机驾驶小时数与司机年龄之间的关系。
- 在回归分析的帮助下,您可以知道课堂上及格分数的百分比与教师的经验年限之间的关系。
回归分析工具
有各种回归分析工具,但以下是排名前 5 位的最佳工具。
最大统计
价格:学生 39 欧元,其他用户 79 欧元
它易于使用且价格实惠,可在线获得。 只需三个步骤即可在单个对话框中完成分析。 由于它提供了逐步分析,因此对于学生和年轻学者来说非常方便。
要了解有关它的更多信息,请单击此处(1) 。
AcaStat
价格:起价 9.99 美元,但价格会随着附加功能的增加而上涨。
它是最好的统计分析工具之一。 其主要特点是它使用非常简单的技术分析数据。 此外,它的分析速度非常快。
要了解更多信息,请单击此处(2) 。
NCSS
价格:年度订阅价格为 239 美元。
NCSS 软件提供了多种统计和图形工具来分析数据。 它还提供其他设施,例如组织文档、免费培训视频和 24/7 电子邮件支持团队。
要了解更多信息,请单击此处(3) 。
XL 统计
价格:该软件的年价格为 275 美元。 但是您可以免费试用它。
它是一种统计软件,具有满足用户需求的许多功能。 它还与 Microsoft Excel 兼容,您可以在 PC 和 Mac 上使用它。
要了解更多信息,请单击此处(4) 。
SAS
价格:您可以根据您的要求报价个性化的价格。 此外,还提供免费试用。
它非常适合传统的线性回归分析。 它满足专业和企业范围的统计需求。
要了解更多信息,请单击此处(5) 。
关于回归分析的常见问题
Q.什么是回归分析公式?
A.公式为Y = MX + b
在哪里,
- Y是回归方程的因变量。
- M是回归方程的斜率。
- X是回归方程的因变量。
- b是方程的常数。
Q.什么是多元回归分析
A.多元回归分析是一种统计方法,用于借助两个或多个自变量来预测因变量的值。
Q.多元回归分析示例
A.以多元回归为例,您可以通过考虑一个人的身高、体重和年龄来预测他的血压。 这里血压是因变量,其他是自变量。
Q.什么是简单回归分析
A.简单回归分析是一种统计工具,用于根据过去的观察结果找出一个因变量和一个自变量之间的关系。
Q.回归分析有哪些应用
A.以下是回归分析的应用:
- 您可以预测未来的决定。
- 它有助于优化流程。
- 它有助于纠正错误。
- 通过回归分析,您可以获得更好的洞察力。
最后的想法
下次当您组织中的某个人提出一个因素会影响另一个因素的假设时,也许您应该考虑执行回归分析以确定结果。 明智的业务决策流程可以帮助有效地分配资源并增加长期收入。