회귀 분석에 대한 완전한 가이드
게시 됨: 2020-03-18회귀 분석이란 무엇입니까?
회귀 분석 은 종속 변수와 독립 변수 간의 관계를 제거하는 데 사용되는 통계적 방법입니다. 변수 간의 관계의 강도에 액세스하는 데 유용합니다.
또한 변수 간의 미래 관계를 모델링하는 데 도움이 됩니다. 회귀 분석은 선형, 비선형, 다중 선형 등 다양한 유형으로 구성됩니다. 그러나 가장 유용한 것은 단순 선형과 다중 선형입니다.
그러나 비선형 분석은 주로 복잡한 데이터 세트를 처리하는 데 도움이 됩니다. 복잡한 데이터 세트에서 독립 변수와 종속 변수는 비선형 관계를 나타냅니다.
- 정의
- 회귀 분석의 사용
- 회귀 분석을 사용하는 경우
- 회귀 분석을 사용하는 방법
- 비즈니스에서 회귀 분석의 사용
- 회귀 분석의 중요성
- 회귀분석의 목적
- 회귀분석의 한계
- 회귀 분석 유형
- 회귀 분석 예
- 회귀 분석 도구
회귀 분석을 사용해야 하는 이유
회귀 분석은 다양한 작업을 수행하는 데 유용합니다. 아래에서 회귀 분석을 고려해야 하는 몇 가지 주요 이유에 대해 설명합니다.
다양한 관계 분석하기
회귀 분석은 데이터 세트 간의 다양한 관계를 처리하는 데 도움이 될 수 있습니다. 당신은 그것을 할 수 있습니다:
- 다중 독립 변수 모델링
- 연속형 및 범주형 변수
- 곡률을 모델링하는 다항식 항
- 하나의 독립변수가 다른 독립변수의 값에 미치는 영향을 결정하기 위해 상호작용 항에 접근
독립 변수를 제어하려면
언급한 바와 같이 종속변수와 관련된 각 독립변수의 변화를 설명하는 데 도움이 됩니다. 모델 내의 모든 변수를 전략적으로 통제한다고 말할 수 있습니다.
변수 제어의 정의: 회귀 분석이 완료되면 각 변수의 역할을 분리해야 합니다. 이를 위해서는 교란변수를 최소화해야 합니다. 이 프로세스를 통해 다른 변수를 고려하지 않고 각 변수의 역할에 대해 더 많이 알 수 있습니다.
회귀에서 다른 변수를 제어하는 방법: 회귀 분석에서 다른 독립 변수를 모델에 포함하여 일정하게 유지합니다. 연구에 따르면 관련 변수가 잘못된 결과를 초래할 수 있습니다. 따라서 변수를 생략하면 모델이 제어되지 않고 결과가 모델에 없는 변수 쪽으로 편향됩니다.
회귀 출력을 해석하려면
회귀 분석에서는 먼저 적합한 모델이 있는지 확인해야 합니다. 이 작업을 수행한 후 회귀 계수와 p 값을 확인해야 합니다. p-값이 0.05보다 작으면 독립 변수가 통계적으로 유의합니다.
이 p-값은 표본에서 관찰한 관계가 더 큰 모집단에서도 작동하는지 여부를 결정하는 데 도움이 됩니다.
신뢰할 수 있는 회귀 결과를 얻으려면
신뢰할 수 있는 회귀 결과를 얻으려면 아래 단계를 따르십시오.
- 올바른 모델 만들기: 모델 에 전체 변수를 포함할 수 없으면 결과가 편향될 수 있습니다.
- 잔차 그림 확인: 모델이 데이터를 적절하게 피팅하는지 확인합니다.
- 상관 관계: 두 독립 변수 간의 상관 관계를 다중 공선성이라고 합니다. 다중 공선성은 괜찮지만 다중 공선성이 과도하면 문제가 될 수 있습니다.
회귀 분석을 사용하는 경우
회귀 분석이라고 하는 사람은 보통 최소 제곱 회귀 를 의미하는 경우가 많습니다. 그러나 이것은 특정 가정이 충족될 때 연속적인 독립 변수가 하나 있는 경우에 적합합니다.
그러나 실제로는 계수 회귀, 로지스틱 회귀, 다항 로지스틱, 순서 로지스틱, 분위수, 다변량 및 기타 유형과 같은 다양한 유형이 있습니다.
회귀 분석은 주로 주택당 방 수, 주택 연식 등을 기반으로 주택 가격을 예측하는 것과 같은 일련의 기능을 기반으로 대상 변수를 추정하는 데 사용됩니다.
회귀 분석을 수행하는 방법
이제 우리는 공식을 포함하여 회귀에 대한 모든 것을 논의할 것입니다. 모든 기본 사항은 위에서 논의했습니다.
Excel에서 선형 회귀 그래프를 만드는 방법과 수식을 사용하여 Excel에서 회귀를 수행하는 방법에 대해 설명합니다.
Excel에서 선형 회귀 그래프를 만드는 방법
Excel에서 선형 회귀 차트를 그리는 것은 매우 쉽습니다. 아래 단계에 따라 회귀 차트를 생성하십시오.
- 헤더를 포함하여 데이터의 두 열을 선택합니다.
- 삽입 탭을 클릭하고 채팅 그룹으로 이동한 다음 분산형 차트 아이콘을 클릭합니다. 이 작업을 수행한 후 분산 축소판을 클릭합니다. 이렇게 하면 워크시트에 산점도가 삽입됩니다.
- 이제 최소 제곱 회귀선을 그립니다. 이렇게 하려면 아무 지점이나 클릭하고 상황에 맞는 메뉴에서 추세선 추가를 선택합니다.
- 오른쪽에서 창은 선형 추세선 모양을 선택하고 차트의 표시 방정식을 확인하여 회귀 공식을 얻습니다.
- 이제 스위치 및 라인 탭으로 이동하여 그에 따라 라인을 사용자 정의하십시오. 여기에서 다양한 선과 다양한 선 색상을 선택할 수 있습니다.
- 이 시점에서 차트는 회귀 그래프처럼 보이지만 여전히 몇 가지 개선이 필요합니다.
- 개선 작업을 수행하려면 먼저 방정식을 드래그하여 맞도록 만든 다음 축 제목을 추가해야 했습니다(데이터 포인트가 가로 또는 세로 축의 중간에서 시작하는 경우 과도한 공백을 제거해야 했습니다).
수식을 사용하여 Excel에서 회귀를 수행하는 방법
Excel에는 회귀 분석을 수행하는 데 도움이 되는 몇 가지 통계 기능이 있습니다. 이러한 통계 기능은
- 라인스트 (C2:C25, B2:B25)
- 경사(C2:C25, B2:B25)
- 인터셉트 (C2:C25, B2:B25)
- 코렐 (B2:B25,C2:C25)
비즈니스에서 회귀 분석 사용
회귀 분석은 비즈니스에 매우 유용할 수 있으며 아래에서 주요 용도에 대해 논의했습니다.
예측 분석
미래의 위험과 기회를 결정하는 데 도움이 됩니다. 비즈니스에서 가장 많이 사용되는 회귀 분석 응용 프로그램입니다.
예를 들어, 제품 기반 회사는 소비자가 미래에 구매할 품목 수를 예측할 수 있습니다. 그러나 회귀는 수요 변수를 기반으로 할 뿐만 아니라 비즈니스에 직접적인 영향을 미치는 다양한 요소가 있습니다. 따라서 회귀는 모든 것을 고려한 다음 미래에 대한 성공적인 결정을 내리는 데 도움이 됩니다.
효율성 증대
회귀는 비즈니스 프로세스를 최적화하는 데 도움이 될 수 있습니다. 이를 통해 의사 결정에서 추측, 기업 정치 및 가설을 제거하는 데이터 기반 의사 결정을 내릴 수 있기 때문입니다.
따라서 효율성과 수익으로 인해 최대 영향을 미치는 영역을 명확하게 제안하여 전반적인 비즈니스 성과를 개선할 수 있습니다.
지원 결정
오늘날 기업은 금융, 구매 및 기타 회사 관련 데이터로 과부하가 걸립니다. 따라서 유용한 정보를 얻기가 매우 어렵습니다. 그러나 회귀 분석의 도움으로 큰 원시 데이터에서 실행 가능한 정보를 얻을 수 있습니다.
따라서 이것은 미래를 위해 보다 정확한 결정을 내리는 더 현명한 방법입니다. 하지만 그렇다고 해서 이제 창의적 사고가 필요 없다는 의미는 아닙니다. 이것은 실행에 나서기 전에 가설을 테스트하기 위한 도구일 뿐입니다.
새로운 통찰력
시간이 지남에 따라 기업은 많은 데이터를 수집합니다. 그러나 문제는 이 데이터가 정리되지 않았다는 것입니다. 게다가 이 데이터는 적절한 분석을 하지 않으면 낭비입니다. 따라서 회귀분석을 통해 최적의 재고를 유지할 수 있습니다.
비즈니스에서 회귀 분석의 중요성
다음은 비즈니스를 안내하는 데 도움이 되는 몇 가지 회귀 응용 프로그램입니다.
다른 패턴 이해하기
회귀 분석의 도움으로 데이터에 나타나는 모든 종류의 패턴을 이해할 수 있습니다. 또한 이러한 새로운 통찰력은 이러한 새로운 통찰력이 비즈니스에 어떤 변화를 가져올지 이해하는 데 매우 유용합니다.
오류 수정
회귀 분석은 더 나은 결정을 내리는 데 도움이 될 뿐만 아니라 또한 판단의 오류를 찾는 데 도움이 됩니다. 다양한 요인을 살펴봄으로써 의사결정에 대한 정량적 지원을 제공하고 실수를 방지할 것입니다.
프로세스 최적화
더 많은 데이터를 이해함으로써 효율성을 높이고 프로세스를 개선하여 비즈니스에 최대한의 이점을 제공할 수 있습니다. 또한 데이터에 의해 최적화된 프로세스는 비즈니스가 더 스마트하게 작업하는 데 도움이 됩니다.
이에 대해 더 알고 싶다면 이 기사를 확인하십시오: 비즈니스에서 회귀 분석의 중요성
회귀 분석의 목적은 무엇입니까?
목적은 과거 데이터를 기반으로 결과를 예측하는 것입니다. 이 과거 데이터는 회귀 분석의 도움으로 이해됩니다.
예를 들어, 어떤 유형의 사람들이 커피를 구매하는지에 대한 데이터를 예측하려고 합니다. 따라서 이 경우 커피를 구매하고 나이, 키, 재정 상태 등의 정보를 수집하는 사람의 데이터를 찾을 수 있습니다.
이제 이 데이터를 분석한 후 사람이 커피를 살지 여부를 예측하는 모델을 만듭니다. 따라서 회귀 분석은 큰 독립 변수를 기반으로 종속 변수의 동작을 예측하는 데 사용된다고 말할 수 있습니다.
회귀분석의 한계
회귀에는 네 가지 주요 제한 사항이 있습니다. 아래에서 이러한 4가지 제한 사항에 대해 논의했습니다.
- 관계 사이의 원인과 결과는 변하지 않을 것이라고 가정합니다.
- 일부 제한된 데이터를 기반으로 두 개 이상의 변수 사이에서 얻은 기능적 관계는 더 많은 데이터를 고려하면 좋지 않을 수 있습니다.
- 그것은 복잡하고 긴 계산 과정을 포함합니다.
- 질적 현상의 경우에는 사용할 수 없습니다.
회귀 유형
회귀에는 총 7가지 주요 유형이 있으며 아래에서 이 7가지 유형에 대해 자세히 설명했습니다.
선형 회귀
이것은 예측 분석에 사용됩니다. 스칼라 응답과 설명 변수 간의 관계를 모델링하기 위해 선형 접근 방식을 따릅니다.
이것은 주로 예측 변수의 값이 주어진 응답의 조건부 확률 분포에 중점을 둡니다. 그러나 선형 회귀에서는 과적합의 위험이 있습니다.
선형 회귀에 대한 방정식은 Y' = bX + A입니다.
로지스틱 회귀
이 회귀는 종속 변수가 이분법일 때 사용됩니다. 로지스틱 모델의 매개변수를 추정합니다.
이 회귀는 두 가지 가능한 기준이 있는 데이터를 처리하는 데 도움이 됩니다.
로지스틱 회귀의 방정식은 l = β 0 +β 1 X 1 + β 2 X 2 입니다.
다항식 회귀
이 회귀는 곡선 데이터에 사용됩니다. 최소제곱법에 딱 맞습니다. 이 분석은 독립변수 x에 대한 종속변수 y의 기대값을 모델링하는 것을 목표로 합니다.
다항식 회귀 방정식은 l =β 0 +β 0 X 1 +ε 입니다.
단계적 회귀
회귀 모델을 예측 모델과 맞추는 데 사용됩니다. 이 회귀는 자동으로 수행됩니다. 그러나 모든 단계에서 변수는 설명 변수 집합에서 더하거나 뺍니다.
여기에는 포워딩 선택과 후진 제거의 접근 방식이 있습니다.
단계적 회귀의 공식은 b j.std = b j (S x * S Y -1 )입니다.
능선 회귀
다중회귀 데이터를 분석하는 기법입니다. 다중 공선성이 발생하면 최소 제곱 추정치가 편향되지 않습니다.
어느 정도의 편향이 회귀 추정에 추가되고 이로 인해 능선 회귀는 표준 오차를 줄입니다.
능선 회귀에 대한 방정식은 β = (X T X + λ * I) -1 X T Y
올가미 회귀
여기에서 변수 선택과 정규화 방법이 모두 수행됩니다. 소프트 임계값을 사용합니다. 또한 최종 모델에서 사용할 제공된 공변량의 하위 집합만 선택합니다.
올가미 회귀 공식은 다음과 같습니다. N -1 ∑ i=1 N F (X i , Y i , α, β)
탄력적 순 회귀
올가미와 능선 방법의 페널티를 선형으로 결합한 정규화 회귀 방법입니다. 주로 서포트 벡터 머신, 포트폴리오 최적화, 메트릭 학습에 사용됩니다.
탄력적 순 회귀에 대한 방정식은 ||β|| 1 = ∑ p j=1 |β j |
위의 유형 외에도 예측을 위한 20가지 유형의 회귀 분석을 확인하십시오.
회귀 분석 예
이제 우리는 회귀 분석의 4가지 예를 논의할 것입니다. 그 중 2개는 재무와 관련되고 2개는 재무와 관련이 없습니다.
다음은 금융과 관련된 예입니다.
- 비트와 CAPM: 금융에서는 회귀 분석을 사용하여 주식의 BETA를 계산합니다. 또한 Excel을 사용하여 쉽게 수행할 수 있습니다.
- 수익 및 비용 예측: 재무에서는 회귀 분석을 사용하여 회사의 재무제표도 예측합니다. 따라서 우리는 비즈니스 가정의 어떤 변화가 미래 비용과 수익에 영향을 미칠지 결정할 수 있습니다.
다음은 금융 외부에서 실행되는 예입니다.
- 회귀 분석을 통해 운전자가 운전한 시간과 운전자의 연령 간의 관계를 찾을 수 있습니다.
- 회귀 분석의 도움으로 교실에서 합격 점수의 백분율과 교사의 경력 년 수 사이의 관계를 알 수 있습니다.
회귀 분석 도구
다양한 회귀 분석 도구가 있지만 다음은 상위 5개 최고의 도구입니다.
최대 통계
가격: 학생은 39유로, 기타 사용자는 79유로
온라인에서 사용하기 쉽고 저렴한 도구입니다. 단일 대화 상자 내에서 분석을 완료하는 데 세 단계만 필요합니다. 단계별 분석을 제공하므로 학생 및 젊은 학자에게 매우 편리합니다.
자세한 내용을 보려면 여기 (1) 를 클릭하십시오.
아카스탯
가격: 9.99달러부터 시작하지만 기능이 추가되면 가격이 인상됩니다.
최고의 통계 분석 도구 중 하나입니다. 이것의 주요 특징은 매우 간단한 기술을 사용하여 데이터를 분석한다는 것입니다. 또한 분석을 매우 빠르게 수행합니다.
자세한 내용을 보려면 여기를 클릭하십시오 (2) .
NCSS
가격: 연간 구독은 $239입니다.
NCSS 소프트웨어에서 다양한 통계 및 그래픽 도구를 사용하여 데이터를 분석할 수 있습니다. 또한 문서 구성, 무료 교육 비디오 및 연중무휴 이메일 지원 팀과 같은 기타 기능도 제공합니다.
자세한 내용을 보려면 여기를 클릭하십시오 (3) .
XL 스탯
가격: 이 소프트웨어의 연간 가격은 $275입니다. 그러나 당신은 그것의 무료 평가판을 얻을 수 있습니다 .
사용자의 요구를 충족시키기 위해 많은 기능을 갖춘 통계 소프트웨어입니다. Microsoft Excel과도 호환되며 PC와 Mac에서 모두 사용할 수 있습니다.
자세한 내용을 보려면 여기 (4) 를 클릭하십시오.
SAS
가격: 요구 사항에 따라 맞춤형 가격을 제시할 수 있습니다. 또한 무료 평가판을 사용할 수 있습니다.
선형 회귀의 전통적인 분석에 적합합니다. 이는 전문화된 통계적 요구 사항과 전사적 통계 요구 사항을 모두 충족합니다.
자세한 내용을 보려면 여기를 클릭하십시오 (5) .
회귀 분석에 대해 자주 묻는 질문
Q. 회귀분석 공식이 무엇인가요?
A. 공식은 Y = MX + b
어디에,
- Y 는 회귀 방정식의 종속 변수입니다.
- M 은 회귀 방정식의 기울기입니다.
- X 는 회귀 방정식의 종속 변수입니다.
- b 는 방정식의 상수입니다.
Q. 다중회귀분석이란?
A. 다중회귀분석은 두 개 이상의 독립변수를 이용하여 종속변수의 값을 예측하는 통계적 방법입니다.
Q. 다중회귀분석 예
A. 다중회귀의 예를 들면 키, 몸무게, 나이를 고려하여 개인의 혈압을 예측할 수 있습니다. 여기서 혈압은 종속변수이고 나머지는 독립변수입니다.
Q. 단순회귀분석이란?
A. 단순회귀분석은 과거 관찰을 기반으로 하나의 종속변수와 하나의 독립변수 사이의 관계를 찾는 통계적 도구입니다.
Q. 회귀분석은 어떻게 적용하나요?
A. 회귀 분석의 응용 프로그램은 다음과 같습니다.
- 미래의 결정을 예측할 수 있습니다.
- 프로세스 최적화에 도움이 됩니다.
- 오류 수정에 도움이 됩니다.
- 회귀 분석을 통해 더 나은 통찰력을 얻을 수 있습니다.
마지막 생각들
다음에 조직의 누군가가 한 요인이 다른 요인에 영향을 미칠 것이라는 가설을 제시할 때 결과를 결정하기 위해 회귀 분석을 수행하는 것을 고려해야 합니다. 정보에 입각한 비즈니스 의사 결정 프로세스는 자원을 효율적으로 할당하고 장기적으로 수익을 높이는 데 도움이 될 수 있습니다.