Kompletny przewodnik po analizie regresji
Opublikowany: 2020-03-18Co to jest analiza regresji?
Analiza regresji jest metodą statystyczną stosowaną do eliminacji związku między zmienną zależną a zmienną niezależną. Jest to przydatne w uzyskiwaniu dostępu do siły związku między zmiennymi.
Pomaga również w modelowaniu przyszłej relacji między zmiennymi. Analiza regresji obejmuje różne typy, w tym liniową, nieliniową i wielokrotną liniową. Ale najbardziej przydatne są proste liniowe i wielokrotne liniowe.
Jednak analiza nieliniowa pomaga głównie w radzeniu sobie ze skomplikowanymi zbiorami danych. W skomplikowanych zbiorach danych zmienna niezależna i zależna wykazują zależność nieliniową.
- Definicja
- Zastosowania analizy regresji
- Kiedy używać analizy regresji
- Jak korzystać z analizy regresji
- Zastosowania analizy regresji w biznesie
- Znaczenie analizy regresji
- Cel analizy regresji
- Ograniczenia analizy regresji
- Rodzaje analizy regresji
- Przykłady analizy regresji
- Narzędzia do analizy regresji
Dlaczego warto korzystać z analizy regresji?
Analiza regresji jest przydatna w robieniu różnych rzeczy. Poniżej omówimy kilka podstawowych powodów, dla których warto rozważyć analizę regresji.
Analiza szerokiej gamy relacji
Analiza regresji może pomóc w obsłudze różnych relacji między zestawami danych. Możesz to zrobić w:
- Modeluj wiele niezależnych zmiennych
- Zmienne ciągłe i kategoryczne
- Terminy wielomianowe do modelowania krzywizn
- Dostęp do terminów interakcji w celu określenia wpływu jednej zmiennej niezależnej na wartość innej zmiennej niezależnej
Aby kontrolować niezależne zmienne
Jak zauważono, pomaga to w opisaniu zmiany każdej zmiennej niezależnej związanej ze zmienną zależną. Można powiedzieć, że strategicznie kontroluje wszystkie zmienne w modelu.
Definicja kontrolowania zmiennej: Po przeprowadzeniu analizy regresji musimy wyodrębnić rolę każdej zmiennej. Aby to zrobić, musisz zminimalizować mylące zmienne. Ten proces pozwala dowiedzieć się więcej o roli każdej zmiennej bez uwzględniania innych zmiennych.
Jak kontrolować inne zmienne w regresji: W analizie regresji utrzymujesz stałe inne zmienne niezależne, włączając je do swojego modelu. Badania pokazują, że odpowiednia zmienna może dawać mylące wyniki. Tak więc pominięcie zmiennej powoduje, że model jest niekontrolowany, a wynik jest tendencyjny w kierunku zmiennej, która nie jest obecna w modelu.
Interpretowanie wyników regresji
W analizie regresji musisz najpierw dopasować i zweryfikować, czy masz dobry model. Po wykonaniu tej czynności musisz spojrzeć na współczynniki regresji i wartości p. Gdy masz wartość p mniejszą niż 0,05, zmienna niezależna jest statystycznie istotna.
Ta wartość p pomoże ci określić, czy związek, który obserwujesz w próbie, działa również z większą populacją, czy nie.
Aby uzyskać wiarygodne wyniki regresji
Wykonaj poniższe kroki, aby uzyskać wiarygodny wynik regresji.
- Stwórz poprawny model: Jeśli nie jesteś w stanie uwzględnić w modelu całej zmiennej, wynik może być stronniczy.
- Sprawdź wykresy resztowe: Upewnij się, że model odpowiednio pasuje do danych.
- Korelacja: Korelacja między dwiema zmiennymi niezależnymi nazywana jest współliniowością. Współliniowość jest w porządku, ale nadmiar współliniowości może stanowić problem.
Kiedy używać analizy regresji
Kiedy ktoś mówi o analizie regresji, często ma na myśli zwykłą regresję najmniejszych kwadratów . Jest to jednak właściwe, gdy istnieje jedna niezależna zmienna, która jest ciągła, gdy spełnione są pewne założenia.
Ale w rzeczywistości istnieją różne typy, takie jak regresja liczebności, regresja logistyczna, logistyka wielomianowa, logistyka porządkowa, kwantylowa, wielowymiarowa i inne.
Analiza regresji służy głównie do oszacowania zmiennej docelowej na podstawie zestawu cech, takich jak przewidywanie cen mieszkań na podstawie takich rzeczy, jak liczba pokoi w domu, wiek domu itp.
Jak wykonać analizę regresji
Teraz omówimy wszystko na temat regresji, w tym formuły. Wszystkie podstawowe rzeczy zostały omówione powyżej.
Omówimy, jak wykonać wykres regresji liniowej w programie Excel i jak wykonać regresję w programie Excel za pomocą formuł.
Jak zrobić wykres regresji liniowej w programie Excel
Rysowanie wykresu regresji liniowej w programie Excel jest bardzo łatwe, wystarczy wykonać poniższe kroki, aby utworzyć wykres regresji.
- Wybierz dwie kolumny danych, w tym nagłówki.
- Kliknij kartę Wstaw i przejdź do grupy czatów, a następnie kliknij ikonę wykresu punktowego. Po wykonaniu tej czynności kliknij miniaturę rozproszenia. Spowoduje to wstawienie wykresu punktowego do arkusza.
- Teraz narysuj najmniej kwadratową linię regresji. W tym celu kliknij dowolny punkt i wybierz z menu kontekstowego dodaj linię trendu.
- Z prawej strony panel wybiera kształt liniowej linii trendu i sprawdza równanie wyświetlania na wykresie, aby uzyskać formułę regresji.
- Teraz przejdź do zakładki przełącznika i linii i odpowiednio dostosuj linię. Tutaj możesz wybrać różne linie i różne kolory linii.
- W tym momencie twój wykres będzie wyglądał jak wykres regresji, ale nadal musisz wprowadzić do niego pewne ulepszenia.
- Aby dokonać ulepszeń, najpierw trzeba było przeciągnąć równanie, aby je dopasować, a następnie trzeba było dodać tytuły osi (jeśli punkty danych zaczynają się od środka osi poziomej lub pionowej, trzeba było usunąć nadmiar białych znaków)
Jak wykonać regresję w programie Excel za pomocą formuł
Excel ma kilka funkcji statystycznych, które mogą pomóc w przeprowadzeniu analizy regresji. Te funkcje statystyczne są
- REGLINP (C2:C25, B2:B25)
- Nachylenie (C2:C25, B2:B25)
- PRZECIĘCIE (C2:C25, B2:B25)
- WSPÓŁPRACA (B2:B25,C2:C25)
Wykorzystanie analizy regresji w biznesie
Analiza regresji może być bardzo pomocna dla biznesu, a poniżej omówiliśmy niektóre z głównych zastosowań.
Analityka predykcyjna
Pomaga w określeniu przyszłych zagrożeń i szans. Jest to najczęściej stosowana aplikacja analizy regresji w biznesie.
Na przykład firma działająca w oparciu o produkt może przewidzieć liczbę przedmiotów, które konsument kupi w przyszłości. Jednak regresja nie opiera się tylko na zmiennej popytu, istnieje wiele innych czynników, które mają bezpośredni wpływ na biznes. Tak więc regresja pomoże ci również rozważyć wszystko, a następnie podjąć udaną decyzję na przyszłość.
Zwiększyć efektywność
Regresja może pomóc zoptymalizować proces biznesowy. Ponieważ dzięki temu możesz tworzyć decyzje oparte na danych, które eliminują zgadywanie, politykę korporacyjną i hipotezy z podejmowania decyzji.
Poprawi to więc ogólną wydajność Twojej firmy, dając jasną sugestię obszarów, które mają maksymalny wpływ ze względu na wydajność i przychody.
Wsparcie decyzji
W dzisiejszych czasach firmy są przeładowane danymi finansowymi, zakupowymi i innymi danymi związanymi z firmą. Tak więc bardzo trudno jest uzyskać z niego przydatne informacje. Ale za pomocą analizy regresji możesz uzyskać przydatne informacje z dużych surowych danych.
Jest to więc mądrzejszy sposób na podejmowanie trafniejszych decyzji na przyszłość. Nie oznacza to jednak, że teraz nie ma potrzeby kreatywnego myślenia. Jest to tylko narzędzie do sprawdzenia hipotezy przed przystąpieniem do realizacji.
Nowe spojrzenie
Z biegiem czasu firmy zbierają wiele danych. Ale problem polega na tym, że te dane są niezorganizowane. Ponadto dane te są marnotrawstwem bez przeprowadzenia odpowiedniej analizy. Dzięki analizie regresji możesz więc utrzymać optymalny stan zapasów.
Znaczenie analizy regresji w biznesie
Oto kilka zastosowań regresji, które pomogą Ci kierować Twoją firmą.
Zrozumienie innych wzorców
Za pomocą analizy regresji możesz zrozumieć wszelkiego rodzaju wzorce, które pojawiają się w danych. Co więcej, te nowe spostrzeżenia będą dla Ciebie bardzo cenne w zrozumieniu, w jaki sposób te nowe spostrzeżenia wpłyną na zmianę Twojej firmy.
Poprawianie błędów
Analiza regresji pomaga nie tylko w podjęciu lepszej decyzji. Pomaga również w znalezieniu błędów w wyrokach. Zapewni Ci ilościowe wsparcie decyzji i zapobiegnie błędom, patrząc na różne czynniki.
Proces optymalizacji
Rozumiejąc więcej danych, możesz zwiększyć wydajność i udoskonalić procesy, aby zapewnić pełne korzyści Twojej firmie. Co więcej, procesy zoptymalizowane na podstawie danych pomogą firmom pracować mądrzej.
Jeśli chcesz dowiedzieć się więcej na ten temat, zapoznaj się z tym artykułem: Znaczenie analizy regresji w biznesie
Jaki jest cel analizy regresji?
Celem jest przewidzenie wyniku na podstawie danych historycznych. Te dane historyczne są rozumiane za pomocą analizy regresji.
Na przykład chcesz przewidzieć dane, jakie osoby kupują kawę. Tak więc w tym przypadku znajdziesz dane osoby, która kupuje kawę i zbiera informacje, takie jak jej wiek, wzrost, status finansowy i inne.
Teraz po przeanalizowaniu tych danych stworzysz model do przewidywania, czy dana osoba kupi kawę, czy nie. Możemy więc powiedzieć, że analiza regresji służy do przewidywania zachowania zmiennej zależnej na podstawie dużych zmiennych niezależnych.
Ograniczenie analizy regresji
Istnieją cztery główne ograniczenia regresji. Poniżej omówiliśmy te 4 ograniczenia.
- Zakłada się, że przyczyna i skutek między relacjami pozostaną niezmienione.
- Zależność funkcjonalna uzyskana między dwiema lub większą liczbą zmiennych na podstawie pewnych ograniczonych danych może nie być dobra, jeśli weźmie się pod uwagę więcej danych.
- Wiąże się to ze skomplikowanym i długotrwałym procesem obliczeń.
- Nie może być stosowany w przypadku zjawiska jakościowego.
Rodzaje regresji
Istnieje w sumie 7 głównych typów regresji, a poniżej szczegółowo omówiliśmy te 7 typów.
Regresja liniowa
Służy do analizy predykcyjnej. Jest to podejście liniowe stosowane do modelowania relacji między odpowiedzią skalarną a zmiennymi objaśniającymi.
Koncentruje się to głównie na warunkowym rozkładzie prawdopodobieństwa odpowiedzi przy wartości predyktorów. Jednak w regresji liniowej istnieje niebezpieczeństwo nadmiernego dopasowania.
Równanie regresji liniowej to Y' = bX + A.
Regresja logistyczna
Ta regresja jest stosowana, gdy zmienna zależna jest dychotomiczna. Estymuje parametry modelu logistycznego.
Ta regresja pomaga w radzeniu sobie z danymi, które mają dwa możliwe kryteria.
Równanie regresji logistycznej to l = β 0 + β 1 X 1 + β 2 X 2
Regresja wielomianowa
Ta regresja jest używana do danych krzywoliniowych. Doskonale komponuje się z metodą najmniejszych kwadratów. Analiza ta ma na celu modelowanie wartości oczekiwanej zmiennej zależnej y względem zmiennej niezależnej x.
Równanie regresji wielomianowej to l =β 0 +β 0 X 1 +ε
Regresja krokowa
Służy do dopasowania modelu regresji do modelu predykcyjnego. Ta regresja jest przeprowadzana automatycznie. Jednak na każdym kroku zmienna jest dodawana lub odejmowana od zestawu zmiennych objaśniających.
W tym jest podejście polegające na przekazywaniu wyboru i wstecznej eliminacji.
Wzór na regresję krokową to b j.std = b j (S x * S Y -1 )
Regresja grzbietowa
Jest to technika analizy danych regresji wielokrotnej. W tym przypadku, gdy występuje współliniowość, szacunki metodą najmniejszych kwadratów są bezstronne.
Do oszacowań regresji dodawany jest pewien stopień błędu systematycznego, dzięki czemu regresja grzbietowa zmniejsza błędy standardowe.
Równanie regresji grzbietowej to β = (X T X + λ * I) -1 X T Y
Regresja Lasso
W tym przypadku wykonywane są zarówno metody selekcji zmiennych, jak i regularyzacji. Wykorzystuje miękkie progowanie. Ponadto wybiera tylko podzbiór dostarczonych zmiennych towarzyszących do użycia w ostatecznym modelu.
Wzór na regresję Lasso to N -1 ∑ i=1 N F (X i , Y i , α, β)
Elastyczna regresja netto
Jest to uregulowana metoda regresji, która liniowo łączy kary metody lasso i ridge. Jest używany głównie do maszyn wektorów pomocniczych, optymalizacji portfela i uczenia się metryk.
Równanie elastycznej regresji netto to ||β|| 1 = ∑ p j=1 |β j |
Oprócz powyższych typów sprawdź te 20 rodzajów analizy regresji dla prognozowania
Przykłady analizy regresji
Teraz omówimy cztery przykłady analizy regresji, z których dwa są związane z finansami, a dwa nie są związane z finansami.
Oto przykłady związane z finansami.
- Beat i CAPM: W finansach używamy analizy regresji do obliczenia BETA dla akcji. Co więcej, można to łatwo zrobić za pomocą Excela.
- Prognozowanie przychodów i wydatków: W finansach wykorzystujemy również analizę regresji do prognozowania sprawozdań finansowych dla firm. Dzięki temu możemy określić, jakie zmiany w założeniach biznesowych wpłyną na przyszłe wydatki i przychody.
Oto przykłady praktykowane poza finansami.
- Dzięki analizie regresji można znaleźć zależność między liczbą godzin przejechanych przez kierowcę a wiekiem kierowcy.
- Za pomocą analizy regresji można poznać zależność między odsetkiem pozytywnych ocen w klasie a liczbą lat doświadczenia nauczyciela.
Narzędzia do analizy regresji
Istnieją różne narzędzia do analizy regresji, ale poniżej znajduje się 5 najlepszych narzędzi.
Maks. Statystyka
Cena: 39 € dla studentów i 79 € dla innych użytkowników
Jest to łatwe w użyciu i niedrogie narzędzie dostępne online. Do zakończenia analizy w jednym oknie dialogowym wymagane są tylko trzy kroki. Ponieważ zapewnia analizę krok po kroku, jest więc bardzo przydatny dla studentów i młodych naukowców.
Aby dowiedzieć się więcej na ten temat, kliknij tutaj (1) .
AcaStat
Cena: zaczyna się od 9,99 USD, ale cena wzrasta wraz z dodatkowymi funkcjami.
Jest to jedno z najlepszych narzędzi do analizy statystycznej. Główną cechą tego jest to, że analizuje dane przy użyciu bardzo prostych technik. Co więcej, wykonuje analizę bardzo szybko.
Aby dowiedzieć się więcej, kliknij tutaj (2) .
NCSS
Cena: roczna subskrypcja jest dostępna w cenie 239 USD.
W oprogramowaniu NCSS dostępna jest szeroka gama narzędzi statystycznych i graficznych do analizy danych. Zapewnia również inne udogodnienia, takie jak organizowanie dokumentacji, bezpłatne filmy szkoleniowe i całodobowy zespół wsparcia e-mail.
Aby dowiedzieć się więcej na ten temat, kliknij tutaj (3) .
Statystyka XL
Cena: roczna cena tego oprogramowania wynosi 275 USD. Ale możesz otrzymać bezpłatną wersję próbną .
Jest to oprogramowanie statystyczne, które posiada wiele funkcji, aby zaspokoić potrzeby użytkownika. Jest również kompatybilny z Microsoft Excel i można go używać zarówno na komputerach PC, jak i Mac.
Aby dowiedzieć się więcej na ten temat, kliknij tutaj (4) .
SAS
Cena: Możesz podać indywidualną cenę zgodnie z własnymi wymaganiami. Dostępna jest również bezpłatna wersja próbna.
Idealnie nadaje się do tradycyjnej analizy regresji liniowej. Spełnia zarówno specjalistyczne, jak i ogólnofirmowe potrzeby statystyczne.
Aby dowiedzieć się więcej, kliknij tutaj (5) .
Często zadawane pytania dotyczące analizy regresji
P. Co to jest formuła analizy regresji?
A. Wzór to Y = MX + b
Gdzie,
- Y jest zmienną zależną równania regresji.
- M to nachylenie równania regresji.
- X jest zmienną zależną równania regresji.
- b jest stałą równania.
P. Co to jest analiza regresji wielorakiej?
A. Analiza regresji wielokrotnej jest metodą statystyczną stosowaną do przewidywania wartości zmiennej zależnej za pomocą dwóch lub więcej zmiennych niezależnych.
P. Przykłady analizy regresji wielokrotnej
O. Na przykładzie regresji wielorakiej możesz przewidzieć ciśnienie krwi danej osoby, biorąc pod uwagę jej wzrost, wagę i wiek. Tutaj ciśnienie krwi jest zmienną zależną, a inne są zmienną niezależną.
P. Co to jest prosta analiza regresji
A. Prosta analiza regresji jest narzędziem statystycznym do znalezienia związku między jedną zmienną zależną a jedną zmienną niezależną na podstawie wcześniejszych obserwacji.
P. Jakie są zastosowania analizy regresji?
A. Oto zastosowania analizy regresji:
- Możesz przewidzieć przyszłe decyzje.
- Pomaga w optymalizacji procesu.
- Pomaga w poprawianiu błędów.
- Dzięki analizie regresji możesz uzyskać lepszy wgląd.
Końcowe przemyślenia
Następnym razem, gdy ktoś w Twojej organizacji postawi hipotezę, w której jeden czynnik będzie miał wpływ na inny czynnik, być może powinieneś rozważyć wykonanie analizy regresji w celu określenia wyniku. Świadomy proces podejmowania decyzji biznesowych może pomóc w efektywnej alokacji zasobów i długoterminowym zwiększeniu przychodów.