Полное руководство по регрессионному анализу

Опубликовано: 2020-03-18

Что такое регрессионный анализ?

Регрессионный анализ — это статистический метод, используемый для устранения взаимосвязи между зависимой переменной и независимой переменной. Это полезно для доступа к силе связи между переменными.

Это также помогает в моделировании будущих отношений между переменными. Регрессионный анализ состоит из различных типов, включая линейный, нелинейный и множественный линейный. Но наиболее полезными являются простые линейные и множественные линейные.

Однако нелинейный анализ в основном помогает при работе со сложными наборами данных. В сложных наборах данных независимая и зависимая переменные показывают нелинейную связь.

В этой статье:
  • Определение
  • Использование регрессионного анализа
  • Когда использовать регрессионный анализ
  • Как использовать регрессионный анализ
  • Использование регрессионного анализа в бизнесе
  • Важность регрессионного анализа
  • Цель регрессионного анализа
  • Ограничения регрессионного анализа
  • Типы регрессионного анализа
  • Примеры регрессионного анализа
  • Инструменты регрессионного анализа

Почему вы должны использовать регрессионный анализ?

Регрессионный анализ полезен при выполнении различных действий. Ниже мы обсудим некоторые основные причины для рассмотрения регрессионного анализа.

  1. Анализ широкого спектра отношений

    Регрессионный анализ может помочь в обработке различных отношений между наборами данных. Вы можете это в:

    • Смоделируйте несколько независимых переменных
    • Непрерывные и категориальные переменные
    • Полиномиальные члены для моделирования кривизны
    • Доступ к условиям взаимодействия для определения влияния одной независимой переменной на значение другой независимой переменной
  1. Управление независимыми переменными

    Как уже отмечалось, это помогает в описании изменения каждой независимой переменной, связанной с зависимой переменной. Можно сказать, что он стратегически контролирует все переменные в модели.

    Определение контроля переменной: когда регрессионный анализ выполнен, мы должны изолировать роль каждой переменной. Для этого вам нужно минимизировать смешанные переменные. Этот процесс позволяет вам узнать больше о роли каждой переменной, не принимая во внимание другие переменные.

    Как контролировать другие переменные в регрессии: в регрессионном анализе вы поддерживаете другие независимые переменные постоянными, включая их в свою модель. Исследования показывают, что релевантная переменная может привести к вводящим в заблуждение результатам. Таким образом, пропуск переменной приводит к тому, что модель становится неконтролируемой, а результат смещается в сторону переменной, которой нет в модели.

  1. Интерпретация выходных данных регрессии

    В регрессионном анализе вы должны сначала подобрать и убедиться, что у вас есть хорошая модель. После этого вы должны посмотреть на коэффициенты регрессии и значения p. Когда у вас p-значение меньше 0,05, независимая переменная является статистически значимой.

    Это p-значение поможет вам определить, работает ли взаимосвязь, которую вы наблюдаете в выборке, с большей совокупностью или нет.

  1. Чтобы получить достоверные результаты регрессии

    Выполните следующие шаги, чтобы получить достоверный результат регрессии.

    • Создайте правильную модель: если вы не можете включить в модель всю переменную, результат может быть необъективным.
    • Проверьте остаточные графики: убедитесь, что модель адекватно соответствует данным.
    • Корреляция: Корреляция между двумя независимыми переменными называется мультиколлинеарностью. Мультиколлинеарность — это хорошо, но избыток мультиколлинеарности может стать проблемой.

Когда использовать регрессионный анализ

Когда кто-то говорит регрессионный анализ, он часто имеет в виду обычную регрессию методом наименьших квадратов . Однако это уместно, когда есть одна независимая переменная, которая непрерывна при соблюдении определенных допущений.

Но на самом деле существуют различные типы, такие как регрессия подсчета, логистическая регрессия, полиномиальная логистическая, порядковая логистическая, квантильная, многомерная и другие типы.

Регрессионный анализ в основном используется для оценки целевой переменной на основе набора функций, таких как прогнозирование цен на жилье на основе таких вещей, как количество комнат в доме, возраст дома и т. д.

Как сделать регрессионный анализ

Теперь мы обсудим все о регрессии, включая формулы. Все основные вещи обсудили выше.

Мы обсудим, как построить график линейной регрессии в Excel и как сделать регрессию в Excel с помощью формул.

Как сделать график линейной регрессии в Excel

Нарисовать диаграмму линейной регрессии в Excel очень просто, просто выполните следующие шаги, чтобы создать диаграмму регрессии.

  • Выберите два столбца данных, включая заголовки.
  • Нажмите на вкладку «Вставка» и перейдите в группу чатов, затем щелкните значок точечной диаграммы. После этого нажмите на миниатюру разброса. Это добавит точечную диаграмму на ваш рабочий лист.
  • Теперь нарисуйте линию регрессии методом наименьших квадратов. Для этого нажмите на любую точку и выберите в контекстном меню пункт «Добавить линию тренда».
  • С правой стороны панель выбирает форму линейной линии тренда и проверяет уравнение отображения на диаграмме, чтобы получить формулу регрессии.
  • Теперь перейдите на вкладку «Переключатель и линия» и соответствующим образом настройте линию. Отсюда вы можете выбрать различные линии и различные цвета линий.
  • На этом этапе ваша диаграмма будет выглядеть как график регрессии, но вам все же нужно внести в нее некоторые улучшения.
  • Чтобы внести улучшения, сначала вам нужно было перетащить уравнение, чтобы оно подошло, а затем вам пришлось добавить заголовки осей (если точки данных начинаются с середины горизонтальной или вертикальной оси, вам нужно было удалить лишние пробелы)

Как сделать регрессию в Excel с помощью формул

В Excel есть несколько статистических функций, которые могут помочь вам провести регрессионный анализ. Эти статистические функции

  • ЛИНЕЙН (C2:C25, B2:B25)
  • Наклон (C2:C25, B2:B25)
  • ПЕРЕХВАТ (C2:C25, B2:B25)
  • КОРРЕЛ (B2:B25,C2:C25)

Использование регрессионного анализа в бизнесе

Регрессионный анализ может быть очень полезен для бизнеса, и ниже мы обсудили некоторые из его основных применений.

  1. Предиктивная аналитика

    Это помогает в определении будущих рисков и возможностей. Это наиболее часто используемое приложение регрессионного анализа в бизнесе.

    Например, продуктовая компания может предсказать количество товаров, которые потребитель купит в будущем. Однако регрессия основана не только на переменной спроса, но и на различных других факторах, оказывающих непосредственное влияние на бизнес. Таким образом, регрессия также поможет вам все обдумать, а затем принять успешное решение на будущее.

  1. Повысить эффективность

    Регрессия может помочь вам оптимизировать бизнес-процесс. Потому что благодаря этому вы можете принимать решения на основе данных, которые устраняют догадки, корпоративную политику и гипотезы при принятии решений.

    Таким образом, это улучшит общую эффективность вашего бизнеса, дав четкое представление об областях, которые оказывают максимальное влияние благодаря эффективности и доходу.

  1. Поддержка решений

    В настоящее время предприятия перегружены данными о финансах, закупках и другими данными, связанными с компанией. Так что получить от него какую-то полезную информацию очень сложно. Но с помощью регрессионного анализа вы можете получить полезную информацию из больших необработанных данных.

    Таким образом, это более разумный способ принимать более точные решения на будущее. Однако это не означает, что теперь нет необходимости в творческом мышлении. Это всего лишь инструмент для проверки гипотезы перед тем, как перейти к ее исполнению.

  1. Новые идеи

    Со временем предприятия собирают много данных. Но проблема в том, что эти данные неорганизованы. Кроме того, эти данные являются ненужными без надлежащего анализа. Таким образом, с помощью регрессионного анализа вы можете поддерживать оптимальный запас.

Важность регрессионного анализа в бизнесе

Вот несколько приложений регрессии, которые помогут вам управлять своим бизнесом.

  1. Понимание других шаблонов

    С помощью регрессионного анализа вы можете понять все виды шаблонов, которые появляются в данных. Кроме того, эти новые идеи будут очень полезны для вас, чтобы понять, как эти новые идеи изменят ваш бизнес.

  1. Исправление ошибок

    Регрессионный анализ не только помогает принять лучшее решение. Это также помогает в поиске ошибок в суждениях. Он предоставит вам количественную поддержку решений и предотвратит ошибки, рассматривая различные факторы.

  1. Оптимизация процесса

    Понимая больше данных, вы можете повысить свою эффективность и усовершенствовать процессы, чтобы обеспечить максимальную выгоду для вашего бизнеса. Более того, процессы, оптимизированные на основе данных, помогут предприятиям работать эффективнее.

Если вы хотите узнать больше об этом, ознакомьтесь с этой статьей: Важность регрессионного анализа в бизнесе .

Какова цель регрессионного анализа?

Цель состоит в том, чтобы предсказать результат на основе исторических данных. Эти исторические данные понимаются с помощью регрессионного анализа.

Например, вы хотите предсказать данные о том, какие люди покупают кофе. Итак, в этом случае вы найдете данные человека, который покупает кофе, и собирает информацию, такую ​​​​как его возраст, рост, финансовое положение и другие вещи.

Теперь, проанализировав эти данные, вы создадите модель, чтобы предсказать, купит ли человек кофе или нет. Таким образом, мы можем сказать, что регрессионный анализ используется для прогнозирования поведения зависимой переменной на основе больших независимых переменных.

Ограничение регрессионного анализа

Есть четыре основных ограничения регрессии. Ниже мы обсудили эти 4 ограничения.

  • Предполагается, что причина и следствие между отношениями останутся неизменными.
  • Функциональная взаимосвязь, полученная между двумя или более переменными на основе некоторых ограниченных данных, может не сохраняться, если во внимание принимается больше данных.
  • Это сложный и длительный процесс вычислений.
  • Его нельзя использовать в случае качественного явления.

Типы регрессии

Всего существует 7 основных типов регрессии, и ниже мы подробно обсудили эти 7 типов.

  1. Линейная регрессия

    Это используется для предиктивного анализа. При этом используется линейный подход для моделирования взаимосвязи между скалярным откликом и независимыми переменными.

    В основном это касается условного распределения вероятностей ответа с учетом значения предикторов. Однако при линейной регрессии существует опасность переобучения.

    Уравнение линейной регрессии: Y' = bX + A.

  1. Логистическая регрессия

    Эта регрессия используется, когда зависимая переменная является дихотомической. Он оценивает параметры логистической модели.

    Эта регрессия помогает работать с данными, имеющими два возможных критерия.

    Уравнение для логистической регрессии: l = β 0 + β 1 X 1 + β 2 X 2

  1. Полиномиальная регрессия

    Эта регрессия используется для криволинейных данных. Он идеально согласуется с методом наименьших квадратов. Этот анализ направлен на моделирование ожидаемого значения зависимой переменной y относительно независимой переменной x.

    Уравнение полиномиальной регрессии: l =β 00 X 1

  1. Пошаговая регрессия

    Он используется для подгонки модели регрессии к модели прогнозирования. Эта регрессия выполняется автоматически. Однако с каждым шагом переменная добавляется или вычитается из набора независимых переменных.

    В этом есть подход прямого выбора и обратного исключения.

    Формула пошаговой регрессии: b j.std = b j (S x * S Y -1 )

  1. Ридж-регрессия

    Это метод анализа данных множественной регрессии. В этом случае, когда возникает мультиколлинеарность, оценки методом наименьших квадратов являются несмещенными.

    К оценкам регрессии добавляется некоторая погрешность, и благодаря этому гребневая регрессия уменьшает стандартные ошибки.

    Уравнение регрессии хребта: β = (X T X + λ * I) -1 X T Y

  1. Лассо-регрессия

    При этом выполняются как выбор переменных, так и методы регуляризации. Он использует мягкое пороговое значение. Кроме того, он выбирает только подмножество предоставленных ковариат для использования в окончательной модели.

    Формула регрессии Лассо: N -1i=1 N F (X i , Y i , α, β)

  1. Эластичная чистая регрессия

    Это регуляризованный метод регрессии, который линейно сочетает штрафы методов лассо и гребня. Он в основном используется для машин опорных векторов, оптимизации портфеля и метрического обучения.

    Уравнение эластичной чистой регрессии: ||β|| 1 знак равно ∑ п j=1j |

Помимо вышеперечисленных типов, ознакомьтесь с этими 20 типами регрессионного анализа для прогнозирования.

Примеры регрессионного анализа

Теперь мы обсудим четыре примера регрессионного анализа, два из которых связаны с финансами, а два не связаны с финансами.

Вот примеры, связанные с финансами.

  • Beat и CAPM: в финансах мы используем регрессионный анализ для расчета БЕТА акций. Более того, это легко сделать с помощью Excel.
  • Прогнозирование доходов и расходов. В области финансов мы также используем регрессионный анализ для прогнозирования финансовой отчетности компаний. Таким образом, мы можем определить, какие изменения в предположениях о бизнесе повлияют на будущие расходы и доходы.

Вот примеры, которые практикуются вне финансов.

  • С помощью регрессионного анализа вы можете найти связь между количеством часов, проведенных водителем, и возрастом водителя.
  • С помощью регрессионного анализа вы можете узнать соотношение между процентом проходных оценок в классе и количеством лет опыта работы учителя.

Инструменты регрессионного анализа

Существуют различные инструменты регрессионного анализа, но ниже приведены 5 лучших инструментов.

  1. Макс. стат

    Цена: 39 евро для студентов и 79 евро для других пользователей.

    Это простой в использовании и доступный инструмент, доступный в Интернете. Для завершения анализа в одном диалоговом окне требуется всего три шага. Поскольку он обеспечивает пошаговый анализ, он очень удобен для студентов и молодых ученых.

    Чтобы узнать больше об этом, нажмите здесь (1) .

  1. АкаСтат

    Цена: начинается с 9,99 долларов, но цена увеличивается с дополнительными функциями.

    Это один из лучших инструментов статистического анализа. Главной особенностью этого является то, что он анализирует данные с использованием очень простых методов. Кроме того, он делает анализ очень быстро.

    Чтобы узнать больше об этом, нажмите здесь (2) .

  1. NCSS

    Цена: Годовая подписка доступна по цене 239 долларов.

    В программном обеспечении NCSS доступно множество статистических и графических инструментов для анализа данных. Он также предоставляет другие возможности, такие как организация документации, бесплатные обучающие видео и круглосуточная служба поддержки по электронной почте.

    Чтобы узнать больше об этом, нажмите здесь (3) .

  1. XL Стат.

    Цена: Годовая цена этого программного обеспечения составляет 275 долларов США. Но вы можете получить бесплатную пробную версию .

    Это статистическое программное обеспечение, которое имеет множество функций для удовлетворения потребностей пользователя. Он также совместим с Microsoft Excel, и вы можете использовать его как на ПК, так и на Mac.

    Чтобы узнать больше об этом, нажмите здесь (4) .

  1. САС

    Цена: Вы можете указать персональную цену в соответствии с вашими требованиями. Кроме того, доступна бесплатная пробная версия.

    Он идеально подходит для традиционного анализа линейной регрессии. Он отвечает как специализированным, так и общекорпоративным статистическим потребностям.

    Чтобы узнать больше об этом, нажмите здесь (5) .

Часто задаваемые вопросы о регрессионном анализе

В. Что такое формула регрессионного анализа?

А. Формула Y = MX + b

Где,

  • Y — зависимая переменная уравнения регрессии.
  • M — наклон уравнения регрессии.
  • X — зависимая переменная уравнения регрессии.
  • b – постоянная уравнения.

В. Что такое множественный регрессионный анализ

A. Множественный регрессионный анализ — это статистический метод, используемый для прогнозирования значения зависимой переменной с помощью двух или более независимых переменных.

Q. Примеры множественного регрессионного анализа

О. На примере множественной регрессии можно предсказать артериальное давление человека, учитывая его рост, вес и возраст. Здесь кровяное давление является зависимой переменной, а другие являются независимой переменной.

Q. Что такое простой регрессионный анализ

A. Простой регрессионный анализ — это статистический инструмент для поиска связи между одной зависимой и одной независимой переменной на основе прошлых наблюдений.

В. Каково применение регрессионного анализа?

А. Вот приложения регрессионного анализа:

  • Вы можете предсказывать будущие решения.
  • Это помогает оптимизировать процесс.
  • Помогает исправить ошибки.
  • С помощью регрессионного анализа вы можете получить более полное представление.

Последние мысли

В следующий раз, когда кто-то в вашей организации выдвинет гипотезу о том, что один фактор влияет на другой фактор, возможно, вам следует подумать о проведении регрессионного анализа, чтобы определить результат. Информированный процесс принятия бизнес-решений может помочь эффективно распределить ресурсы и увеличить доход в долгосрочной перспективе.