Le guide complet sur l'analyse de régression

Publié: 2020-03-18

Qu'est-ce que l'analyse de régression ?

L'analyse de régression est une méthode statistique utilisée pour l'élimination d'une relation entre une variable dépendante et une variable indépendante. Il est utile pour accéder à la force de la relation entre les variables.

Cela aide également à modéliser la relation future entre les variables. L'analyse de régression se compose de différents types, notamment linéaire, non linéaire et linéaire multiple. Mais les plus utiles sont le linéaire simple et le linéaire multiple.

Cependant, l'analyse non linéaire aide principalement à traiter des ensembles de données complexes. Dans les ensembles de données complexes, la variable indépendante et dépendante montre une relation non linéaire.

Dans cet article:
  • Définition
  • Utilisations de l'analyse de régression
  • Quand utiliser l'analyse de régression
  • Comment utiliser l'analyse de régression
  • Utilisations de l'analyse de régression dans les affaires
  • Importance de l'analyse de régression
  • Objectif de l'analyse de régression
  • Limites de l'analyse de régression
  • Types d'analyse de régression
  • Exemples d'analyse de régression
  • Outils d'analyse de régression

Pourquoi devriez-vous utiliser l'analyse de régression ?

L'analyse de régression est utile pour faire diverses choses. Ci-dessous, nous discuterons des principales raisons d'envisager une analyse de régression.

  1. Pour analyser une grande variété de relations

    L'analyse de régression peut aider à gérer diverses relations entre les ensembles de données. Vous pouvez le faire dans :

    • Modéliser plusieurs variables indépendantes
    • Variables continues et catégorielles
    • Termes polynomiaux pour modéliser les courbures
    • Accéder aux termes d'interaction pour déterminer l'effet d'une variable indépendante sur la valeur d'une autre variable indépendante
  1. Pour contrôler des variables indépendantes

    Comme indiqué, cela aide à décrire le changement de chaque variable indépendante liée à la variable dépendante. On peut dire qu'il contrôle stratégiquement toutes les variables du modèle.

    Définition du contrôle d'une variable : Lorsque l'analyse de régression est effectuée, nous devons isoler le rôle de chaque variable. Pour ce faire, vous devez minimiser les variables confusionnelles. Ce processus vous permet d'en savoir plus sur le rôle de chaque variable sans tenir compte des autres variables.

    Comment contrôler d'autres variables dans la régression : dans l'analyse de régression, vous maintenez les autres variables indépendantes constantes en les incluant dans votre modèle. Des études montrent qu'une variable pertinente peut produire des résultats trompeurs. Ainsi, l'omission d'une variable rend le modèle incontrôlé et le résultat est biaisé vers la variable qui n'est pas présente dans le modèle.

  1. Pour interpréter la sortie de la régression

    Dans l'analyse de régression, vous devez d'abord ajuster et vérifier que vous disposez d'un bon modèle. Après cela, vous devez regarder les coefficients de régression et les valeurs p. Lorsque vous avez une valeur de p inférieure à 0,05, la variable indépendante est statistiquement significative.

    Cette valeur de p vous aidera à déterminer si la relation que vous observez dans l'échantillon fonctionne également avec la population plus large ou non.

  1. Pour obtenir des résultats de régression fiables

    Suivez les étapes ci-dessous pour obtenir un résultat de régression fiable.

    • Créez le modèle correct : si vous n'êtes pas en mesure d'inclure la variable entière dans le modèle, le résultat peut être biaisé.
    • Vérifiez les parcelles résiduelles : assurez-vous que le modèle correspond correctement aux données.
    • Corrélation : La corrélation entre les deux variables indépendantes est appelée multicolinéarité. La multicolinéarité est bonne, mais l'excès de multicolinéarité peut être un problème.

Quand utiliser l'analyse de régression

Quand quelqu'un parle d'analyse de régression, il s'agit souvent de régressions des moindres carrés ordinaires . Cependant, cela est approprié lorsqu'il existe une variable indépendante qui est continue lorsque certaines hypothèses sont satisfaites.

Mais en réalité, il existe différents types tels que les régressions de comptage, la régression logistique, la logistique multinomiale, la logistique ordinale, le quantile, le multivarié et d'autres types.

L'analyse de régression est principalement utilisée pour estimer une variable cible basée sur un ensemble de caractéristiques telles que la prévision des prix des logements en fonction d'éléments tels que le nombre de pièces par maison, l'âge de la maison, etc.

Comment faire une analyse de régression

Nous allons maintenant discuter de tout ce qui concerne la régression, y compris les formules. Toutes les choses de base ont discuté ci-dessus.

Nous verrons comment créer un graphique de régression linéaire dans Excel et comment effectuer une régression dans Excel à l'aide de formules.

Comment créer un graphique de régression linéaire dans Excel

Dessiner un graphique de régression linéaire dans Excel est très simple, il suffit de suivre les étapes ci-dessous pour créer le graphique de régression.

  • Sélectionnez les deux colonnes de données, y compris les en-têtes.
  • Cliquez sur l'onglet Insertion et accédez au groupe de discussions, puis cliquez sur l'icône du graphique en nuage de points. Après avoir fait cela, cliquez sur la vignette de dispersion. Cela insérera un nuage de points dans votre feuille de calcul.
  • Dessinez maintenant la ligne de régression des moindres carrés. Pour ce faire, cliquez sur n'importe quel point et choisissez Ajouter une ligne de tendance dans le menu contextuel.
  • Du côté droit, le volet sélectionne la forme de la ligne de tendance linéaire et vérifie l'équation d'affichage sur le graphique pour obtenir la formule de régression.
  • Allez maintenant dans l'onglet Switch and Line et personnalisez la ligne en conséquence. De là, vous pouvez choisir différentes lignes et différentes couleurs de lignes.
  • À ce stade, votre graphique ressemblera à un graphique de régression, mais vous devez tout de même y apporter quelques améliorations.
  • Pour faire les améliorations, vous deviez d'abord faire glisser l'équation pour l'adapter, puis vous deviez ajouter des titres d'axes (si les points de données partent du milieu de l'axe horizontal ou vertical, vous deviez supprimer l'espace blanc excessif)

Comment faire une régression dans Excel à l'aide de formules

Excel a quelques fonctions statistiques qui peuvent vous aider à faire l'analyse de régression. Ces fonctions statistiques sont

  • DROITEREG (C2:C25, B2:B25)
  • Pente (C2:C25, B2:B25)
  • INTERCEPTER (C2:C25, B2:B25)
  • CORREL (B2:B25,C2:C25)

Utilisation de l'analyse de régression dans les affaires

L'analyse de régression peut être très utile pour les entreprises et ci-dessous, nous avons discuté de certaines des principales utilisations.

  1. Analyses prédictives

    Il aide à déterminer les risques et opportunités futurs. C'est l'application d'analyse de régression la plus utilisée en entreprise.

    Par exemple, une entreprise axée sur les produits peut prédire le nombre d'articles qu'un consommateur achètera à l'avenir. Cependant, la régression n'est pas seulement basée sur la variable de la demande, il existe divers autres facteurs qui créent un impact direct sur l'entreprise. Ainsi, la régression vous aidera également à tout considérer, puis à prendre une décision réussie pour l'avenir.

  1. Accroître l'efficacité

    La régression peut vous aider à optimiser le processus métier. Parce que grâce à cela, vous pouvez créer des décisions basées sur les données qui éliminent les conjectures, la politique d'entreprise et les hypothèses de la prise de décision.

    Ainsi, cela améliorera les performances globales de votre entreprise en donnant une suggestion claire des domaines qui ont un impact maximal en raison de l'efficacité et des revenus.

  1. Prise en charge des décisions

    De nos jours, les entreprises sont surchargées de données financières, d'achat et d'autres données liées à l'entreprise. Il est donc très difficile d'en tirer des informations utiles. Mais avec l'aide de l'analyse de régression, vous pouvez obtenir des informations exploitables à partir des données brutes volumineuses.

    Il s'agit donc d'un moyen plus intelligent de prendre des décisions plus précises pour l'avenir. Cependant, cela ne signifie pas qu'il n'y a plus besoin de pensée créative. Ce n'est qu'un outil pour tester l'hypothèse avant de sortir pour l'exécution.

  1. Nouvelles perspectives

    Au fil du temps, les entreprises collectent beaucoup de données. Mais le problème est que ces données ne sont pas organisées. De plus, ces données sont des déchets sans faire l'analyse appropriée. Ainsi, grâce à l'analyse de régression, vous pouvez maintenir un stock optimal.

Importance de l'analyse de régression dans les affaires

Voici quelques applications de régression qui vous aideront à orienter votre entreprise.

  1. Comprendre d'autres modèles

    Avec l'aide de l'analyse de régression, vous pouvez comprendre toutes sortes de modèles qui apparaissent dans les données. De plus, ces nouvelles informations vous seront très utiles pour comprendre comment ces nouvelles informations feront une différence dans votre entreprise.

  1. Correction des erreurs

    L'analyse de régression aide non seulement à créer une meilleure décision. Cela aide également à trouver les erreurs dans les jugements. Il vous fournira un soutien quantitatif pour les décisions et évitera les erreurs en examinant divers facteurs.

  1. Processus d'optimisation

    En comprenant plus de données, vous pouvez augmenter votre efficacité et affiner les processus pour tirer pleinement parti de votre entreprise. De plus, les processus optimisés par les données aideront les entreprises à travailler plus intelligemment.

Si vous voulez en savoir plus à ce sujet, consultez cet article : Importance de l'analyse de régression dans les entreprises

Quel est le but de l'analyse de régression ?

Le but est de prédire un résultat basé sur des données historiques. Ces données historiques sont comprises à l'aide d'une analyse de régression.

Par exemple, vous souhaitez prédire les données sur le type de personnes qui achètent le café. Ainsi, dans ce cas, vous trouverez les données de la personne qui achète du café et recueille des informations telles que son âge, sa taille, sa situation financière et d'autres éléments.

Maintenant, après avoir analysé ces données, vous allez créer un modèle pour prédire si une personne achètera le café ou non. Ainsi, nous pouvons dire que l'analyse de régression est utilisée pour prédire le comportement de la variable dépendante en fonction des grandes variables indépendantes.

Limite de l'analyse de régression

Il existe quatre limitations principales de la régression. Ci-dessous, nous avons discuté de ces 4 limitations.

  • On suppose que la cause et l'effet entre les relations resteront inchangés.
  • La relation fonctionnelle obtenue entre deux variables ou plus sur la base de certaines données limitées peut ne pas être valable si davantage de données sont prises en compte.
  • Cela implique un processus de calcul long et compliqué.
  • Il ne peut pas être utilisé en cas de phénomène qualitatif.

Types de régression

Il existe au total 7 principaux types de régression et ci-dessous, nous avons discuté de ces 7 types en détail.

  1. Régression linéaire

    Ceci est utilisé pour l'analyse prédictive. C'est une approche linéaire qui est suivie ici pour modéliser la relation entre la réponse scalaire et les variables explicatives.

    Cela se concentre principalement sur la distribution de probabilité conditionnelle de la réponse compte tenu de la valeur des prédicteurs. Cependant, dans la régression linéaire, il existe un risque de surajustement.

    L'équation de la régression linéaire est Y' = bX + A.

  1. Régression logistique

    Cette régression est utilisée lorsque la variable dépendante est dichotomique. Il estime les paramètres du modèle logistique.

    Cette régression aide à traiter les données qui ont deux critères possibles.

    L'équation de la régression logistique est l = β 01 X 1 + β 2 X 2

  1. Régression polynomiale

    Cette régression est utilisée pour les données curvilignes. Elle s'accorde parfaitement avec la méthode des moindres carrés. Cette analyse vise à modéliser la valeur attendue d'une variable dépendante y par rapport à la variable indépendante x.

    L'équation de la régression polynomiale est l =β 00 X 1

  1. Régression pas à pas

    Il est utilisé pour ajuster le modèle de régression avec le modèle prédictif. Cette régression est effectuée automatiquement. Cependant, à chaque étape, la variable est ajoutée ou soustraite de l'ensemble des variables explicatives.

    En cela, il y a une approche de sélection vers l'avant et d'élimination vers l'arrière.

    La formule de la régression pas à pas est b j.std = b j (S x * S Y -1 )

  1. Régression de crête

    Il s'agit d'une technique d'analyse de données de régression multiple. Dans ce cas, lorsque la multicolinéarité se produit, les estimations des moindres carrés ne sont pas biaisées.

    Un degré de biais est ajouté aux estimations de régression et, de ce fait, la régression de crête réduit les erreurs types.

    L'équation de la régression Ridge est β = (X T X + λ * I) -1 X T Y

  1. Régression au lasso

    Dans ce cas, des méthodes de sélection de variables et de régularisation sont exécutées. Il utilise un seuillage doux. De plus, il ne sélectionne qu'un sous-ensemble des covariables fournies à utiliser dans le modèle final.

    La formule de la régression Lasso est N -1i=1 N F (X i , Y i , α, β)

  1. Régression nette élastique

    Il s'agit d'une méthode de régression régularisée qui combine linéairement les pénalités des méthodes lasso et ridge. Il est principalement utilisé pour les machines à vecteurs de support, l'optimisation de portefeuille et l'apprentissage de métriques.

    L'équation de la régression élastique nette est ||β|| 1 = ∑ p j=1j |

Outre les types ci-dessus, consultez ces 20 types d'analyse de régression pour la prévision

Exemples d'analyse de régression

Nous allons maintenant discuter de quatre exemples d'analyse de régression dont deux sont liés à la finance et deux ne sont pas liés à la finance.

Voici les exemples liés aux finances.

  • Beat et CAPM : En finance, nous utilisons l'analyse de régression pour calculer le BETA d'une action. De plus, cela peut être fait facilement à l'aide d'Excel.
  • Prévision des revenus et des dépenses : En finance, nous utilisons également l'analyse de régression pour prévoir les états financiers des entreprises. Ainsi, nous pouvons déterminer quels changements dans les hypothèses d'activité auront un impact sur les dépenses et les revenus futurs.

Voici les exemples qui se pratiquent en dehors de la finance.

  • Grâce à l'analyse de régression, vous pouvez trouver la relation entre le nombre d'heures conduites par le conducteur et l'âge du conducteur.
  • À l'aide de l'analyse de régression, vous pouvez connaître la relation entre le pourcentage de notes de passage dans une classe et le nombre d'années d'expérience d'un enseignant.

Outils d'analyse de régression

Il existe différents outils d'analyse de régression, mais vous trouverez ci-dessous les 5 meilleurs outils.

  1. Statistique maximale

    Tarif : 39 € pour les étudiants et 79 € pour les autres utilisateurs

    C'est un outil facile à utiliser et abordable disponible en ligne. Seules trois étapes sont nécessaires pour terminer l'analyse dans une seule boîte de dialogue. Comme il fournit une analyse étape par étape, il est donc très pratique pour les étudiants et les jeunes universitaires.

    Pour en savoir plus cliquez ici (1) .

  1. AcaStat

    Prix ​​: Il commence à partir de 9,99 $ mais le prix augmente avec des fonctionnalités supplémentaires.

    C'est l'un des meilleurs outils d'analyse statistique. La principale caractéristique de celui-ci est qu'il analyse les données à l'aide de techniques très simples. De plus, l'analyse est très rapide.

    Pour en savoir plus cliquez ici (2) .

  1. NCSS

    Prix ​​: L'abonnement annuel est disponible à 239 $.

    Une grande variété d'outils statistiques et graphiques sont disponibles sur le logiciel NCSS pour analyser les données. Il offre également d'autres fonctionnalités telles que l'organisation de la documentation, des vidéos de formation gratuites et une équipe d'assistance par e-mail 24h/24 et 7j/7.

    Pour en savoir plus cliquez ici (3) .

  1. Statistique XL

    Prix ​​: Le prix annuel de ce logiciel est de 275 $. Mais vous pouvez en obtenir un essai gratuit .

    C'est un logiciel statistique qui a beaucoup de fonctionnalités pour répondre aux besoins de l'utilisateur. Il est également compatible avec Microsoft Excel et vous pouvez l'utiliser sur PC et Mac.

    Pour en savoir plus cliquez ici (4) .

  1. SAS

    Prix ​​: Vous pouvez établir un devis personnalisé en fonction de vos besoins. De plus, un essai gratuit est disponible.

    Il est parfait pour l'analyse traditionnelle de la régression linéaire. Il répond à la fois aux besoins statistiques spécialisés et à l'échelle de l'entreprise.

    Pour en savoir plus cliquez ici (5) .

Foire aux questions sur l'analyse de régression

Q. Qu'est-ce que la formule d'analyse de régression ?

A. La formule est Y = MX + b

Où,

  • Y est la variable dépendante de l'équation de régression.
  • M est la pente de l'équation de régression.
  • X est la variable dépendante de l'équation de régression.
  • b est la constante de l'équation.

Q. Qu'est-ce que l'analyse de régression multiple

A. L'analyse de régression multiple est une méthode statistique utilisée pour prédire la valeur de la variable dépendante à l'aide de deux variables indépendantes ou plus.

Q. Exemples d'analyse de régression multiple

A. Avec l'exemple de la régression multiple, vous pouvez prédire la tension artérielle d'un individu en tenant compte de sa taille, de son poids et de son âge. Ici, la pression artérielle est la variable dépendante et les autres sont la variable indépendante.

Q. Qu'est-ce qu'une analyse de régression simple ?

A. L'analyse de régression simple est un outil statistique pour trouver la relation entre une variable dépendante et une variable indépendante basée sur des observations passées.

Q. Quelles sont les applications de l'analyse de régression

A. Voici les applications de l'analyse de régression :

  • Vous pouvez prédire les décisions futures.
  • Cela aide à optimiser le processus.
  • Il aide à corriger les erreurs.
  • Grâce à l'analyse de régression, vous pouvez obtenir de meilleures informations.

Dernières pensées

La prochaine fois qu'un membre de votre organisation émettra une hypothèse selon laquelle un facteur aura un impact sur un autre facteur, vous devriez peut-être envisager d'effectuer une analyse de régression pour déterminer le résultat. Un processus décisionnel éclairé peut aider à allouer efficacement les ressources et à augmenter les revenus à long terme.