O Guia Completo sobre Análise de Regressão

Publicados: 2020-03-18

O que é Análise de Regressão?

A análise de regressão é um método estatístico utilizado para a eliminação de uma relação entre uma variável dependente e uma variável independente. É útil para acessar a força do relacionamento entre as variáveis.

Também ajuda a modelar a relação futura entre as variáveis. A análise de regressão consiste em vários tipos, incluindo linear, não linear e linear múltipla. Mas os mais úteis são o linear simples e o linear múltiplo.

No entanto, a análise não linear ajuda principalmente a lidar com conjuntos de dados complicados. Em conjuntos de dados complicados, a variável independente e dependente mostram uma relação não linear.

Neste artigo:
  • Definição
  • Usos da Análise de Regressão
  • Quando usar a análise de regressão
  • Como usar a análise de regressão
  • Usos da análise de regressão nos negócios
  • Importância da Análise de Regressão
  • Objetivo da Análise de Regressão
  • Limitações da Análise de Regressão
  • Tipos de Análise de Regressão
  • Exemplos de Análise de Regressão
  • Ferramentas de análise de regressão

Por que você deve usar a análise de regressão?

A análise de regressão é útil para fazer várias coisas. Abaixo, discutiremos algumas razões principais para considerar a análise de regressão.

  1. Para analisar uma grande variedade de relacionamentos

    A análise de regressão pode ajudar a lidar com vários relacionamentos entre conjuntos de dados. Você pode em:

    • Modelar várias variáveis ​​independentes
    • Variáveis ​​contínuas e categóricas
    • Termos polinomiais para modelar curvaturas
    • Acesse os termos de interação para determinar o efeito de uma variável independente no valor de outra variável independente
  1. Para controlar variáveis ​​independentes

    Como observado, ajuda a descrever a mudança em cada variável independente relacionada à variável dependente. Podemos dizer que ele controla estrategicamente todas as variáveis ​​dentro do modelo.

    Definição de Controle de uma Variável: Quando a análise de regressão é feita, devemos isolar o papel de cada variável. Para fazer isso, você precisa minimizar as variáveis ​​de confusão. Esse processo permite que você saiba mais sobre o papel de cada variável sem considerar as outras variáveis.

    Como controlar outras variáveis ​​na regressão: Na análise de regressão, você mantém as outras variáveis ​​independentes constantes, incluindo-as em seu modelo. Estudos mostram que uma variável relevante pode produzir resultados enganosos. Assim, a omissão de uma variável faz com que o modelo fique descontrolado e o resultado seja enviesado para a variável que não está presente no modelo.

  1. Para interpretar a saída de regressão

    Na análise de regressão, você deve primeiro ajustar e verificar se tem um bom modelo. Depois de fazer isso, você deve observar os coeficientes de regressão e os valores de p. Quando você tem um valor de p menor que 0,05, a variável independente é estatisticamente significativa.

    Esse valor-p o ajudará a determinar se a relação observada na amostra também funciona com a população maior ou não.

  1. Para obter resultados de regressão confiáveis

    Siga as etapas abaixo para obter um resultado de regressão confiável.

    • Crie o modelo correto: Se você não conseguir incluir a variável inteira no modelo, o resultado pode ser enviesado.
    • Verifique os gráficos de resíduos: Certifique-se de que o modelo se ajusta adequadamente aos dados.
    • Correlação: A correlação entre as duas variáveis ​​independentes é chamada de multicolinearidade. A multicolinearidade é boa, mas o excesso de multicolinearidade pode ser um problema.

Quando usar a análise de regressão

Quando alguém diz análise de regressão, geralmente significa regressões de mínimos quadrados comuns. No entanto, isso é apropriado quando há uma variável independente que é contínua quando certas suposições são atendidas.

Mas, na verdade, existem vários tipos, como regressões de contagem, regressão logística, logística multinomial, logística ordinal, quantílica, multivariada e outros tipos.

A análise de regressão é usada principalmente para estimar uma variável de destino com base em um conjunto de recursos, como prever preços de moradia com base em coisas como o número de quartos por casa, a idade da casa etc.

Como fazer a análise de regressão

Agora vamos discutir tudo sobre a regressão, incluindo fórmulas. Todas as coisas básicas foram discutidas acima.

Discutiremos como fazer gráfico de regressão linear no Excel e como fazer regressão no Excel usando fórmulas.

Como fazer um gráfico de regressão linear no Excel

Desenhar um gráfico de regressão linear no Excel é muito fácil, basta seguir as etapas abaixo para criar o gráfico de regressão.

  • Selecione as duas colunas dos dados, incluindo os cabeçalhos.
  • Clique na guia Inserir e vá para o grupo de bate-papos e clique no ícone do gráfico de dispersão. Depois de fazer isso, clique na miniatura de dispersão. Isso inserirá um gráfico de dispersão em sua planilha.
  • Agora desenhe a linha de regressão dos mínimos quadrados. Para fazer isso, clique em qualquer ponto e escolha adicionar linha de tendência no menu de contexto.
  • Do lado direito, o painel seleciona a forma da linha de tendência linear e verifica a equação de exibição no gráfico para obter a fórmula de regressão.
  • Agora vá para alternar e guia de linha e personalize a linha de acordo. A partir daqui, você pode escolher diferentes linhas e várias cores de linha.
  • Nesse ponto, seu gráfico parecerá um gráfico de regressão, mas ainda assim você precisará fazer algumas melhorias nele.
  • Para fazer as melhorias, primeiro você precisava arrastar a equação para ajustá-la e, em seguida, adicionar títulos de eixos (se os pontos de dados começarem no meio do eixo horizontal ou vertical, você precisará remover o espaço em branco excessivo)

Como fazer regressão no Excel usando fórmulas

O Excel possui algumas funções estatísticas que podem ajudá-lo a fazer a análise de regressão. Essas funções estatísticas são

  • PROJ.LIN (C2:C25, B2:B25)
  • Inclinação (C2:C25, B2:B25)
  • INTERCEPT (C2:C25, B2:B25)
  • CORREL (B2:B25,C2:C25)

Uso da Análise de Regressão nos Negócios

A análise de regressão pode ser muito útil para os negócios e, abaixo, discutimos alguns dos principais usos.

  1. Análise preditiva

    Ajuda a determinar os riscos e oportunidades futuros. É a aplicação de análise de regressão mais utilizada nos negócios.

    Por exemplo, uma empresa baseada em produtos pode prever o número de itens que um consumidor comprará no futuro. No entanto, a regressão não se baseia apenas na variável de demanda, existem vários outros fatores que criam um impacto direto no negócio. Portanto, a Regressão também o ajudará a considerar tudo e, em seguida, criar uma decisão bem-sucedida para o futuro.

  1. Aumentar a eficiência

    A regressão pode ajudá-lo a otimizar o processo de negócios. Porque através disso você pode criar decisões baseadas em dados que eliminam as suposições, políticas corporativas e hipóteses da tomada de decisões.

    Portanto, isso melhorará o desempenho geral do seu negócio, dando uma sugestão clara das áreas que têm um impacto máximo devido à eficiência e receita.

  1. Decisões de suporte

    Hoje em dia as empresas estão sobrecarregadas com os dados de finanças, compras e outros dados relacionados à empresa. Portanto, é muito difícil obter algumas informações úteis a partir dele. Mas com a ajuda da análise de regressão, você pode obter as informações acionáveis ​​do big data bruto.

    Portanto, essa é uma maneira mais inteligente de criar decisões mais precisas para o futuro. No entanto, isso não significa que agora não há necessidade de pensamento criativo. Esta é apenas uma ferramenta para testar a hipótese antes de sair para a execução.

  1. Novas idéias

    Com o tempo, as empresas coletam muitos dados. Mas o problema é que esses dados são desorganizados. Além disso, esses dados são desperdiçados sem a devida análise. Assim, por meio da análise de regressão, você pode manter o estoque ideal.

Importância da Análise de Regressão nos Negócios

Aqui estão algumas aplicações de regressão que o ajudarão a orientar seus negócios.

  1. Entendendo outros padrões

    Com a ajuda da análise de regressão, você pode entender todos os tipos de padrões que aparecem nos dados. Além disso, esses novos insights serão muito valiosos para você entender como esses novos insights farão a diferença no seu negócio.

  1. Corrigindo Erros

    A análise de regressão não apenas ajuda a criar uma decisão melhor. Também ajuda a encontrar os erros nos julgamentos. Ele fornecerá suporte quantitativo para decisões e evitará erros analisando vários fatores.

  1. Otimizando o Processo

    Ao compreender mais dados, você pode aumentar sua eficiência e refinar os processos para fornecer benefícios completos ao seu negócio. Além disso, processos otimizados por dados ajudarão as empresas a trabalhar de forma mais inteligente.

Se quiser saber mais sobre isso confira este artigo: Importância da Análise de Regressão nos Negócios

Qual é o objetivo da análise de regressão?

O objetivo é prever um resultado com base em dados históricos. Esses dados históricos são entendidos com a ajuda da análise de regressão.

Por exemplo, você deseja prever os dados de que tipo de pessoas compram o café. Então, neste caso, você encontrará os dados da pessoa que compra café e coleta informações como idade, altura, situação financeira e outras coisas.

Agora depois de analisar esses dados você vai criar um modelo para prever se uma pessoa vai comprar o café ou não. Assim, podemos dizer que a análise de regressão é usada para prever o comportamento da variável dependente com base nas grandes variáveis ​​independentes.

Limitação da Análise de Regressão

Existem quatro limitações principais da Regressão. Abaixo discutimos essas 4 limitações.

  • Supõe-se que a causa e o efeito entre as relações permanecerão inalteradas.
  • A relação funcional obtida entre duas ou mais variáveis ​​com base em alguns dados limitados pode não ser válida se mais dados forem levados em consideração.
  • Envolve um processo complicado e demorado de cálculos.
  • Não pode ser usado no caso de um fenômeno qualitativo.

Tipos de regressão

Há um total de 7 tipos principais de Regressão e abaixo discutimos esses 7 tipos em detalhes.

  1. Regressão linear

    Isso é usado para análise preditiva. É seguida uma abordagem linear para modelar a relação entre a resposta escalar e as variáveis ​​explicativas.

    Isso se concentra principalmente na distribuição de probabilidade condicional da resposta, dado o valor dos preditores. No entanto, na regressão linear, existe o perigo de sobreajuste.

    A equação para Regressão Linear é Y' = bX + A.

  1. Regressão Logística

    Essa regressão é usada quando a variável dependente é dicotômica. Estima os parâmetros do modelo logístico.

    Essa regressão ajuda a lidar com os dados que possuem dois critérios possíveis.

    A equação para a Regressão Logística é l = β 01 X 1 + β 2 X 2

  1. Regressão Polinomial

    Esta regressão é usada para dados curvilíneos. É perfeito se encaixa com o método dos mínimos quadrados. Esta análise visa modelar o valor esperado de uma variável dependente y em relação à variável independente x.

    A equação para Regressão Polinomial é l =β 00 X 1

  1. Regressão gradual

    Ele é usado para ajustar o modelo de regressão com o modelo preditivo. Esta regressão é realizada automaticamente. No entanto, a cada passo, a variável é adicionada ou subtraída do conjunto de variáveis ​​explicativas.

    Neste, há uma abordagem de seleção de encaminhamento e eliminação para trás.

    A fórmula para regressão passo a passo é b j.std = b j (S x * S Y -1 )

  1. Regressão do cume

    Esta é uma técnica para analisar dados de regressão múltipla. Nesse caso, quando ocorre multicolinearidade, as estimativas de mínimos quadrados são imparciais.

    Um grau de viés é adicionado às estimativas de regressão e, devido a isso, a regressão do cume reduz os erros padrão.

    A equação para a regressão da crista é β = (X T X + λ * I) -1 X T Y

  1. Regressão do laço

    Neste, são executados métodos de seleção de variáveis ​​e regularização. Ele usa limiarização suave. Além disso, ele seleciona apenas um subconjunto das covariáveis ​​fornecidas para uso no modelo final.

    A fórmula para a regressão de laço é N -1i=1 N F (X i , Y i , α, β)

  1. Regressão líquida elástica

    É um método de regressão regularizado que combina linearmente as penalidades dos métodos lasso e ridge. É usado principalmente para máquinas de vetor de suporte, otimização de portfólio e aprendizado de métrica.

    A equação para a Regressão Líquida Elástica é ||β|| 1 = ∑ p j=1j |

Além dos tipos acima, confira estes 20 tipos de análise de regressão para previsão

Exemplos de Análise de Regressão

Agora vamos discutir quatro exemplos de análise de regressão, dos quais dois estão relacionados a finanças e dois não estão relacionados a finanças.

Aqui estão os exemplos relacionados às Finanças.

  • Beat e CAPM: Em finanças, usamos a análise de regressão para calcular o BETA de uma ação. Além disso, isso pode ser feito facilmente com a ajuda do Excel.
  • Previsão de receitas e despesas: em finanças, também usamos a análise de regressão para prever as demonstrações financeiras das empresas. Assim, podemos determinar quais mudanças nas premissas de negócios afetarão as despesas e receitas futuras.

Aqui estão os exemplos que são praticados fora das finanças.

  • Através da análise de regressão, é possível encontrar a relação entre o número de horas conduzidas pelo motorista e a idade do motorista.
  • Com a ajuda da análise de regressão, você pode conhecer a relação entre a porcentagem de notas de aprovação em uma sala de aula e o número de anos de experiência de um professor.

Ferramentas de análise de regressão

Existem várias ferramentas de análise de regressão, mas abaixo estão as 5 melhores ferramentas.

  1. Estatística máxima

    Preço: 39€ para estudantes e 79€ para outros utilizadores

    É uma ferramenta fácil de usar e acessível disponível online. Apenas três etapas são necessárias para concluir a análise em uma única caixa de diálogo. Como fornece análise passo a passo, é muito útil para estudantes e jovens acadêmicos.

    Para saber mais sobre ele clique aqui (1) .

  1. AcaStatName

    Preço: Começa a partir de US$ 9,99, mas o preço aumenta com recursos adicionais.

    É uma das melhores ferramentas de análise estatística. A principal característica disso é que ele analisa os dados usando técnicas muito simples. Além disso, faz a análise muito rapidamente.

    Para saber mais clique aqui (2) .

  1. NCSS

    Preço: A assinatura anual está disponível por US$ 239.

    Uma grande variedade de ferramentas estatísticas e gráficas estão disponíveis no software NCSS para analisar os dados. Ele também oferece outras facilidades, como documentação de organização, vídeos de treinamento gratuitos e uma equipe de suporte por e-mail 24 horas por dia, 7 dias por semana.

    Para saber mais sobre ele clique aqui (3) .

  1. Estatística XL

    Preço: O preço anual deste software é de $ 275. Mas você pode obter um teste gratuito dele .

    É um software estatístico que possui muitos recursos para atender às necessidades do usuário. Também é compatível com o Microsoft Excel e você pode usá-lo em PC e Mac.

    Para saber mais clique aqui (4) .

  1. SAS

    Preço: Você pode cotar um preço personalizado de acordo com suas necessidades. Além disso, um teste gratuito está disponível.

    É perfeito para a análise tradicional de regressão linear. Ele atende às necessidades estatísticas especializadas e corporativas.

    Para saber mais clique aqui (5) .

Perguntas frequentes sobre análise de regressão

P. O que é a Fórmula de Análise de Regressão?

A. A fórmula é Y = MX + b

Onde,

  • Y é a variável dependente da equação de regressão.
  • M é a inclinação da equação de regressão.
  • X é a variável dependente da equação de regressão.
  • b é a constante da equação.

P. O que é Análise de Regressão Múltipla

A. A análise de regressão múltipla é um método estatístico usado para prever o valor da variável dependente com a ajuda de duas ou mais variáveis ​​independentes.

Q. Exemplos de Análise de Regressão Múltipla

R. Com o exemplo da regressão múltipla, você pode prever a pressão arterial de um indivíduo considerando sua altura, peso e idade. Aqui a pressão arterial é a variável dependente e outras são a variável independente.

P. O que é Análise de Regressão Simples

A. A análise de regressão simples é uma ferramenta estatística para encontrar a relação entre uma variável dependente e uma variável independente com base em observações anteriores.

P. Quais são as aplicações da Análise de Regressão

A. Aqui estão as aplicações da Análise de Regressão:

  • Você pode prever decisões futuras.
  • Auxilia na otimização do processo.
  • Ajuda a corrigir os erros.
  • Por meio da análise de regressão, você pode obter melhores insights.

Pensamentos finais

Da próxima vez que alguém em sua organização apresentar uma hipótese na qual um fator afetará outro fator, talvez você deva considerar a realização de uma análise de regressão para determinar o resultado. Um processo de tomada de decisão de negócios informado pode ajudar a alocar recursos de forma eficiente e aumentar a receita a longo prazo.