Quais São as Premissas da Regressão Logística?

Neste artigo aprenderá sobre as premissas da regressão logística, permitindo que construa modelos precisos e confiáveis.

A regressão logística é uma técnica estatística amplamente utilizada para modelar a relação entre uma variável dependente categórica e uma ou mais variáveis independentes.

Este poderoso método tem aplicações em vários campos, incluindo pesquisa médica, ciências sociais e negócios.

Para garantir a precisão e confiabilidade dos modelos de regressão logística, certas premissas devem ser atendidas.

Assim, neste artigo, nos concentraremos nas premissas da regressão logística.

Pontos-chave

  • A regressão logística modela relações entre variável dependente categórica e variáveis independentes.
  • Existem três tipos de regressão logística: Binária, Multinomial e Ordinal.
  • A premissa de independência das observações é essencial para a regressão logística.
  • Deve existir uma relação linear entre o logit da variável dependente e a variável independente.
  • A ausência de multicolinearidade é uma premissa importante para as regressões logísticas múltiplas.

Tipos de Regressão Logística

Existem três tipos de regressão logística, com base na natureza da variável dependente:

Regressão Logística Binária: Na regressão logística binária, a variável dependente tem apenas duas possíveis categorias ou resultados. Essas categorias são geralmente representadas como 0 e 1. Este tipo de regressão logística é usado quando o objetivo é prever a probabilidade de uma observação pertencer a uma das duas categorias com base em uma ou mais variáveis independentes.

Regressão Logística Multinomial: Na regressão logística multinomial, a variável dependente apresenta três ou mais categorias não ordenadas. Este tipo de regressão logística é usado quando o objetivo é prever a probabilidade de uma observação pertencer a uma das múltiplas categorias com base em uma ou mais variáveis independentes.

Regressão Logística Ordinal: Na regressão logística ordinal, a variável dependente tem três ou mais categorias ordenadas. Essas categorias têm uma ordem natural, mas as distâncias entre elas podem não ser iguais. Este tipo de regressão logística é usado quando o objetivo é prever a probabilidade de uma observação cair em uma categoria específica ou em uma categoria inferior com base em uma ou mais variáveis independentes.

Tipo de Regressão Logística Variável Dependente Principais Suposições
Regressão Logística Binária Duas categorias (0 e 1) Previsão da probabilidade de uma observação pertencer a uma das duas categorias com base em uma ou mais variáveis independentes
Regressão Logística Multinomial Três ou mais categorias não ordenadas Previsão da probabilidade de uma observação pertencer a uma das múltiplas categorias não ordenadas com base em uma ou mais variáveis independentes
Regressão Logística Ordinal Três ou mais categorias ordenadas Previsão da probabilidade de uma observação cair em uma categoria específica ou em uma categoria inferior com base em uma ou mais variáveis independentes

Regressão Logística Simples ou Múltipla?

Classificamos as regressões como simples ou múltipla de acordo com a quantidade de variáveis independentes (preditoras) incluídas no modelo.

A regressão logística simples é usada quando há apenas uma variável independente (preditora) e uma variável dependente (resultado). É um modelo que permite prever a probabilidade de um evento ocorrer com base no valor de uma única variável preditora. Por exemplo, você pode usar a regressão logística simples para prever a probabilidade de um aluno passar em um exame com base no número de horas que ele estudou.

A regressão logística múltipla, por outro lado, é usada quando há duas ou mais variáveis independentes (preditoras) e uma variável dependente (resultado). Este modelo permite prever a probabilidade de um evento ocorrer com base nos valores de várias variáveis preditoras. Por exemplo, você pode usar a regressão logística múltipla para prever a probabilidade de um cliente fazer uma compra com base em sua idade, sexo e renda.

Em geral, a regressão logística múltipla é mais poderosa do que a regressão logística simples porque pode levar em conta a influência de várias variáveis preditoras sobre o resultado. No entanto, também requer mais dados e premissas do que a regressão logística simples, como a premissa de não multicolinearidade entre as variáveis independentes.

Publicidade
Publicidade

Título do Anúncio

Descrição do anúncio. Lorem ipsum dolor sit amet, consectetur adipiscing elit.

Premissas da Regressão Logística

Variável independente binária (para Regressão Logística Binária): A variável dependente deve ter apenas duas categorias. Isso pode ser verificado inspecionando a variável dependente.

Variável independente multinomial (para Regressão Logística Multinomial): A variável dependente deve ter três ou mais categorias não ordenadas. Isso pode ser verificado inspecionando a variável dependente.

Variável independente ordinal (para Regressão Logística Ordinal): A variável dependente deve ter três ou mais categorias ordenadas, com um ranking natural entre elas. Isso pode ser verificado inspecionando a variável dependente.

Independência de Observações: As observações no conjunto de dados devem ser independentes umas das outras. Avalie o desenho do estudo e o processo de coleta de dados para confirmar a independência das observações. Dados em séries temporais ou agrupados podem violar essa premissa.

Linearidade do Logit: Deve haver uma relação linear entre o logit da variável dependente e a variável independente. Isso pode ser verificado usando o teste de Box-Tidwell, que avalia a linearidade da relação logit entre as variáveis independentes contínuas e a variável dependente. Alternativamente, você pode inspecionar visualmente a relação usando gráficos de dispersão ou gráficos de resíduos parciais.

Ausência de Multicolinearidade (para Regressões Logísticas Múltiplas): As variáveis independentes não devem ser altamente correlacionadas com qualquer outra variável no modelo. Examine a matriz de correlação das variáveis independentes e procure por altas correlações. Você também pode calcular o Fator de Inflação da Variância (VIF) para cada variável independente; valores de VIF maiores que 10 podem indicar multicolinearidade.

Conclusão

A regressão logística é um poderoso método estatístico para analisar dados e prever resultados.

No entanto, é importante conhecer a não violar as premissas da regressão logística para garantir previsões de modelos precisas e confiáveis.

Essas premissas incluem a independência de observações, a linearidade do logit e a ausência de multicolinearidade entre as variáveis independentes.

Existem várias técnicas disponíveis para avaliar e verificar essas premissas, como o teste de Box-Tidwell e o VIF.

Ao dominar essas premissas e selecionar modelos de regressão logística podemos tomar decisões mais precisas.

Publicidade
Publicidade

Título do Anúncio

Descrição do anúncio. Lorem ipsum dolor sit amet, consectetur adipiscing elit.

Perguntas Frequentes

Q1: O que é Regressão Logística? A regressão logística é uma técnica estatística utilizada para modelar a relação entre uma variável dependente categórica e uma ou mais variáveis independentes.

Q2: Quais são os tipos de Regressão Logística? Existem três tipos: Regressão Logística Binária, Multinomial e Ordinal. A escolha do tipo depende da natureza da variável dependente.

Q3: Qual é a diferença entre Regressão Logística Simples e Múltipla? A regressão logística simples envolve uma única variável independente e uma variável dependente, enquanto a regressão logística múltipla envolve duas ou mais variáveis independentes e uma variável dependente.

Q4: Qual pré-requisito para uma Regressão Logística Binária? Para a Regressão Logística Binária, a variável dependente deve ter apenas duas categorias.

Q5: Quais pré-requisito para uma Regressão Logística Multinomial? Para a Regressão Logística Multinomial, a variável dependente deve ter três ou mais categorias não ordenadas.

Q6: Quais pré-requisito para uma Regressão Logística Ordinal? Para a Regressão Logística Ordinal, a variável dependente deve ter três ou mais categorias ordenadas, com um ranking natural entre elas.

Q7: O que é a premissa de Independência de Observações? Esta premissa indica que as observações no conjunto de dados devem ser independentes umas das outras. Isso é verificado com base no desenho do estudo e no processo de coleta de dados.

Q8: O que é a premissa de Linearidade do Logit? Deve haver uma relação linear entre o logit da variável dependente e a variável independente. Esta premissa pode ser verificada usando o teste de Box-Tidwell ou inspecionando visualmente a relação através de gráficos de dispersão ou gráficos de resíduos parciais.

Q9: O que é a premissa de Ausência de Multicolinearidade? Esta premissa indica que as variáveis independentes não devem estar altamente correlacionadas com qualquer outra variável no modelo. Esta premissa é comumente verificada examinando a matriz de correlação ou calculando o Fator de Inflação da Variância (VIF) para cada variável independente.

Q10: Por que é importante não violar as premissas da Regressão Logística? As premissas da Regressão Logística garantem a precisão e confiabilidade dos modelos de previsão. As violações dessas premissas podem levar a previsões de modelos imprecisas ou pouco confiáveis.

Baixe GRATUITAMENTE amostras do nosso livro digital!

Aprenda a analisar seus dados com uma metodologia incrível.

O retorno que temos recebido de nossos alunos tem sido excelente!

Clique no link abaixo e saiba mais sobre ele:

Estatística Aplicada: Análise de Dados.

Visite-nos em Nossas Redes Sociais

POSTAGENS DIÁRIAS NO INSTAGRAM

ENGLISH VERSION

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *