Quais São as Premissas da Regressão Logística?
Neste artigo aprenderá sobre as premissas da regressão logística, permitindo que construa modelos precisos e confiáveis.
A regressão logística é uma técnica estatística amplamente utilizada para modelar a relação entre uma variável dependente categórica e uma ou mais variáveis independentes.
Este poderoso método tem aplicações em vários campos, incluindo pesquisa médica, ciências sociais e negócios.
Para garantir a precisão e confiabilidade dos modelos de regressão logística, certas premissas devem ser atendidas.
Assim, neste artigo, nos concentraremos nas premissas da regressão logística.
Pontos-chave
- A regressão logística modela relações entre variável dependente categórica e variáveis independentes.
- Existem três tipos de regressão logística: Binária, Multinomial e Ordinal.
- A premissa de independência das observações é essencial para a regressão logística.
- Deve existir uma relação linear entre o logit da variável dependente e a variável independente.
- A ausência de multicolinearidade é uma premissa importante para as regressões logísticas múltiplas.
Tipos de Regressão Logística
Existem três tipos de regressão logística, com base na natureza da variável dependente:
Regressão Logística Binária: Na regressão logística binária, a variável dependente tem apenas duas possíveis categorias ou resultados. Essas categorias são geralmente representadas como 0 e 1. Este tipo de regressão logística é usado quando o objetivo é prever a probabilidade de uma observação pertencer a uma das duas categorias com base em uma ou mais variáveis independentes.
Regressão Logística Multinomial: Na regressão logística multinomial, a variável dependente apresenta três ou mais categorias não ordenadas. Este tipo de regressão logística é usado quando o objetivo é prever a probabilidade de uma observação pertencer a uma das múltiplas categorias com base em uma ou mais variáveis independentes.
Regressão Logística Ordinal: Na regressão logística ordinal, a variável dependente tem três ou mais categorias ordenadas. Essas categorias têm uma ordem natural, mas as distâncias entre elas podem não ser iguais. Este tipo de regressão logística é usado quando o objetivo é prever a probabilidade de uma observação cair em uma categoria específica ou em uma categoria inferior com base em uma ou mais variáveis independentes.
Tipo de Regressão Logística | Variável Dependente | Principais Suposições |
---|---|---|
Regressão Logística Binária | Duas categorias (0 e 1) | Previsão da probabilidade de uma observação pertencer a uma das duas categorias com base em uma ou mais variáveis independentes |
Regressão Logística Multinomial | Três ou mais categorias não ordenadas | Previsão da probabilidade de uma observação pertencer a uma das múltiplas categorias não ordenadas com base em uma ou mais variáveis independentes |
Regressão Logística Ordinal | Três ou mais categorias ordenadas | Previsão da probabilidade de uma observação cair em uma categoria específica ou em uma categoria inferior com base em uma ou mais variáveis independentes |
Regressão Logística Simples ou Múltipla?
Classificamos as regressões como simples ou múltipla de acordo com a quantidade de variáveis independentes (preditoras) incluídas no modelo.
A regressão logística simples é usada quando há apenas uma variável independente (preditora) e uma variável dependente (resultado). É um modelo que permite prever a probabilidade de um evento ocorrer com base no valor de uma única variável preditora. Por exemplo, você pode usar a regressão logística simples para prever a probabilidade de um aluno passar em um exame com base no número de horas que ele estudou.
A regressão logística múltipla, por outro lado, é usada quando há duas ou mais variáveis independentes (preditoras) e uma variável dependente (resultado). Este modelo permite prever a probabilidade de um evento ocorrer com base nos valores de várias variáveis preditoras. Por exemplo, você pode usar a regressão logística múltipla para prever a probabilidade de um cliente fazer uma compra com base em sua idade, sexo e renda.
Em geral, a regressão logística múltipla é mais poderosa do que a regressão logística simples porque pode levar em conta a influência de várias variáveis preditoras sobre o resultado. No entanto, também requer mais dados e premissas do que a regressão logística simples, como a premissa de não multicolinearidade entre as variáveis independentes.
Aprenda Estatística para Análise de Dados!
Desmistifique a estatística e descubra como analisar seus dados de forma eficiente.
Premissas da Regressão Logística
Variável independente binária (para Regressão Logística Binária): A variável dependente deve ter apenas duas categorias. Isso pode ser verificado inspecionando a variável dependente.
Variável independente multinomial (para Regressão Logística Multinomial): A variável dependente deve ter três ou mais categorias não ordenadas. Isso pode ser verificado inspecionando a variável dependente.
Variável independente ordinal (para Regressão Logística Ordinal): A variável dependente deve ter três ou mais categorias ordenadas, com um ranking natural entre elas. Isso pode ser verificado inspecionando a variável dependente.
Independência de Observações: As observações no conjunto de dados devem ser independentes umas das outras. Avalie o desenho do estudo e o processo de coleta de dados para confirmar a independência das observações. Dados em séries temporais ou agrupados podem violar essa premissa.
Linearidade do Logit: Deve haver uma relação linear entre o logit da variável dependente e a variável independente. Isso pode ser verificado usando o teste de Box-Tidwell, que avalia a linearidade da relação logit entre as variáveis independentes contínuas e a variável dependente. Alternativamente, você pode inspecionar visualmente a relação usando gráficos de dispersão ou gráficos de resíduos parciais.
Ausência de Multicolinearidade (para Regressões Logísticas Múltiplas): As variáveis independentes não devem ser altamente correlacionadas com qualquer outra variável no modelo. Examine a matriz de correlação das variáveis independentes e procure por altas correlações. Você também pode calcular o Fator de Inflação da Variância (VIF) para cada variável independente; valores de VIF maiores que 10 podem indicar multicolinearidade.
Conclusão
A regressão logística é um poderoso método estatístico para analisar dados e prever resultados.
No entanto, é importante conhecer a não violar as premissas da regressão logística para garantir previsões de modelos precisas e confiáveis.
Essas premissas incluem a independência de observações, a linearidade do logit e a ausência de multicolinearidade entre as variáveis independentes.
Existem várias técnicas disponíveis para avaliar e verificar essas premissas, como o teste de Box-Tidwell e o VIF.
Ao dominar essas premissas e selecionar modelos de regressão logística podemos tomar decisões mais precisas.
Simplifique a Análise de seus Dados!
Tenha o domínio da estatística e analise seus dados com confiança. Comece sua jornada agora mesmo!
Perguntas Frequentes
Q1: O que é Regressão Logística? A regressão logística é uma técnica estatística utilizada para modelar a relação entre uma variável dependente categórica e uma ou mais variáveis independentes.
Q2: Quais são os tipos de Regressão Logística? Existem três tipos: Regressão Logística Binária, Multinomial e Ordinal. A escolha do tipo depende da natureza da variável dependente.
Q3: Qual é a diferença entre Regressão Logística Simples e Múltipla? A regressão logística simples envolve uma única variável independente e uma variável dependente, enquanto a regressão logística múltipla envolve duas ou mais variáveis independentes e uma variável dependente.
Q4: Qual pré-requisito para uma Regressão Logística Binária? Para a Regressão Logística Binária, a variável dependente deve ter apenas duas categorias.
Q5: Quais pré-requisito para uma Regressão Logística Multinomial? Para a Regressão Logística Multinomial, a variável dependente deve ter três ou mais categorias não ordenadas.
Q6: Quais pré-requisito para uma Regressão Logística Ordinal? Para a Regressão Logística Ordinal, a variável dependente deve ter três ou mais categorias ordenadas, com um ranking natural entre elas.
Q7: O que é a premissa de Independência de Observações? Esta premissa indica que as observações no conjunto de dados devem ser independentes umas das outras. Isso é verificado com base no desenho do estudo e no processo de coleta de dados.
Q8: O que é a premissa de Linearidade do Logit? Deve haver uma relação linear entre o logit da variável dependente e a variável independente. Esta premissa pode ser verificada usando o teste de Box-Tidwell ou inspecionando visualmente a relação através de gráficos de dispersão ou gráficos de resíduos parciais.
Q9: O que é a premissa de Ausência de Multicolinearidade? Esta premissa indica que as variáveis independentes não devem estar altamente correlacionadas com qualquer outra variável no modelo. Esta premissa é comumente verificada examinando a matriz de correlação ou calculando o Fator de Inflação da Variância (VIF) para cada variável independente.
Q10: Por que é importante não violar as premissas da Regressão Logística? As premissas da Regressão Logística garantem a precisão e confiabilidade dos modelos de previsão. As violações dessas premissas podem levar a previsões de modelos imprecisas ou pouco confiáveis.
Baixe GRATUITAMENTE amostras do nosso livro digital!
Aprenda a analisar seus dados com uma metodologia incrível.
O retorno que temos recebido de nossos alunos tem sido excelente!
Clique no link abaixo e saiba mais sobre ele:
ENGLISH VERSION