Diferença entre regressão linear e logística

Diferença entre regressão linear e logística
Diferença entre regressão linear e logística

Vídeo: Diferença entre regressão linear e logística

Vídeo: Diferença entre regressão linear e logística
Vídeo: NUMERAIS CARDINAIS E ORDINAIS 2024, Novembro
Anonim

Regressão Linear vs Logística

Na análise estatística, é importante identificar as relações entre as variáveis envolvidas no estudo. Às vezes, pode ser o único propósito da própria análise. Uma ferramenta forte empregada para estabelecer a existência de relacionamento e identificar a relação é a análise de regressão.

A forma mais simples de análise de regressão é a regressão linear, onde a relação entre as variáveis é uma relação linear. Em termos estatísticos, traz à tona a relação entre a variável explicativa e a variável resposta. Por exemplo, usando regressão podemos estabelecer a relação entre o preço da mercadoria e o consumo com base em dados coletados de uma amostra aleatória. A análise de regressão produzirá uma função de regressão do conjunto de dados, que é um modelo matemático que melhor se ajusta aos dados disponíveis. Isso pode ser facilmente representado por um gráfico de dispersão. Graficamente, a regressão é equivalente a encontrar a melhor curva de ajuste para o conjunto de dados fornecido. A função da curva é a função de regressão. Usando o modelo matemático, o uso de uma mercadoria pode ser previsto para um determinado preço.

Portanto, a análise de regressão é amplamente utilizada na previsão e previsão. Também é usado para estabelecer as relações em dados experimentais, nos campos da física, química e em muitas ciências naturais e disciplinas de engenharia. Se a relação ou a função de regressão for uma função linear, então o processo é conhecido como regressão linear. No gráfico de dispersão, pode ser representado como uma linha reta. Se a função não for uma combinação linear dos parâmetros, a regressão não será linear.

A regressão logística é comparável à regressão multivariada e cria um modelo para explicar o impacto de preditores múltiplos em uma variável de resposta. No entanto, na regressão logística, a variável do resultado final deve ser categórica (geralmente dividida; ou seja, um par de resultados atingíveis, como morte ou sobrevivência, embora técnicas especiais permitam que mais informações categorizadas sejam modeladas). Uma variável de resultado contínua pode ser transformada em uma variável categórica, a ser utilizada para regressão logística; no entanto, recolher variáveis contínuas dessa maneira é desencorajado principalmente porque reduz a precisão.

Ao contrário da regressão linear, em direção à média, as variáveis preditoras na regressão logística não precisam ser compelidas a serem linearmente conectadas, comumente distribuídas ou a ter variância igual dentro de cada cluster. Como resultado, a relação entre as variáveis de previsão e de resultado provavelmente não será uma função linear.

Qual é a diferença entre regressão logística e linear?

• Na regressão linear, uma relação linear entre a variável explicativa e a variável de resposta é assumida e os parâmetros que satisfazem o modelo são encontrados por análise, para fornecer a relação exata.

• A regressão linear é realizada para variáveis quantitativas, e a função resultante é quantitativa.

• Na regressão logística, os dados utilizados podem ser categóricos ou quantitativos, mas o resultado é sempre categórico.

Recomendado: