Diferença entre variância e covariância

Diferença entre variância e covariância
Diferença entre variância e covariância

Vídeo: Diferença entre variância e covariância

Vídeo: Diferença entre variância e covariância
Vídeo: Entenda a essência da Distribuição Normal (de onde vem, para que serve) 2024, Novembro
Anonim

Variação vs Covariância

Variance e covariance são duas medidas usadas em estatística. A variância é uma medida da dispersão dos dados, e a covariância indica o grau de mudança de duas variáveis aleatórias juntas. A variância é um conceito bastante intuitivo, mas a covariância é definida matematicamente de forma não tão intuitiva a princípio.

Mais sobre Variação

Variance é uma medida de dispersão dos dados a partir do valor médio da distribuição. Ele informa a que distância os pontos de dados estão da média da distribuição. É um dos descritores primários da distribuição de probabilidade e um dos momentos da distribuição. Além disso, a variância é um parâmetro da população, e a variância de uma amostra da população atua como um estimador para a variância da população. De uma perspectiva, é definido como o quadrado do desvio padrão.

Em linguagem simples, pode ser descrito como a média dos quadrados da distância entre cada ponto de dados e a média da distribuição. A fórmula a seguir é usada para calcular a variância.

Var(X)=E[(X-µ)2] para uma população e

Var(X)=E[(X-‾x)2] para uma amostra

Pode ser simplificado ainda mais para dar Var(X)=E[X2]-(E[X])2.

Variance tem algumas propriedades de assinatura e é frequentemente usada em estatísticas para tornar o uso mais simples. A variância é não negativa porque é o quadrado das distâncias. No entanto, o intervalo da variância não é confinado e depende da distribuição particular. A variância de uma variável aleatória constante é zero e a variância não muda em relação a um parâmetro de localização.

Mais sobre Covariância

Na teoria estatística, a covariância é uma medida de quanto duas variáveis aleatórias mudam juntas. Em outras palavras, a covariância é uma medida da força da correlação entre duas variáveis aleatórias. Além disso, pode ser considerado como uma generalização do conceito de variância de duas variáveis aleatórias.

A covariância de duas variáveis aleatórias X e Y, que são distribuídas conjuntamente com um segundo momento finito, é conhecida como σXY=E[(X-E[X])(Y-E[S])]. A partir disso, a variância pode ser vista como um caso especial de covariância, onde duas variáveis são iguais. Cov(X, X)=Var(X)

Normalizando a covariância, obtém-se o coeficiente de correlação linear ou o coeficiente de correlação de Pearson, que é definido como ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )

Graficamente, a covariância entre um par de pontos de dados pode ser vista como a área do retângulo com os pontos de dados nos vértices opostos. Pode ser interpretado como uma medida da magnitude da separação entre os dois pontos de dados. Considerando os retângulos para toda a população, a sobreposição dos retângulos correspondentes a todos os pontos de dados pode ser considerada como a força da separação; variação das duas variáveis. A covariância está em duas dimensões, por causa de duas variáveis, mas simplificá-la para uma variável fornece a variância de um único como a separação em uma dimensão.

Qual é a diferença entre Variância e Covariância?

• A variância é a medida de propagação/dispersão em uma população enquanto a covariância é considerada uma medida de variação de duas variáveis aleatórias ou a força da correlação.

• A variância pode ser considerada como um caso especial de covariância.

• A variância e a covariância dependem da magnitude dos valores dos dados e não podem ser comparadas; portanto, eles são normalizados. A covariância é normalizada no coeficiente de correlação (dividindo pelo produto dos desvios padrão das duas variáveis aleatórias) e a variância é normalizada no desvio padrão (tirando a raiz quadrada)

Recomendado: