Média vs Mediana vs Moda
Média, mediana e moda são as principais medidas de tendência central usadas na estatística descritiva. Eles são completamente diferentes entre si e os casos em que são usados para resumir os dados também são diferentes.
Média
A média aritmética é a soma dos valores dos dados dividida pelo número de valores dos dados, ou seja,
[látex]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Se os dados são de um espaço amostral, ele é chamado de média amostral ([latex]\bar{x} [/latex]), que é uma estatística descritiva da amostra. Embora seja a medida descritiva mais comumente usada para uma amostra, não é uma estatística robusta. É muito sensível aos outliers e oscilações.
Por exemplo, considere a renda média dos cidadãos de uma determinada cidade. Como todos os valores dos dados são somados e depois divididos, a renda de uma pessoa extremamente rica afeta significativamente a média. Portanto, os valores médios nem sempre são uma boa representação dos dados.
Além disso, no caso de um sinal alternado, a corrente que passa por um elemento varia periodicamente da direção positiva para a negativa e vice-versa. Se tomarmos a corrente média que passa pelo elemento em um único período, ela dará 0, significando que nenhuma corrente passou pelo elemento, o que obviamente não é verdade. Portanto, também neste caso, a média aritmética não é uma boa medida.
A média aritmética é um bom indicador quando os dados são distribuídos uniformemente. Para uma distribuição normal, a média é igual à moda e à mediana. Também apresenta os menores resíduos quando se considera a raiz quadrada do erro quadrático médio; portanto, a melhor medida descritiva quando é necessário representar um conjunto de dados por um único número.
Mediana
Os valores do ponto de dados do meio depois de organizar todos os valores de dados em ordem crescente são definidos como a mediana do conjunto de dados. A mediana é o 2º quartil, 5º decil e 50º percentil.
• Se o número de observações (pontos de dados) for ímpar, então a mediana é a observação exatamente no meio da lista ordenada.
• Se o número de observações (pontos de dados) for par, então a mediana é a média das duas observações do meio na lista ordenada.
Median divide a observação em dois grupos; ou seja, um grupo (50%) de valores superiores e um grupo (50%) de valores inferiores à mediana. As medianas são usadas especificamente em distribuições assimétricas e representam dados bem melhor do que a média aritmética.
Modo
Modo é o número que mais ocorre em um conjunto de observações. O modo de um conjunto de dados é calculado encontrando a frequência de cada elemento dentro do conjunto.
• Se nenhum valor ocorrer mais de uma vez, o conjunto de dados não terá moda.
• Caso contrário, qualquer valor que ocorra com a maior frequência é uma moda do conjunto de dados.
Mais de 1 modo pode existir em um conjunto; portanto, o modo não é uma estatística exclusiva de um conjunto de dados. Em uma distribuição uniforme, existe uma moda. A moda de uma distribuição de probabilidade discreta é o ponto em que a função de massa de probabilidade atinge seu ponto mais alto. Renderizando as interpretações acima, podemos dizer que os máximos globais são modos.
Considere a aplicação de todas as três medidas ao seguinte conjunto de dados.
DADOS: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Média=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12
Mediana=9 (13º elemento)
Modo=9 (frequência de 9=5)
Qual é a diferença entre Média, Mediana e Moda?
• A média aritmética é a soma dos valores (observações) dividida pelo número de observações. Não é uma estatística robusta e fortemente dependente da natureza da distribuição normal dentro da distribuição considerada. Um único outlier pode causar uma mudança significativa na média dando valores relativamente enganosos. O conceito pode ser estendido para média geométrica, média harmônica, média ponderada e assim por diante.
• A mediana é o valor médio do conjunto de observações e é relativamente menos afetada por valores discrepantes. Pode fornecer uma boa estimativa como estatística de resumo em casos altamente distorcidos.
• Modo é o valor de observação mais comum no conjunto de dados. Se a distribuição é assimétrica positiva, a moda fica à esquerda da mediana e, se assimétrica negativa, a moda fica à direita da mediana.
• Se positivamente assimétrica, a média está à direita da mediana; se a média com assimetria negativa estiver à esquerda da mediana.
• Na distribuição normal, todos os três, média, moda e mediana são iguais.