Pre

Bienvenido a una exploración profunda de dos medidas de tendencia central que transforman datos crudos en información útil: la mediana i mitjana. Aunque a menudo se mencionan juntas en cursos y libros de estadística, cada una posee características únicas que influyen en la interpretación de cualquier conjunto de datos. En este artículo, aprenderás qué son la mediana i mitjana, cómo se calculan, cuándo conviene usar cada una y qué errores comunes conviene evitar para obtener conclusiones robustas.

Qué es la mediana i mitjana

La mediana i mitjana es una forma de describir el centro de un conjunto de datos. En español, solemos decir “mediana” para referirse al valor que separa la mitad inferior de la superior cuando los datos están ordenados. En catalán, el término equivalente para la media es “mitjana”; cuando nos referimos a la combinación de ambas ideas, hablamos de mediana i mitjana para enfatizar que estamos tratando dos medidas de ubicación distintas pero complementarias.

En un conjunto de números ordenados, la mediana i mitjana se interpretan de manera diferente:

  • La mediana es un punto que divide la distribución en dos mitades equitativas. Si hay un número impar de observaciones, la mediana es el valor central. Si hay un número par, la mediana es el promedio de los dos valores centrales.
  • La mitjana (media aritmética) es la suma de todos los valores dividida entre la cantidad de observaciones. Es sensible a valores atípicos y sesga su resultado cuando la distribución no es simétrica.

Conocer la diferencia entre la mediana i mitjana te permite responder preguntas como: ¿qué valor representa mejor al conjunto de datos cuando hay sesgo? ¿qué medida de posición se comporta de forma más estable ante valores extremos? Estas preguntas están en el corazón de la estadística aplicada y del análisis de datos en la vida real.

Mediana: definición, cálculo y ejemplos prácticos

La mediana es la cantidad que divide en dos partes iguales un conjunto ordenado. Su gran ventaja es la robustez ante valores atípicos o distribuciones sesgadas.

Cálculo de la mediana paso a paso

  1. Ordena todos los datos de menor a mayor.
  2. Si el número de observaciones es impar, la mediana es el valor en la posición (n+1)/2.
  3. Si el número de observaciones es par, la mediana es el promedio de los valores en las posiciones n/2 y n/2 + 1.

Ejemplos prácticos de mediana

Ejemplo 1: datos: 3, 7, 8, 12, 20. La mediana es 8, porque es el valor central. En este caso, mediana i mitjana coincide en la práctica con la intuición de “valor típico”.

Ejemplo 2: datos sesgados por valores grandes: 1, 2, 2, 2, 9, 100. La mediana es 2, mientras que la mitjana es 16.3. Aquí la mediana ofrece una representación más fiel del centro real de la mayoría de los datos.

La mediana brilla especialmente cuando trabajamos con ingresos, tiempos de respuesta o tamaños de empresas donde existen valores atípicos que distorsionarían la media si no se manejan con cuidado.

Mitjana (media): definición, cálculo y ejemplos prácticos

La mitjana o media aritmética es la suma de todos los valores dividida entre el número de observaciones. Es fácil de entender y de calcular, y funciona muy bien para distribuciones aproximadamente simétricas sin valores extremos significativos.

Cálculo de la mitjana paso a paso

  1. Suma todos los valores del conjunto de datos.
  2. Divide el resultado entre el número total de observaciones.

Ejemplos prácticos de mitjana

Ejemplo 1: datos: 3, 7, 8, 12, 20. La mitjana es (3+7+8+12+20)/5 = 50/5 = 10. En este caso, la mitjana y la mediana difieren, mostrando cómo la media puede situarse cerca de valores extremos, mientras la mediana permanece más estable ante ellos.

Ejemplo 2: datos simétricos sin valores atípicos: 5, 6, 7, 8, 9. La mitjana es 7 y la mediana también es 7, lo que refleja la armonía entre las dos medidas en distribuciones balanceadas.

La mitjana es especialmente útil cuando la distribución es aproximadamente normal y cuando los objetivos de análisis buscan una suma total de valores relevantes para estimaciones de población o de recursos agregados.

Mediana i mitjana en la práctica: cuándo usar cada una

La elección entre mediana i mitjana depende de la forma de la distribución y del objetivo del análisis. A continuación, exploramos escenarios comunes donde cada medida prospera.

  • Distribuciones sesgadas con cola larga: la mediana ofrece un centro que no se ve influido por los valores extremos, mientras la mitjana puede distorsionar la interpretación si no se manejan los outliers.
  • Datos de ingresos o precios: frecuentemente sesgados hacia la derecha; la mediana se interpreta mejor como “valor típico” para describir el poder adquisitivo o el costo medio sin que un par de grandes ingresos alteren la percepción general.
  • Calcular promedios en poblaciones heterogéneas: la mitjana puede ser útil para estimaciones agregadas cuando se asume una distribución relativamente simétrica o cuando se desea ponderar toda la muestra por igual.

En contextos de calidad, biología o ingeniería, la mediana i mitjana se usan juntas para obtener una visión más completa de la centralidad. Por ejemplo, en control de calidad, la mediana puede informar sobre el punto de referencia más representativo, mientras la mitjana acumula el efecto de variabilidad global.

Ventajas y desventajas de cada medida

Conocer las fortalezas y limitaciones de la mediana i mitjana ayuda a elegir la herramienta adecuada para cada situación.

  • Robusta a valores atípicos y colas asimétricas.
  • Representa mejor el “valor típico” en distribuciones sesgadas.
  • Independiente de la escala de los datos cuando se trata de ordenar valores.

  • No utiliza toda la información de los valores; en algunas aplicaciones de estimación de sumas, la mitjana proporciona una visión más completa.
  • En distribuciones muy simétricas, puede ofrecer poco más que una aproximación de la mitjana.

  • Tomar en cuenta todos los valores puede ser ventajoso para estimaciones de población y recursos totales.
  • Fácil de calcular y de interpretar en distribuciones normales o suaves.

  • Altamente sensible a valores extremos y a sesgos.
  • Puede dar una imagen distorsionada del centro en conjuntos de datos con colas largas.

Comparación directa: mediana i mitjana frente a frente

Para entender mejor, compara estos dos ejemplos cortos:

  • Conjunto A: 2, 3, 3, 4, 100. Mediana = 3; Mitjana ≈ 22.4. La mitjana está arrastrada por el valor extremo 100, mientras la mediana refleja el centro de la mayoría de los datos.
  • Conjunto B: 5, 6, 7, 8, 9. Mediana = 7; Mitjana = 7. En distribuciones simétricas, ambas medidas se alinean, brindando una lectura clara del centro.

Herramientas y recursos para calcular mediana i mitjana

Hoy en día, hay múltiples herramientas para calcular estas medidas de forma rápida y fiable, ya sea a mano, en hojas de cálculo o mediante código en lenguajes de programación.

En Excel o Google Sheets:

  • Mediana: =MEDIANA(rango)
  • Mitjana: =PROMEDIO(rango) o =AVERAGE(rango)

Con Python (pandas):

import pandas as pd
datos = [3, 7, 8, 12, 20]
mediana = pd.Series(datos).median()
mitjana = pd.Series(datos).mean()
print(mediana, mitjana)

Con R:

datos <- c(3, 7, 8, 12, 20)
mediana <- median(datos)
mitjana <- mean(datos)
print(mediana)
print(mitjana)

Estas herramientas permiten calcular rápidamente la mediana i mitjana para conjuntos grandes y complejos, además de facilitar la visualización de la distribución mediante histogramas o boxplots.

Funciones relacionadas y variaciones útiles

Además de la mediana i mitjana, existen otras medidas de tendencia central y robustez que complementan la interpretación de datos.

  • Mediana truncada o recortada: se eliminan un porcentaje de valores extremos y se calcula la mediana de los datos restantes, incrementando la robustez frente a outliers.
  • Media geométrica: útil para datos multiplicativos o tasas de crecimiento; sin embargo, requiere valores positivos y se interpreta de manera distinta a la mitjana aritmética.
  • Media ponderada: cuando cada observación tiene diferente importancia, la mitjana se ajusta multiplicando cada valor por su peso y dividiendo por la suma de los pesos.

Preguntas frecuentes sobre mediana i mitjana

A continuación, respondemos a dudas frecuentes que suelen aparecer en cursos y seminarios de estadística sobre mediana i mitjana.

No. En distribuciones simétricas y sin valores extremos, es común que ambas coincidan o se acerquen. En distribuciones sesgadas o con outliers, la mediana i mitjana pueden diferir significativamente, y la mediana suele ser más representativa del centro real de la mayor parte de los datos.

En casos de ingresos con cola larga y valores atípicos altos, la mediana i mitjana ofrecen una visión complementaria: la mediana describe el ingreso típico, mientras la mitjana da una idea del total acumulado. Para comunicar el “valor típico” a un público general, la mediana suele ser la opción preferida; para estimaciones de recursos agregados o presupuestos, la mitjana aporta contexto adicional.

Existen varias estrategias: eliminar outliers, usar la mitjana recortada, o aplicar transformaciones logarítmicas para reducir el impacto de valores extremos antes de calcular la mitjana. En cualquier caso, es clave justificar la metodología y reportar claramente las decisiones tomadas.

Guía rápida para elegir entre mediana i mitjana

  • Si la distribución es asimétrica o contiene valores atípicos, prioriza la mediana como indicativo del centro.
  • Si la distribución es aproximadamente normal y se desea estimar sumas o promedios poblacionales, la mitjana puede ser más informativa.
  • Para presentaciones claras al público general, la mediana suele ser más fácil de entender cuando hay sesgo.
  • Para análisis de variabilidad y simulaciones, la mitjana junto con la desviación típica ofrece un marco estadístico completo.

Conclusión

La mediana i mitjana representan dos enfoques diferentes para entender el centro de un conjunto de datos. La mediana proporciona una referencia robusta ante sesgos y valores extremos, mientras que la mitjana ofrece una visión global que puede ser útil para estimaciones agregadas en distribuciones simétricas. Dominar ambas medidas y saber cuándo emplearlas mejora la interpretación de cualquier análisis estadístico y fortalece la toma de decisiones basada en datos. Al final, la clave es entender la forma de la distribución y el objetivo del análisis para lograr una lectura clara y precisa del conjunto de datos.

Ejemplos finales y casos de estudio

Imagina una empresa que quiere entender el salario de su equipo. Si existen pocos ejecutivos con salarios muy altos, la mitjana podría dar una imagen inflada del salario promedio. En cambio, la mediana i mitjana permitiría reportar el “valor típico” sin que esos grandes bonos distorsionen de manera radical la interpretación. En un conjunto de datos médicos con resultados asimétricos, la mediana suele ser la medida de centro preferida para describir la experiencia clínica típica de los pacientes.

En resumen, la combinación de mediana i mitjana en un análisis bien planteado ofrece una visión más completa y robusta de la realidad de los datos. Esta dualidad es una pieza clave para cualquier profesional que trabaje con estadística descriptiva y análisis de datos, ya sea en investigación, negocio o tecnología.

por Gestor