¿Qué es mejor usar, la mediana o la media?

media
mediana
simetría
Autor/a

José Burgos

Fecha de publicación

22 abr 2025

La elección entre la media y la mediana como medidas de tendencia central es un aspecto fundamental del análisis estadístico que impacta significativamente en la interpretación de los datos. Un análisis cuidadoso revela que la media funciona idealmente en distribuciones simétricas, mientras que la mediana ofrece mayor robustez frente a valores atípicos, siendo preferible en distribuciones asimétricas. Seleccionar incorrectamente entre estas medidas puede distorsionar gravemente la interpretación de los datos, por lo que resulta esencial comprender la naturaleza de la distribución y complementar el análisis con otras medidas estadísticas para obtener conclusiones válidas y representativas.

Medidas de Tendencia Central

Las medidas de tendencia central son herramientas estadísticas fundamentales que permiten resumir un conjunto de datos en un solo valor representativo. Estas medidas identifican el punto central alrededor del cual se distribuyen los datos, facilitando su interpretación y análisis. En el ámbito de la estadística descriptiva, constituyen el primer paso para comprender la naturaleza de los datos antes de realizar comparaciones entre diferentes grupos o aplicar técnicas estadísticas más avanzadas.

La importancia de estas medidas radica en su capacidad para simplificar grandes conjuntos de información en valores únicos que pueden ser fácilmente interpretados y comparados. Esta simplificación resulta especialmente valiosa cuando se trabaja con grandes volúmenes de datos o cuando se necesita comunicar resultados a audiencias diversas. Sin embargo, la elección de la medida adecuada requiere un análisis cuidadoso de las características de los datos y del objetivo específico del estudio.

Media

La media aritmética, comúnmente conocida como promedio, representa el punto de equilibrio o centro de masa de un conjunto de datos. Se calcula sumando todos los valores y dividiendo esta suma por el número total de observaciones, lo que resulta en un valor que considera la magnitud de todos los datos del conjunto. Este método de cálculo hace que la media utilice la totalidad de la información disponible, lo que puede ser tanto una ventaja como una desventaja dependiendo del contexto.

El cálculo de la media se expresa mediante la fórmula:

\[ \bar{X} = \frac{\sum_{i=1}^{n} x_i}{n} \]

Donde \(x_i\) representa cada valor individual y \(n\) es el número total de observaciones. El resultado siempre se expresa en la misma unidad de medida que los datos originales, lo que facilita su interpretación en términos prácticos.

Mediana

La mediana representa el valor que ocupa la posición central cuando los datos se ordenan de menor a mayor, dividiendo el conjunto en dos partes iguales. Esta característica hace que el 50% de las observaciones queden por debajo de la mediana y el otro 50% por encima, independientemente de la magnitud de los valores extremos.

El procedimiento para calcular la mediana varía ligeramente dependiendo de si el número de observaciones es par o impar:

  • Para un número impar de observaciones: se ordenan los datos y se selecciona el valor que ocupa la posición central.
  • Para un número par de observaciones: se ordenan los datos y se calcula el promedio de los dos valores centrales.

Esta metodología de cálculo confiere a la mediana una característica distintiva: su resistencia a la influencia de valores extremos o atípicos, lo que la convierte en una medida más robusta en determinadas situaciones.

Análisis Comparativo: Media vs Mediana

Sensibilidad a Valores Extremos

Una de las diferencias más significativas entre la media y la mediana radica en su comportamiento frente a valores extremos o atípicos. La media, debido a que considera la magnitud de todos los valores en su cálculo, es particularmente sensible a estos datos atípicos. Un solo valor extremadamente alto o bajo puede alterar considerablemente el resultado, alejándolo de lo que podría considerarse como el centro real de los datos.

En contraste, la mediana muestra una notable estabilidad frente a estos valores extremos. Al basarse únicamente en la posición central de los datos ordenados, los valores atípicos tienen un impacto mínimo o nulo en su cálculo, lo que proporciona una medida más robusta y representativa en presencia de distribuciones asimétricas o con valores anómalos.

Comportamiento en Diferentes Distribuciones

El tipo de distribución de los datos juega un papel crucial en la elección entre la media y la mediana. En distribuciones perfectamente simétricas, donde los datos se distribuyen de manera equilibrada alrededor del valor central, la media y la mediana coinciden, proporcionando ambas una adecuada representación de la tendencia central.

Sin embargo, en distribuciones asimétricas, la situación cambia significativamente:

  • En distribuciones con asimetría positiva (sesgadas hacia la derecha), la media tiende a ser mayor que la mediana debido a la influencia de valores atípicamente altos.

  • En distribuciones con asimetría negativa (sesgadas hacia la izquierda), la media suele ser menor que la mediana, afectada por valores excepcionalmente bajos.

Esta diferencia en el comportamiento resulta fundamental para interpretar correctamente los datos y evitar conclusiones erróneas basadas en una medida inadecuada.

Propiedades Algebraicas y Analíticas

Desde una perspectiva algebraica, la media posee propiedades matemáticas que la hacen especialmente útil para análisis estadísticos avanzados. La suma de las desviaciones respecto a la media siempre es cero, lo que facilita cálculos posteriores como la varianza o la desviación estándar. Además, la media minimiza la suma de los cuadrados de las desviaciones, lo que la convierte en un estimador eficiente en muchos contextos estadísticos.

La mediana, por su parte, minimiza la suma de las desviaciones absolutas, lo que explica su robustez frente a valores extremos. Esta propiedad resulta ventajosa en análisis donde se busca reducir el impacto de observaciones atípicas, como en estudios económicos sobre distribución de ingresos o en análisis de tiempos de respuesta.

Aplicaciones Prácticas y Ejemplos Ilustrativos

La Media en Contextos Educativos

En el ámbito educativo, la media se utiliza frecuentemente para calcular el promedio de calificaciones de un estudiante. Por ejemplo, si un alumno obtiene las siguientes notas en matemáticas: 4.0, 3.5, 4.5, y 5.0, la media se calcularía sumando todas las notas (4.0 + 3.5 + 4.5 + 5.0 = 17) y dividiéndolas por el número de evaluaciones (17/4 = 4.25). Este valor representa el rendimiento general del estudiante en la asignatura y permite compararlo con otros estudiantes o con estándares establecidos.

Este método resulta adecuado cuando las calificaciones siguen una distribución relativamente simétrica y no existen valores extremos que puedan distorsionar el resultado. Sin embargo, si un estudiante tiene una calificación excepcionalmente baja o alta, la media podría no reflejar adecuadamente su desempeño habitual.

La Mediana en Análisis Económicos

En análisis económicos, particularmente al estudiar la distribución de ingresos en una población, la mediana suele ser preferible a la media. Si consideramos los ingresos mensuales de cinco empleados: $1,000, $1,200, $1,400, $1,600, y $3,000, la mediana sería $1,400, indicando que la mitad de los empleados gana menos y la otra mitad gana más que esta cantidad.

En este caso, la mediana proporciona una visión más realista del “empleado típico” que la media ($1,640), la cual se ve inflada por el valor atípicamente alto de $3,000. Esta es precisamente la razón por la que los indicadores económicos relacionados con ingresos, como el salario mediano, suelen preferirse sobre los promedios para evitar la distorsión causada por los ingresos extremadamente altos de un pequeño porcentaje de la población.

Casos de Distribuciones Asimétricas

Para ilustrar el impacto del tipo de distribución en la elección de la medida adecuada, consideremos el tiempo de resolución de un problema matemático por parte de un grupo de estudiantes. Si la mayoría de los estudiantes resuelven el problema en tiempos cercanos entre sí, pero unos pocos tardan significativamente más, tendríamos una distribución con asimetría positiva.

En este escenario, la media se vería arrastrada hacia los valores más altos debido a esos pocos estudiantes que tardaron mucho más, mientras que la mediana mantendría su posición central, reflejando mejor el tiempo “típico” de resolución. Utilizar la media en este caso podría llevar a conclusiones erróneas sobre la dificultad del problema o el nivel del grupo.

Guía para la Presentación de Medidas de Tendencia Central

Principios para la Comunicación Efectiva

La presentación adecuada de medidas de tendencia central en trabajos científicos o informes técnicos requiere no solo seleccionar la medida apropiada sino también comunicarla de manera efectiva. Es fundamental proporcionar información suficiente para que el lector pueda comprender completamente el contexto y las características de los datos analizados.

Al presentar estas medidas, se recomienda:

  1. No limitarse a exponer simplemente porcentajes o promedios aislados.
  2. Proporcionar el número exacto de individuos u observaciones para cada categoría o grupo.
  3. Incluir medidas de dispersión (como la desviación estándar o el rango intercuartílico) que complementen a las medidas de tendencia central.

Estas prácticas permiten una interpretación más completa y precisa de los resultados, evitando simplificaciones excesivas que podrían conducir a interpretaciones erróneas.

Formato y Estructura para Informes Científicos

En informes científicos, la presentación de medidas de tendencia central debe seguir un formato estructurado que facilite su comprensión e interpretación. Los resultados descriptivos deben presentarse para cada grupo por separado, especialmente en estudios comparativos donde se analizan diferentes tratamientos o condiciones.

La sección de resultados debe incluir:

  1. Datos correspondientes a la pregunta de investigación o problemática.
  2. Un análisis contextual breve que explique el significado de estos datos.
  3. Los resultados más relevantes para la pregunta de investigación.
  4. Un informe preciso de los hallazgos estadísticos, asumiendo que los lectores tienen una comprensión sólida de los conceptos estadísticos básicos.

Es importante recordar que esta sección debe ser una descripción general pero relativamente breve de los hallazgos, no una presentación exhaustiva de cada número y cálculo realizado durante el análisis.

Criterios de Selección: ¿Cuándo Usar Cada Medida?

Análisis del Tipo de Distribución

El primer criterio para seleccionar entre la media y la mediana debe ser el análisis del tipo de distribución de los datos. Como regla general:

  • En distribuciones simétricas, donde los datos se distribuyen equilibradamente alrededor del valor central, tanto la media como la mediana proporcionan resultados similares y pueden utilizarse indistintamente.
  • En distribuciones asimétricas positivas (con cola a la derecha), la mediana suele ser más representativa que la media, ya que esta última se ve inflada por los valores extremos del lado derecho.
  • En distribuciones asimétricas negativas (con cola a la izquierda), la mediana también resulta más adecuada, pues la media se ve reducida por los valores extremos del lado izquierdo.

Identificar correctamente el tipo de distribución constituye, por tanto, el paso inicial más importante para una elección informada.

Consideración de Valores Atípicos

La presencia de valores atípicos o extremos representa otro factor determinante en la elección entre estas medidas:

  • Si los datos contienen valores atípicos que son realmente parte del fenómeno estudiado y no errores de medición, la mediana proporciona una medida más robusta y representativa de la tendencia central.
  • Si los valores extremos son producto de errores o no son relevantes para el análisis, podría ser preferible eliminarlos y utilizar la media para los datos restantes.
  • En algunos casos, puede resultar informativo calcular y reportar ambas medidas, explicando las discrepancias observadas entre ellas debido a la influencia de estos valores atípicos.

Esta consideración resulta especialmente importante en campos como la economía, la medicina o la psicología, donde la presencia de valores extremos es común y puede afectar significativamente los resultados.

Objetivos Específicos del Análisis

Finalmente, los objetivos específicos del análisis deben guiar la elección de la medida más adecuada:

  • Si el objetivo es estimar parámetros o realizar inferencias estadísticas posteriores (como pruebas de hipótesis o intervalos de confianza), la media suele ser preferible debido a sus propiedades matemáticas.
  • Si el propósito es describir el “valor típico” o central de una distribución, especialmente en presencia de asimetrías o valores extremos, la mediana resulta más apropiada.
  • Si se busca comunicar resultados a audiencias no especializadas o tomar decisiones basadas en el “caso típico”, la mediana puede ofrecer una representación más intuitiva y menos susceptible a malinterpretaciones.

En muchos casos, la estrategia óptima consiste en reportar ambas medidas junto con indicadores de dispersión, proporcionando así una visión más completa de las características de los datos.

Medidas Complementarias para un Análisis Integral

Indicadores de Dispersión

Para complementar las medidas de tendencia central y obtener una comprensión más completa de la distribución de los datos, es fundamental incorporar indicadores de dispersión adecuados:

  • La desviación estándar y la varianza son los indicadores de dispersión más utilizados junto con la media, proporcionando información sobre la variabilidad de los datos alrededor del promedio.
  • El rango intercuartílico (la diferencia entre el tercer y primer cuartil) es el indicador de dispersión que mejor complementa a la mediana, ofreciendo una medida robusta de la variabilidad que, al igual que la mediana, no se ve fuertemente afectada por valores extremos.

La presentación conjunta de medidas de tendencia central y dispersión permite una interpretación más precisa y matizada de los datos, evitando conclusiones simplistas basadas únicamente en valores centrales.

Representaciones Gráficas

Las representaciones gráficas constituyen herramientas poderosas para visualizar la distribución de los datos y comprender mejor la relación entre diferentes medidas de tendencia central:

  • Los histogramas permiten identificar visualmente el tipo de distribución (simétrica o asimétrica) y la ubicación relativa de la media y la mediana.
  • Los diagramas de caja (box plots) muestran la mediana, los cuartiles y los valores atípicos, proporcionando una representación visual intuitiva de la distribución.
  • Los gráficos de densidad facilitan la comparación entre distribuciones y la identificación de patrones subyacentes en los datos.

Estas representaciones complementan el análisis numérico y ayudan a comunicar de manera efectiva las características de los datos a audiencias diversas.

Conclusión: Hacia una Elección Informada

La elección entre la media y la mediana como medida de tendencia central debe basarse en un análisis cuidadoso de múltiples factores. La naturaleza de la distribución de los datos, la presencia de valores atípicos y los objetivos específicos del análisis constituyen los criterios fundamentales para tomar esta decisión.

En distribuciones simétricas sin valores extremos significativos, ambas medidas proporcionan resultados similares, aunque la media suele preferirse por sus propiedades matemáticas favorables. En contraste, ante distribuciones asimétricas o con valores atípicos, la mediana emerge como la opción más robusta y representativa, resistiendo la influencia de estos valores extremos que pueden distorsionar significativamente la media.

Más allá de la elección entre una u otra medida, el enfoque más completo y riguroso consiste en adoptar una perspectiva integrada que combine múltiples indicadores estadísticos. La presentación conjunta de la media, la mediana, medidas de dispersión apropiadas y representaciones gráficas proporciona una visión comprehensiva de los datos, facilitando interpretaciones más precisas y matizadas.

Para concluir, ofrecemos algunas recomendaciones prácticas para la selección y presentación de medidas de tendencia central:

  1. Analizar siempre previamente la distribución de los datos mediante herramientas gráficas y estadísticas descriptivas básicas.
  2. Considerar el propósito específico del análisis y las características de la audiencia a la que se dirigirán los resultados.
  3. En caso de duda, calcular y reportar tanto la media como la mediana, explicando las posibles discrepancias entre ambas.
  4. Complementar siempre las medidas de tendencia central con indicadores de dispersión apropiados.
  5. Utilizar representaciones gráficas para facilitar la interpretación y comunicación de los resultados.

Siguiendo estas recomendaciones, los investigadores y analistas podrán realizar elecciones informadas que maximicen la validez y utilidad de sus análisis estadísticos, evitando interpretaciones erróneas derivadas de la selección inadecuada de medidas de tendencia central.

Referencias

DataCamp. (s. f.). Media vs Mediana: ¿cuándo usar cuál? Recuperado de https://www.datacamp.com/es/tutorial/mean-vs-median

Pérez, C. (s. f.). Cómo presentar la información estadística. Recuperado de https://educacionuc.files.wordpress.com/2015/05/como_presentar_estadistica.pdf

Rincón, Y. (2022, 19 de septiembre). Medidas de tendencia central: qué son y cuáles son. Universidad Internacional de La Rioja (UNIR). Recuperado de https://colombia.unir.net/actualidad-unir/medidas-tendencia-central/

Vallejo, J. A., Fernández, M. P. & Livacic-Rojas, P. E. (2022). Una reflexión sobre las medidas de tendencia central más comunes. Educación matemática, 34(2), 159–178. Recuperado de https://dialnet.unirioja.es/descarga/articulo/8663067.pdf