Vamos a ver el concepto de mediana a distintos niveles de profundidad.
Media, moda y mediana. Esto nos enseñaban en el tema de estadística de matemáticas antes de entrar al instituto. Media es sumarlos todos y dividir entre el número de sumandos. Moda es el [elemento] que más se repite. Mediana es el [elemento] de en medio. Sin embargo, ¿qué significa esto? Tanto media y moda como mediana están entre el mínimo y el máximo de los elementos. Asimismo el de en medio puede ser poco intuitivo, por ejemplo $\{1,3,5,5,5\}$ tiene mediana $5$ , no $3$ como uno podría pensar al ser el de en medio en $\{1,3,5\}$ . Esto es un error recurrente: no se pueden eliminar los elementos repetidos.
La mediana de una lista $\{x_i\}_{i=1}^n$ se define como el ecuador de dicha lista, es decir, como el elemento que parte la lista en dos sublistas ordenadas de igual longitud: una con todos sus elementos menores o iguales que la mediana, mientras que la otra tiene todos sus elementos mayores o igual que la mediana. Para una distribución simétrica con una única moda (unimodal), la mediana coincide con la moda. Para calcular la mediana de una lista $\{x_i\}_{i=1}^n$ realmente se calcula la mediana de una lista equivalente: se reordenan los elementos de menor a mayor, que se denota son el subíndice entre paréntesis, $\{x_{(j)}\}_{j=1}^n$ $$ \overset{n}{\underset{i=1}{\operatorname{med}}}(x_i) = \overset{n}{\underset{j=1}{\operatorname{med}}}(x_{(j)}) \overset{\mathrm{def}}{=} \begin{cases} x_{(\ell+1)} & n = 2\ell+1 \\[2ex] \displaystyle \frac{x_{(\ell)}+x_{(\ell+1)}}{2} & n = 2\ell \\ \end{cases} $$ Si hay un número impar de elementos, $2\ell +1$ , se toma el elemento $(\ell+1)-$ésimo tal que hay $\ell$ elementos menores o igual que ese, y otros $\ell$ elementos mayores o igual que ese.
Si hay un número par de elementos, $2\ell $ , se tiene que tomar el elemento tal que haya $\ell$ elementos menores o igual que ese, y los otros $\ell$ elementos mayores o igual que ese, por lo que se hace la semisuma de los elementos $\ell-$ésimo y $(\ell+1)-$ésimo.
Desde un punto de vista analítico se puede ver como el argumento que minimiza la función $\rho$ , es decir, $\operatorname{med}(x_i) = \operatorname{arg\, min}(\rho)$ , siendo dicha función: $$ \rho(x) = \sum_{i=1}^n | x-x_i | = \sum_{j=1}^n \big| x-x_{(j)} \big| $$ También se puede ver que la mediana $m$ de una variable aleatoria $X$ es el valor de $c$ (argumento) que minimiza la función $\operatorname{E}(|X-c|)$ .
La mediana es un L-estimador (un estimador que es una combinación lineal de estadísticos de orden $k$ siendo estos el $k-$ésimo valor más pequeño de la muestra), por lo que se tiene la siguiente relación de afinidad: $$ \operatorname{med}(a\, x_i + b) = a\, \operatorname{med}(x_i) + b$$ Sin embargo , la mediana de la suma dos listas (o dos vectores) no es la suma de las medianas. Un ejemplo sería $(1,0,0)$ , con mediana $0$ , $(0,2,0)$ , con mediana también $0$ , mientras que la suma $(1,2,0)$ , tiene mediana $1$ , no satisfacen la desigualdad triangular ya que $ 1 \not\leqslant 0 + 0 $. Mientras que $(4,-8,6)$ , con mediana $4$ , $(-9,4,5)$ , con mediana también $4$ , mientras que la suma $(-5,-4,11)$ , tiene mediana $-4$ : se tiene $-4 \leqslant 4 + 4$ , es decir: $$ \operatorname{med}(x_i+y_i) \lesseqgtr \operatorname{med}(x_i) + \operatorname{med}(y_i)$$ La mediana es un caso muy particular de los cuantiles. Para un $p\in [0,1]$ se llama $p-$cuantiles a los valores que parten la muestra en sublistas de igual longitud que representan $p$ frente a la longitud total de la lista. Así pues se tiene (en frecuencia relativa) que el primer $p-$cuantil es mayor o igual que $p$ elementos respecto al total, y menor o igual que $(1-p)$ elementos respecto al total, el segundo $p-$cuantil es mayor o igual que $2p$ elementos respecto al total (y por ende mayor que el primer $p-$cuantil ), y menor o igual que $(1-2p)$ elementos respecto al total...
Cuando $p=0.25$ se conocen como cuartiles (de cuarto) y hay $3$ , mientras que el cuantil$-0.5$ es la mediana.
Cuando los elementos aparecen repetidos, o no todos los $x_i$ tienen la misma importancia, sino que cada uno tiene un peso de $\omega_i$ (y denotamos por $\omega_{(j)}$ es peso asociado a $x_{(j)}$ ) se tiene que la mediana es el elemento $x_k$ que satisface las siguientes desigualdades (aunque solo importan la primera y la última): $$ \sum_{j=1}^{k-1} \omega_{(j)} \leqslant \frac{1}{2} \qquad \sum_{j=1}^k \omega_{(j)} \geqslant \frac{1}{2} \qquad\qquad \sum_{j=k}^{n} \omega_{(j)} \geqslant \frac{1}{2} \qquad \sum_{j=k+1}^{n} \omega_{(j)} \leqslant \frac{1}{2} $$ Para una función de densidad de probabilidad $\operatorname{pdf}-X(x)$ de una variable aleatoria continua $X$ es el valor $m$ que satisface. $$ \int\limits_{(-\infty,m)}\!\! \operatorname{pdf}_X(x)\;\mathrm{d}x \geqslant \frac{1}{2} \qquad \int\limits_{(m,\infty)}\!\! \operatorname{pdf}_X(x)\;\mathrm{d}x \geqslant \frac{1}{2} $$ Volviendo al tema de media, moda y mediana, si denotamos como $\mu$ la media, $M$ la moda y $m$ la mediana con $\sigma$ la desviación típica tenemos la desigualdad: $ |\mu-m| \leqslant \sigma$ , y si la distribución es unimodal se tiene una desigualdad más estricta $\displaystyle |\mu-m| \leqslant \sqrt{\frac{3}{5}\;}\sigma$ , y además $|m-M| \leqslant \sqrt{3\;}\sigma$ . Además para distribuiones unimodales moderamente asimetricas se tiene la aproximación $\displaystyle \mu-M \approx 3(\mu-m) \iff m \approx \frac{2}{3}\mu + \frac{1}{3}M $ .
¿Existe una desigualdad tipo Jensen para la mediana? Sí, pero es ligeramente diferente. Tomemos $ f : A \to B $ con $A,B \subset \mathbb{R}$ y decimos que es función tipo $\mathcal{C}$ , $f\in\mathcal{C}(A,B)$ , si $\forall t\in B$ se tiene que $f^{[-1]}\big( \,(-\infty, t]\, \big) = \big\{ x \in \mathbb{R} \mid f(x) \leqslant t \big\}\subset A$ es un conjunto cerrado. Entonces se cumple $f\big(\operatorname{med}(X)\big) \leqslant \operatorname{med}\!\big(f(X)\big)$ . Un ejemplo de función tipo $\mathcal{C}$ son las convexas.
La mediana es muy útil, pero a veces muy costosa de calcular computacionalmente ya que hay que ordenar el conjunto para calcularla. Sin embargo, el matemático Tukey propuso en 1978 un estimador de la mediana que solo necesita hacer cuatro comprobaciones de tres elementos cada una: ninther ("novenero") . Sin embargo este estimador depende de cómo sea el conjunto $A$ , ya que dará otra estimación si permutan algunos elementos. Para un conjunto $A$ se subdivide en tres de igual longitud, en cada uno se hace la mediana del primer, el del medio y el último elemento, y el ninther es la mediana de estos tres, es decir: $$ a_1 = \operatorname{med}\!\big(A[1],A[n/6],A[n/3]\big) \quad a_2 = \operatorname{med}\!\big(A[n/3+1],A[n/2],A[2n/3]\big) \quad a_3 = \operatorname{med}\!\big(A[2n/3+1],A[5n/6],A[n]\big) \quad \operatorname{ninther}(A)=\operatorname{med}(a_1,a_2,a_3)$$ La mediana a veces también se utiliza en regresión: en mínimos cuadrados ordinarios (OLS por sus siglas en inglés) se minimiza la suma de los cuadrados de los residuales, mientras que en mínima mediana de cuadrados (LMS por sus siglas en inglés) se miniza la mediana de los cuadrados de los residuales. $$ \mathcal{Z}_{OLS} = \sum_{i=1}^n {e_i}^2 = \sum_{j=1}^n {e_{(j)}}^2 \qquad \mathcal{Z}_{LMS} = \overset{n}{\underset{i=1}{\operatorname{med}}}({e_i}^2) = \overset{n}{\underset{j=1}{\operatorname{med}}}({e_{(j)}}^2)$$ Sin embargo, como ya hemos comentado, a diferencia de OLS, está función no es una norma para $n\geqslant 3$.
Media, moda y mediana. Esto nos enseñaban en el tema de estadística de matemáticas antes de entrar al instituto. Media es sumarlos todos y dividir entre el número de sumandos. Moda es el [elemento] que más se repite. Mediana es el [elemento] de en medio. Sin embargo, ¿qué significa esto? Tanto media y moda como mediana están entre el mínimo y el máximo de los elementos. Asimismo el de en medio puede ser poco intuitivo, por ejemplo $\{1,3,5,5,5\}$ tiene mediana $5$ , no $3$ como uno podría pensar al ser el de en medio en $\{1,3,5\}$ . Esto es un error recurrente: no se pueden eliminar los elementos repetidos.
La mediana de una lista $\{x_i\}_{i=1}^n$ se define como el ecuador de dicha lista, es decir, como el elemento que parte la lista en dos sublistas ordenadas de igual longitud: una con todos sus elementos menores o iguales que la mediana, mientras que la otra tiene todos sus elementos mayores o igual que la mediana. Para una distribución simétrica con una única moda (unimodal), la mediana coincide con la moda. Para calcular la mediana de una lista $\{x_i\}_{i=1}^n$ realmente se calcula la mediana de una lista equivalente: se reordenan los elementos de menor a mayor, que se denota son el subíndice entre paréntesis, $\{x_{(j)}\}_{j=1}^n$ $$ \overset{n}{\underset{i=1}{\operatorname{med}}}(x_i) = \overset{n}{\underset{j=1}{\operatorname{med}}}(x_{(j)}) \overset{\mathrm{def}}{=} \begin{cases} x_{(\ell+1)} & n = 2\ell+1 \\[2ex] \displaystyle \frac{x_{(\ell)}+x_{(\ell+1)}}{2} & n = 2\ell \\ \end{cases} $$ Si hay un número impar de elementos, $2\ell +1$ , se toma el elemento $(\ell+1)-$ésimo tal que hay $\ell$ elementos menores o igual que ese, y otros $\ell$ elementos mayores o igual que ese.
Si hay un número par de elementos, $2\ell $ , se tiene que tomar el elemento tal que haya $\ell$ elementos menores o igual que ese, y los otros $\ell$ elementos mayores o igual que ese, por lo que se hace la semisuma de los elementos $\ell-$ésimo y $(\ell+1)-$ésimo.
Desde un punto de vista analítico se puede ver como el argumento que minimiza la función $\rho$ , es decir, $\operatorname{med}(x_i) = \operatorname{arg\, min}(\rho)$ , siendo dicha función: $$ \rho(x) = \sum_{i=1}^n | x-x_i | = \sum_{j=1}^n \big| x-x_{(j)} \big| $$ También se puede ver que la mediana $m$ de una variable aleatoria $X$ es el valor de $c$ (argumento) que minimiza la función $\operatorname{E}(|X-c|)$ .
La mediana es un L-estimador (un estimador que es una combinación lineal de estadísticos de orden $k$ siendo estos el $k-$ésimo valor más pequeño de la muestra), por lo que se tiene la siguiente relación de afinidad: $$ \operatorname{med}(a\, x_i + b) = a\, \operatorname{med}(x_i) + b$$ Sin embargo , la mediana de la suma dos listas (o dos vectores) no es la suma de las medianas. Un ejemplo sería $(1,0,0)$ , con mediana $0$ , $(0,2,0)$ , con mediana también $0$ , mientras que la suma $(1,2,0)$ , tiene mediana $1$ , no satisfacen la desigualdad triangular ya que $ 1 \not\leqslant 0 + 0 $. Mientras que $(4,-8,6)$ , con mediana $4$ , $(-9,4,5)$ , con mediana también $4$ , mientras que la suma $(-5,-4,11)$ , tiene mediana $-4$ : se tiene $-4 \leqslant 4 + 4$ , es decir: $$ \operatorname{med}(x_i+y_i) \lesseqgtr \operatorname{med}(x_i) + \operatorname{med}(y_i)$$ La mediana es un caso muy particular de los cuantiles. Para un $p\in [0,1]$ se llama $p-$cuantiles a los valores que parten la muestra en sublistas de igual longitud que representan $p$ frente a la longitud total de la lista. Así pues se tiene (en frecuencia relativa) que el primer $p-$cuantil es mayor o igual que $p$ elementos respecto al total, y menor o igual que $(1-p)$ elementos respecto al total, el segundo $p-$cuantil es mayor o igual que $2p$ elementos respecto al total (y por ende mayor que el primer $p-$cuantil ), y menor o igual que $(1-2p)$ elementos respecto al total...
Cuando $p=0.25$ se conocen como cuartiles (de cuarto) y hay $3$ , mientras que el cuantil$-0.5$ es la mediana.
Cuando los elementos aparecen repetidos, o no todos los $x_i$ tienen la misma importancia, sino que cada uno tiene un peso de $\omega_i$ (y denotamos por $\omega_{(j)}$ es peso asociado a $x_{(j)}$ ) se tiene que la mediana es el elemento $x_k$ que satisface las siguientes desigualdades (aunque solo importan la primera y la última): $$ \sum_{j=1}^{k-1} \omega_{(j)} \leqslant \frac{1}{2} \qquad \sum_{j=1}^k \omega_{(j)} \geqslant \frac{1}{2} \qquad\qquad \sum_{j=k}^{n} \omega_{(j)} \geqslant \frac{1}{2} \qquad \sum_{j=k+1}^{n} \omega_{(j)} \leqslant \frac{1}{2} $$ Para una función de densidad de probabilidad $\operatorname{pdf}-X(x)$ de una variable aleatoria continua $X$ es el valor $m$ que satisface. $$ \int\limits_{(-\infty,m)}\!\! \operatorname{pdf}_X(x)\;\mathrm{d}x \geqslant \frac{1}{2} \qquad \int\limits_{(m,\infty)}\!\! \operatorname{pdf}_X(x)\;\mathrm{d}x \geqslant \frac{1}{2} $$ Volviendo al tema de media, moda y mediana, si denotamos como $\mu$ la media, $M$ la moda y $m$ la mediana con $\sigma$ la desviación típica tenemos la desigualdad: $ |\mu-m| \leqslant \sigma$ , y si la distribución es unimodal se tiene una desigualdad más estricta $\displaystyle |\mu-m| \leqslant \sqrt{\frac{3}{5}\;}\sigma$ , y además $|m-M| \leqslant \sqrt{3\;}\sigma$ . Además para distribuiones unimodales moderamente asimetricas se tiene la aproximación $\displaystyle \mu-M \approx 3(\mu-m) \iff m \approx \frac{2}{3}\mu + \frac{1}{3}M $ .
¿Existe una desigualdad tipo Jensen para la mediana? Sí, pero es ligeramente diferente. Tomemos $ f : A \to B $ con $A,B \subset \mathbb{R}$ y decimos que es función tipo $\mathcal{C}$ , $f\in\mathcal{C}(A,B)$ , si $\forall t\in B$ se tiene que $f^{[-1]}\big( \,(-\infty, t]\, \big) = \big\{ x \in \mathbb{R} \mid f(x) \leqslant t \big\}\subset A$ es un conjunto cerrado. Entonces se cumple $f\big(\operatorname{med}(X)\big) \leqslant \operatorname{med}\!\big(f(X)\big)$ . Un ejemplo de función tipo $\mathcal{C}$ son las convexas.
La mediana es muy útil, pero a veces muy costosa de calcular computacionalmente ya que hay que ordenar el conjunto para calcularla. Sin embargo, el matemático Tukey propuso en 1978 un estimador de la mediana que solo necesita hacer cuatro comprobaciones de tres elementos cada una: ninther ("novenero") . Sin embargo este estimador depende de cómo sea el conjunto $A$ , ya que dará otra estimación si permutan algunos elementos. Para un conjunto $A$ se subdivide en tres de igual longitud, en cada uno se hace la mediana del primer, el del medio y el último elemento, y el ninther es la mediana de estos tres, es decir: $$ a_1 = \operatorname{med}\!\big(A[1],A[n/6],A[n/3]\big) \quad a_2 = \operatorname{med}\!\big(A[n/3+1],A[n/2],A[2n/3]\big) \quad a_3 = \operatorname{med}\!\big(A[2n/3+1],A[5n/6],A[n]\big) \quad \operatorname{ninther}(A)=\operatorname{med}(a_1,a_2,a_3)$$ La mediana a veces también se utiliza en regresión: en mínimos cuadrados ordinarios (OLS por sus siglas en inglés) se minimiza la suma de los cuadrados de los residuales, mientras que en mínima mediana de cuadrados (LMS por sus siglas en inglés) se miniza la mediana de los cuadrados de los residuales. $$ \mathcal{Z}_{OLS} = \sum_{i=1}^n {e_i}^2 = \sum_{j=1}^n {e_{(j)}}^2 \qquad \mathcal{Z}_{LMS} = \overset{n}{\underset{i=1}{\operatorname{med}}}({e_i}^2) = \overset{n}{\underset{j=1}{\operatorname{med}}}({e_{(j)}}^2)$$ Sin embargo, como ya hemos comentado, a diferencia de OLS, está función no es una norma para $n\geqslant 3$.
Puntos $(x,y,z)\in\mathbb{R}^3$ tales que satisfacen $\operatorname{med}(x^2,y^2,z^2)=\operatorname{med}(|x|,|y|,|z|)=1$ |
Autor: Đɑvɪẟ Ƒernández-De la Cruʒ.
No hay comentarios:
Publicar un comentario