viernes, 16 de diciembre de 2022

(811) - Catapultas, fundíbulos y trabuquetes. Ingeniería y PDE medievales

Supongamos que estás al servicio de un señor feudal entre los siglo XII y XIV, y en medio de una campaña llega la hora de asediar una ciudad amurallada. Para atacar la ciudadela lo mejor sería artillería, pero los cañones, si hay, son muy rudimentarios, y muy poco fiables. Aunque tu señor feudal tenga una clara superioridad numérica y logística, el sitio puede durar de semanas a meses, tiempo en el que el enemigo puede venir a levantar el asedio. La forma más efectiva de tomar la ciudad es de alguna manera hacer un boquete en la muralla enemiga y tomar la ciudad a la fuerza, pero, ¿cómo conseguirlo?

Ahí es donde entra en juego las catapultas, pero sobre todo los fundíbulos y los trabuquetes (hay unos vídeos muy interesantes en YouTube, sobre todo si se busca trechubet).

Los fundíbulos desplazan y rotan una piedra respecto de su eje de sujeción hasta soltarla por los aires para arrasar lo que encuentren por su paso. En esto presentan tres fases:
  1. La primera desde que se suelta el soporte activándose el fundíbulo.
  2. La segunda empieza cuando justo la cuerda unida a la piedra se tensa y comienza a deslizarse esta a lo largo del riel.
  3. La última comienza cuando la piedra, habiéndose desplazado por el riel, tiene suficiente momento, rota un ángulo de 120º-140º (dependiendo del "modelo"), instante en el que con suficiente impulso se manda una piedra rotando sobre so centro de masa, de varios cientos de quilogramos con una velocidad de varios quilómetros por hora.
Los fundíbulos presentan en cada una de las tres etapas un sistema no-lineal y no-homogéneo de ecuaciones diferenciales en derivadas parciales. Resolver analíticamente es prácticamente imposible, mientras que numéricamente puede ser un horror plantearlo y resolverlo computacionalmente. Horror, pero viable.
Aun así, es sorprente que en la Edad Media, sin calculadoras, derivadas, y sin algoritmos rápidos para la multiplicación, como la prostaféresis o los logaritmos (pincha en los enlaces para ver otros artículos al respecto), y solo con un ábaco, no solo tuviesen un conocimiento cualitativo bastante bueno, sino también uno cuantitativo.
Como curiosidad divulgativa, dejo un vídeo de cómo era la vide de un constructor y operador de fundíbulos: https://www.youtube.com/watch?v=HG8wt9alyag

Autor: Đɑvɪẟ Ƒernández-De la Cruʒ.

viernes, 2 de diciembre de 2022

(809) - ¿Qué es realmente la mediana?

Vamos a ver el concepto de mediana a distintos niveles de profundidad.
Media, moda y mediana. Esto nos enseñaban en el tema de estadística de matemáticas antes de entrar al instituto. Media es sumarlos todos y dividir entre el número de sumandos. Moda es el [elemento] que más se repite. Mediana es el [elemento] de en medio. Sin embargo, ¿qué significa esto? Tanto media y moda como mediana están entre el mínimo y el máximo de los elementos. Asimismo el de en medio puede ser poco intuitivo, por ejemplo $\{1,3,5,5,5\}$ tiene mediana $5$ , no $3$ como uno podría pensar al ser el de en medio en $\{1,3,5\}$ . Esto es un error recurrente: no se pueden eliminar los elementos repetidos.

La mediana de una lista $\{x_i\}_{i=1}^n$ se define como el ecuador de dicha lista, es decir, como el elemento que parte la lista en dos sublistas ordenadas de igual longitud: una con todos sus elementos menores o iguales que la mediana, mientras que la otra tiene todos sus elementos mayores o igual que la mediana. Para una distribución simétrica con una única moda (unimodal), la mediana coincide con la moda. Para calcular la mediana de una lista $\{x_i\}_{i=1}^n$ realmente se calcula la mediana de una lista equivalente: se reordenan los elementos de menor a mayor, que se denota son el subíndice entre paréntesis, $\{x_{(j)}\}_{j=1}^n$ $$ \overset{n}{\underset{i=1}{\operatorname{med}}}(x_i) = \overset{n}{\underset{j=1}{\operatorname{med}}}(x_{(j)}) \overset{\mathrm{def}}{=} \begin{cases} x_{(\ell+1)} & n = 2\ell+1 \\[2ex] \displaystyle \frac{x_{(\ell)}+x_{(\ell+1)}}{2} & n = 2\ell \\ \end{cases} $$ Si hay un número impar de elementos, $2\ell +1$ , se toma el elemento $(\ell+1)-$ésimo tal que hay $\ell$ elementos menores o igual que ese, y otros $\ell$ elementos mayores o igual que ese.
Si hay un número par de elementos, $2\ell $ , se tiene que tomar el elemento tal que haya $\ell$ elementos menores o igual que ese, y los otros $\ell$ elementos mayores o igual que ese, por lo que se hace la semisuma de los elementos $\ell-$ésimo y $(\ell+1)-$ésimo.

Desde un punto de vista analítico se puede ver como el argumento que minimiza la función $\rho$ , es decir, $\operatorname{med}(x_i) = \operatorname{arg\, min}(\rho)$ , siendo dicha función: $$ \rho(x) = \sum_{i=1}^n | x-x_i | = \sum_{j=1}^n \big| x-x_{(j)} \big| $$ También se puede ver que la mediana $m$ de una variable aleatoria $X$ es el valor de $c$ (argumento) que minimiza la función $\operatorname{E}(|X-c|)$ .

La mediana es un L-estimador (un estimador que es una combinación lineal de estadísticos de orden $k$ siendo estos el $k-$ésimo valor más pequeño de la muestra), por lo que se tiene la siguiente relación de afinidad: $$ \operatorname{med}(a\, x_i + b) = a\, \operatorname{med}(x_i) + b$$ Sin embargo , la mediana de la suma dos listas (o dos vectores) no es la suma de las medianas. Un ejemplo sería $(1,0,0)$ , con mediana $0$ , $(0,2,0)$ , con mediana también $0$ , mientras que la suma $(1,2,0)$ , tiene mediana $1$ , no satisfacen la desigualdad triangular ya que $ 1 \not\leqslant 0 + 0 $. Mientras que $(4,-8,6)$ , con mediana $4$ , $(-9,4,5)$ , con mediana también $4$ , mientras que la suma $(-5,-4,11)$ , tiene mediana $-4$ : se tiene $-4 \leqslant 4 + 4$ , es decir: $$ \operatorname{med}(x_i+y_i) \lesseqgtr \operatorname{med}(x_i) + \operatorname{med}(y_i)$$ La mediana es un caso muy particular de los cuantiles. Para un $p\in [0,1]$ se llama $p-$cuantiles a los valores que parten la muestra en sublistas de igual longitud que representan $p$ frente a la longitud total de la lista. Así pues se tiene (en frecuencia relativa) que el primer $p-$cuantil es mayor o igual que $p$ elementos respecto al total, y menor o igual que $(1-p)$ elementos respecto al total, el segundo $p-$cuantil es mayor o igual que $2p$ elementos respecto al total (y por ende mayor que el primer $p-$cuantil ), y menor o igual que $(1-2p)$ elementos respecto al total...
Cuando $p=0.25$ se conocen como cuartiles (de cuarto) y hay $3$ , mientras que el cuantil$-0.5$ es la mediana.

Cuando los elementos aparecen repetidos, o no todos los $x_i$ tienen la misma importancia, sino que cada uno tiene un peso de $\omega_i$ (y denotamos por $\omega_{(j)}$ es peso asociado a $x_{(j)}$ ) se tiene que la mediana es el elemento $x_k$ que satisface las siguientes desigualdades (aunque solo importan la primera y la última): $$ \sum_{j=1}^{k-1} \omega_{(j)} \leqslant \frac{1}{2} \qquad \sum_{j=1}^k \omega_{(j)} \geqslant \frac{1}{2} \qquad\qquad \sum_{j=k}^{n} \omega_{(j)} \geqslant \frac{1}{2} \qquad \sum_{j=k+1}^{n} \omega_{(j)} \leqslant \frac{1}{2} $$ Para una función de densidad de probabilidad $\operatorname{pdf}-X(x)$ de una variable aleatoria continua $X$ es el valor $m$ que satisface. $$ \int\limits_{(-\infty,m)}\!\! \operatorname{pdf}_X(x)\;\mathrm{d}x \geqslant \frac{1}{2} \qquad \int\limits_{(m,\infty)}\!\! \operatorname{pdf}_X(x)\;\mathrm{d}x \geqslant \frac{1}{2} $$ Volviendo al tema de media, moda y mediana, si denotamos como $\mu$ la media, $M$ la moda y $m$ la mediana con $\sigma$ la desviación típica tenemos la desigualdad: $ |\mu-m| \leqslant \sigma$ , y si la distribución es unimodal se tiene una desigualdad más estricta $\displaystyle |\mu-m| \leqslant \sqrt{\frac{3}{5}\;}\sigma$ , y además $|m-M| \leqslant \sqrt{3\;}\sigma$ . Además para distribuiones unimodales moderamente asimetricas se tiene la aproximación $\displaystyle \mu-M \approx 3(\mu-m) \iff m \approx \frac{2}{3}\mu + \frac{1}{3}M $ .

¿Existe una desigualdad tipo Jensen para la mediana? Sí, pero es ligeramente diferente. Tomemos $ f : A \to B $ con $A,B \subset \mathbb{R}$ y decimos que es función tipo $\mathcal{C}$ , $f\in\mathcal{C}(A,B)$ , si $\forall t\in B$ se tiene que $f^{[-1]}\big( \,(-\infty, t]\, \big) = \big\{ x \in \mathbb{R} \mid f(x) \leqslant t \big\}\subset A$ es un conjunto cerrado. Entonces se cumple $f\big(\operatorname{med}(X)\big) \leqslant \operatorname{med}\!\big(f(X)\big)$ . Un ejemplo de función tipo $\mathcal{C}$ son las convexas.

La mediana es muy útil, pero a veces muy costosa de calcular computacionalmente ya que hay que ordenar el conjunto para calcularla. Sin embargo, el matemático Tukey propuso en 1978 un estimador de la mediana que solo necesita hacer cuatro comprobaciones de tres elementos cada una: ninther ("novenero") . Sin embargo este estimador depende de cómo sea el conjunto $A$ , ya que dará otra estimación si permutan algunos elementos. Para un conjunto $A$ se subdivide en tres de igual longitud, en cada uno se hace la mediana del primer, el del medio y el último elemento, y el ninther es la mediana de estos tres, es decir: $$ a_1 = \operatorname{med}\!\big(A[1],A[n/6],A[n/3]\big) \quad a_2 = \operatorname{med}\!\big(A[n/3+1],A[n/2],A[2n/3]\big) \quad a_3 = \operatorname{med}\!\big(A[2n/3+1],A[5n/6],A[n]\big) \quad \operatorname{ninther}(A)=\operatorname{med}(a_1,a_2,a_3)$$ La mediana a veces también se utiliza en regresión: en mínimos cuadrados ordinarios (OLS por sus siglas en inglés) se minimiza la suma de los cuadrados de los residuales, mientras que en mínima mediana de cuadrados (LMS por sus siglas en inglés) se miniza la mediana de los cuadrados de los residuales. $$ \mathcal{Z}_{OLS} = \sum_{i=1}^n {e_i}^2 = \sum_{j=1}^n {e_{(j)}}^2 \qquad \mathcal{Z}_{LMS} = \overset{n}{\underset{i=1}{\operatorname{med}}}({e_i}^2) = \overset{n}{\underset{j=1}{\operatorname{med}}}({e_{(j)}}^2)$$ Sin embargo, como ya hemos comentado, a diferencia de OLS, está función no es una norma para $n\geqslant 3$.
Puntos $(x,y,z)\in\mathbb{R}^3$ tales que satisfacen $\operatorname{med}(x^2,y^2,z^2)=\operatorname{med}(|x|,|y|,|z|)=1$


 
Autor: Đɑvɪẟ Ƒernández-De la Cruʒ.