lunes, 28 de octubre de 2024

(1061) - EXTRA! Pistola de macarrones

Introducción

Puede que os suene que recientemente ha habido un "incidente" del campus, ya que por teléfono escacharrado ha acabado siendo poco menos que un tiroteo con fuga en helicóptero; acabó siendo nada, pero si nos ponemos serios ¿cómo de probable es que ocurriera de verdad algo así?

(Os adelanto que en España es prácticamente imposible, de hecho voy a usar datos de EE.UU. para que aún con esas, salga una probabilidad baja)

La Regresión de Poisson

La regresión de Poisson es un modelo estadístico diseñado para analizar eventos de baja frecuencia (como tiroteos) que ocurren en un periodo de tiempo en una zona particular. Este modelo es especialmente útil cuando el evento es raro y discreto (hay un número entero de ocurrencias), como es el caso de nuestro ejemplo.

En el modelo de regresión de Poisson, asumimos que el número de incidentes, denotado como \( Y \), sigue una distribución de Poisson, lo cual implica que la probabilidad de observar un cierto número de incidentes en un periodo de tiempo específico depende de una tasa de ocurrencia \( \lambda \), que a su vez depende de varios factores poblacionales. El modelo tiene la siguiente forma:

\[ Y \sim \text{Poisson}(\lambda) \]

\[ \log(\lambda) = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_k X_k \]

donde:

  • \( \lambda \) es la tasa esperada de eventos (incidentes armados) en un periodo o región específico.
  • \( \beta_0 \) es el término constante o intercepto del modelo.
  • \( X_i \) representa las variables que pueden influir en los incidentea (por ejemplo, el tamaño de la población, accesibilidad de las armas ...) .
  • \( \beta_i \) son los coeficientes que determinan el impacto de cada variable en la tasa de incidentes.

Coeficientes

Como cada coeficiente \( \beta_i \) indica el cambio en el logaritmo de la tasa incidentes que ocurren  respecto a cómo varía  \( X_i \), podemos interpretar los efectos de \( \beta_i \) como sigue

  • Si \( e^{\beta_i} > 1 \), la variable \( X_i \) aumenta la tasa de incidentes.
  • Si \( e^{\beta_i} < 1 \), la variable \( X_i \) reduce la tasa de incidentes.

Nuestro caso:
En España desde 2021 han habido 17 incidentes armados en escuelas / institutos / universidades, aquí dejamos que cuenten casos mucho menos graves que un tiroteo (peleas fuertes, apuñalamientos...).  
Como en España el indice de tiroteos es ridículamente bajo, vamos a usar algunos datos de EE.UU. para inflar la probabilidad y que salga algo apreciable para "inicidentes escolares", de cualquier tipo.

Sabemos del modelo de EE.UU. que: 
\[\log(\text{Incidentes}) = \log(\text{población}) + \beta_0 + \beta_1 \cdot (\text{tasa posesión armas}) + \beta_2 \cdot (\text{tasa enfermedad mental grave}) + \beta_3 \cdot (\text{índice pobreza})\]

Y usando los cálculos que hacen en el paper original, \[ \lambda_{\text{EE.UU.}} = 0.468 \]
Ajustandolo a la poblacion de España
\[ \lambda_{\text{España}} = 0.1426 \times \lambda_{\text{EE.UU.}} = 0.1426 \times 0.468 = 0.0666936 \approx 0.0681 \]
Calzándolo en la fórmula de la distribución de Poisson:
\[ P(Y≥1)=1−P(Y=0)=1−e^{−λ}\]
Que para nuestro caso: \[6.58329\%\]

Aclaración, esto es en toda España,  que en una población tan grande se espere 1 caso con esa probabilidad no es nada escandaloso, en EE.UU, los tiroteos en los mismos periodos de tiempo fueron en torno a 300 frente a los 17 de España, lo cual haría esa probailidad aún más pequeña si cabe en España.

En conclusión, podeis venir tranquilos a la universidad, salvo si estudias magisterio (porque no ibas a ir a clase de todas formas). 
El paper original es este, seguramente si de verdad os interesa el modelo estará mil veces mejor que este resúmen.
Se aceptan correcciones sobre la estadística y relacionados => https://forms.gle/GsDnmX6UadZ9FFwL7


Por último, filtramos en exclusiva el verdadero culpable del incidente:

No hay que dar ideas a magisterio que luego pasan cosas.




Autor: Raúl Barrero