El teorema del valor medio de Lagrange (en su formulación con integrales) nos asegura que dado una función $f$ integrable en un intervalo $[a,b]$ , existe un punto intermedio $\eta$ al intervalo tal que $f(\eta)$ es la altura promedio de la función $f$ , es decir, que $f(x)$ y $f(\eta)$ tienen la misma integral en $[a,b]$ :
\begin{align*}
\int_a^b\!\!f(x) \text{d}x & = \int_a^b\!\!f(\eta) \text{d}x \\ & = f(\eta)(b-a)
\end{align*}
Si en vez de considerar todo el intervalo $[a,b]$, consideramos un subintervalo $[x_{k-1},x_k]$ , entonces pasamos a tener un punto intermedio $\eta_k$ , y el resultado sigue siendo válido:
\begin{align*} \int_{x_{k-1}}^{x_k}\!\!f(x) \text{d}x & = \int_{x_{k-1}}^{x_k}\!\!f(\eta_k) \text{d}x \\
& = f(\eta_k)(x_k-x_{k-1}) \\
& = f(\eta_k){\Delta x}_k
\end{align*}
Si ahora sumamos todos los resultados para cada uno de estos subintervalos $[x_{k-1},x_k]$ , y sabiendo que $\displaystyle \int_a^b\!\!f(x) \text{d}x = \sum_{k=1}^n \int_{x_{k-1}}^{x_k}\!\!f(x) \text{d}x $ , entonces tenemos:
\begin{align*}
\int_a^b\!\!f(x) \text{d}x & = \sum_{k=1}^n \int_{x_{k-1}}^{x_k}\!\!f(\eta_k) \text{d}x \\
& = \sum_{k=1}^n f(\eta_k)(x_k-x_{k-1}) \\
& = \sum_{k=1}^n f(\eta_k){\Delta x}_k \\
\end{align*}Así pues, si queremos hallar el valor de la integral $\displaystyle \int_a^b f $ , esto se reduce a hallar el correspondiente $\eta_k$ (o en su defecto $f(\eta_k)$ ) para cada uno de los $n$ subintervalos $[x_{k-1},x_k]$ . Sin embargo, esta tarea no es especialmente trivial, ya que muchas veces implica resolver dicha integral para luego hallar o bien $\eta_k$ o bien $f(\eta_k)$ . Empero podemos encontrar una familia $T$ de puntos intermedios asociados $t_k\in[x_{k-1},x_k]$ tal que cada uno de los $t_k$ esté suficientemente "cerca" de $\eta_k$ , y que sendos valores ( $f(t_k)$ y $f(\eta_k)$ respectivamente) no sean muy diferentes, a lo sumo una cantidad $\varepsilon_k$ :
$$ \forall \delta_k \gneq 0 \, , \, \exists t_k \in B(\eta_k, \delta_k) \,\big/\, 0\leqslant \big|f(\eta_k)-f(t_k)\big|\lneq \varepsilon_k \leqslant \max_{k=1}^n\big(\varepsilon_k\big) \overset{\text{def}}{=:} \varepsilon $$
Con todo esto podemos hallar una suma de áreas, que llamaremos suma asociada de Riemann $\sigma(f,\mathcal{P}_n,T)$ , tal que se aproxime suficientemente bien al valor de la integral $\displaystyle \int_a^b f $ , y que difieran como muchísimo $\displaystyle \max_{k=1}^n\big(\varepsilon_k\big)(b-a)$ :
$$ \begin{array}{ccccc}
0 & \leqslant & \big|f(\eta_k)-f(t_k)\big| & \lneq &\varepsilon \\
-\varepsilon &\lneq & f(\eta_k)-f(t_k) & \lneq & \varepsilon \\
-\varepsilon{\Delta x}_k &\lneq & f(\eta_k){\Delta x}_k-f(t_k){\Delta x}_k & \lneq & \varepsilon{\Delta x}_k\\
\displaystyle \sum_{k=1}^n-\varepsilon{\Delta x}_k &\lneq & \displaystyle \sum_{k=1}^n f(\eta_k){\Delta x}_k-\sum_{k=1}^n f(t_k){\Delta x}_k & \lneq & \displaystyle \sum_{k=1}^n \varepsilon{\Delta x}_k\\
-\varepsilon(b-a) &\lneq & \displaystyle \int_a^b\hspace{-3mm}f -\sigma(f,\mathcal{P}_n,T) & \lneq &\varepsilon(b-a) \\
0 &\leqslant & \displaystyle \Bigg| \int_a^b\hspace{-3mm}f -\sigma(f,\mathcal{P}_n,T) \Bigg| & \lneq &\varepsilon(b-a) \\
\end{array} $$ En este GIF animado podemos observar cómo variando el número $n$ de subintervalos $[x_{k-1},x_k]$ se aproxima mejor el valor de la integral.