4 Existencia de Soluciones en Problemas de Control Óptimo
Hasta este punto hemos presentado la formulación de problemas de control óptimo y hemos desarrollado condiciones necesarias de optimalidad, tales como el Principio de Pontryagin y las Ecuaciones de Euler-Lagrange. Sin embargo, estas herramientas se aplican bajo el supuesto de que el problema considerado admite, al menos, una solución óptima.
Con el fin de asegurar que los problemas de control óptimo poseen soluciones, es necesario recurrir a teoremas de existencia. Entre estos resultados encontramos el teorema de Filippov, presentado en el libro clásico de Cesari (Cesari (1983)), que establece condiciones suficientes para garantizar la existencia de un control y una trayectoria óptimos en problemas de tipo Lagrange y Bolza.
4.1 Teorema de Existencia de Filippov
Para poder enunciar el teorema de existencia de Filippov, adoptamos en esta sección la notación utilizada por Cesari, la cual resulta especialmente conveniente por su generalidad.
Sea \(A\subset\mathbb{R}^{1+n}\) un conjunto al que denominamos conjunto de pares tiempo-estado. Denotamos por \(A_0\) a la proyección de \(A\) sobre el eje temporal, además para cada instante \(t\in A_0\), definimos el conjunto de estados \[ A(t):=\{x\in\mathbb{R}^n\mid(t,x)\in A\}. \]
Para cada par \((t,x)\in A\) consideramos un conjunto de controles \(U(t,x)\subset\mathbb{R}^m\). Con ello introducimos el conjunto \[ M\subset\mathbb{R}^{1+n+m}, \]
conformado por todos los tríos \((t,x,u)\) tales que \((t,x)\in A\) y \(u\in U(t,x)\).
Los datos del problema se construyen a partir de dos funciones definidas sobre \(M\); la función \(f(t,x,u)=(f_1,\dots,f_n)\), que describe la dinámica del sistema en el espacio de estados, y \(f_0(t,x,u)\), que representa el integrando del funcional de costo (o Lagrangiano).
En un problema tipo Bolza (Ecuación 3.3) intervienen dos componentes, el costo terminal, descrito por una función \(g\), definida sobre un conjunto \(B\subset\mathbb{R}^{2+2n}\), que reúne las condiciones de contorno admisibles en los extremos del intervalo de tiempo. La segunda componente es el costo integral que depende de la trayectoria y del control a través de la función \(f_0\).
Finalmente, para cada \((t,x)\in A\) introducimos los conjuntos de valores alcanzables. En primer lugar definimos el conjunto \[ Q(t,x) := \{ f(t,x,u) \mid u \in U(t,x) \} \subset \mathbb{R}^n, \]
el cual representa el rango de la dinámica \(f\) cuando el control \(u\) varía sobre el conjunto de controles \(U(t,x)\).
De manera análoga, definimos el conjunto \[ \tilde{Q}(t,x) := \{ (z_0,z)\in\mathbb{R}^{1+n}\mid z_0\geq f_0(t,x,u), z=f(t,x,u), u \in U(t,x) \}, \]
que reúne todos los pares \((z_0,z)\), con \(z_0\geq f_0(t,x,u)\) y \(z=f(t,x,u)\) para algún \(u\in U(t,x)\).
Estos conjuntos serán fundamentales para enunciar las condiciones de existencia del teorema de Filippov, ya que permiten analizar las propiedades de convexidad y compacidad necesarias para garantizar la existencia de soluciones óptimas.
Consideramos el problema de minimización del funcional \[ I[x,u]=g(t_1,x(t_1),t_2,x(t_2))+\int_{t_1}^{t_2}f_0(t,x(t),u(t))\,dt, \tag{4.1}\]
sujeto a \[ \begin{split} \dot{x}(t)=f(x(t),u(t))\qquad t\in[t_1,t_2], \\ (t,x(t))\in A,\quad u(t)\in U(t,x(t))\qquad t\in[t_1,t_2],\\ (t_1,x(t_1),t_2,x(t_2))\in B,\qquad\qquad\qquad\,\,\\ f_0(\cdot,x(\cdot),u(\cdot))\quad L-\text{integrable en }\,[t_1,t_2]. \end{split} \tag{4.2}\]
Teorema 4.1 Supongamos que \(A\subset\mathbb{R}^{1+n}\) es compacto, que \(M\subset\mathbb{R}^{1+n+m}\) es compacto, que \(B\subset\mathbb{R}^{2+2n}\) es cerrado, que la función \(g\) es semicontinua inferiormente en \(B\), que las funciones \(f_0\) y \(f\) son continuas en \(M\), y que para casi todo \(t\) los conjuntos \(\tilde{Q}(t,x)\) son convexos para todo \(x\in A(t)\). Entonces el funcional \(I\) (Ecuación 4.1) alcanza un mínimo absoluto en la clase no vacía \(\Omega\) de todas las parejas admisibles \((x,u)\) que satisfacen las condiciones del problema.
Las hipótesis de este teorema no consituyen meras restricciones formales, sino condiciones naturales que reflejan la estructura de los problemas de control óptimo. La compacidad del conjunto \(A\) garantiza que los instantes de tiempo y los estados permanezcan dentro de un dominio acotado, evitando así trayectorias que se escapen al infinito y asegura que el problema posea sentido práctico. De manera análoga, la compacidad del conjunto \(M\) garantiza que el espacio de posibles combinaciones de tiempo, estado y control está acotado y cerrado, lo que impide la aparición de controles o trayectorias no admisibles que escapan a valores extremos o indefinidos.
El conjunto \(B\), debe ser cerrado para evitar inconsistencias en los extremos del intervalo. Si \(B\) no fuera cerrado, sería posible aproximarse indefinidamente a condiciones de contorno factibles sin llegar a cumplirlas, lo que impediría la existencia de soluciones viables. La semicontinuidad inferior de \(g\) garantiza que el costo final no presente descensos abruptos en el límite.
La continuidad de las funciones \(f_0\) y \(f\) en \(M\) asegura que la dinámica y el integrando del costo respondan de manera estable a variaciones en los controles y en los estados.
Bajo este marco, el teorema de Filippov establece que el problema de Bolza siempre admite una solución óptima, consolidando así la base teórica de la teoría del control óptimo.
Prueba. Para cada par admisible \((x,u)\in\Omega\), \((t_1,x(t_1),t_2,x(t_2))\) se encuentra en el conjunto compacto \(B\cap(A\times A)\). La función \(g\) tiene un mínimo \(m\) en el compacto \(B\cap(A\times A)\). Dado que \(M\) es compacto y \(f_0\), \(f\) son continuas en \(M\), existe una constante \(N\) tal que \(|f_0(t,x,u)|,\,|f(t,x,u)|\leq N\) en \(M\), y podemos tomar a \(N\) tal que también tengamos \(|t|,\,|x|,\,|u|\leq N\) para \((t,x,u)\in M\). Así, el conjunto \(A_0\), está contenido en el intervalo \([-N,N]\). Denominemos \(D\) al diámetro de \(A_0\).
Note que, si \((t,x)\in A\) y \(z\in Q(t,x)=f(t,x,U(t,x))\subset\mathbb{R}^n\), entonces \((z_0,z)\in\tilde{Q}(t,x)\) implica que \(z_0\geq -N\), y \((N,z)\in\tilde{Q}(t,x)\).
De (Proposición 1.2), reemplazando \(x\) por \((t,x)\), obtenemos que los conjuntos \(\tilde{Q}(t,x)\) son cerrados en \(\mathbb{R}^{n+1}\) con proyección compacta \(Q(t,x)\), y que los mismos conjuntos \(\tilde{Q}(t,x)\) son semicontinuos superiormente por inclusión de conjuntos y por tanto, tienen la propiedad (K) en \(A\). Más aún, para casí toda \(\bar{t}\) y toda \(\bar{x}\in A(\bar{t})\), el conjunto \(\tilde{Q}(\bar{t},\bar{x})\) es convexo, y los mismos conjuntos \(\tilde{Q}(t,x)\) tienen la propiedad (Q) en \((\bar{t},\bar{x})\).
Consideremos el siguiente problema de minimización: Determinar un par \((x(t),\eta(t))\), \(t_1\leq t\leq t_2\), \(x\) Absolutamente Continua (AC), \(\eta\) L-integrable, para la cual el funcional \[ J[x,\eta]=g(t_1,x(t_1),t_2,x(t_2))+\int_{t_1}^{t_2}\eta(t)\,dt, \tag{4.3}\]
tiene su valor mínimo bajo las consideraciones \[ \begin{split} (t,x(t))\in A,\quad (\eta(t),\dot{x}(t))\in\tilde{Q}(t,x(t))&,\qquad t\in[t_1,t_2]\, (a.e.),\\ (t_1,x(t_1),t_2,x(t_2))&\in B. \end{split} \tag{4.4}\]
Sea \(\Omega^\prime\) la clase de todos los pares \(x(t),\eta(t)\), \(t_1\leq t\leq t_2\), para los cuales todas las condiciones anteriores se cumplen. Así, sabemos que para \((x,\eta)\in\Omega^\prime\) tenemos que \(\eta(t)\geq -N\) para toda \(t\), más aún \((x,\eta_0)\in\Omega^\prime\) para \(\eta_0(t)\equiv N\).
Finalmente, dado que \(\eta(t)\geq f_0(t,x(t),u(t))\), \(t_2-t_1\leq D\), \(g\geq m\) en \(B\cap(A\times A)\), y \(f_0\geq -N\) en \(M\), tenemos, de (Ecuación 4.2) y (Ecuación 4.3), \(J[x,\eta]\geq I[x,u]\geq m-DN\), y también \(J=I\) siempre que \(\eta(t)=f_0(t,x(t),u(t)),\,t\in[t_1,t_2]\) (a.e.). Si \(j=\inf_{\Omega^\prime}J[x,\eta]\), y \(i=\inf_{\Omega^\prime}I[x,u]\), entonces \(j=i\) y ambos son finitos.
Sea \(x_k(t),\,\eta_k(t),\,t_{1_k}\leq t\leq t_{2_k},\, k=1,2,\dots\), una sucesión minimizante para \(J\), esto es, \((x_k,\eta_k)\in\Omega^\prime\) y \(J[x_k,\eta_k]\rightarrow j\) cuando \(k\rightarrow\infty\). Así, \((t,x_k(t))\in A,\,(\eta_k(t),\dot{x}_k(t))\in\tilde{Q}(t,x_k(t)),\,\dot{x}_k(t)\in Q(t,x_k(t)),\,t\in[t_{1_k},t_{2_k}]\) (a.e.), \((t_{1_k},x_k(t_{1_k}),t_{2_k},x_k(t_{2_k}))\in B\) para todo \(k\), y \[ g(t_{1_k},x_k(t_{1_k}),t_{2_k},x_k(t_{2_k}))+\int_{t_{1_k}}^{t_{2_k}}\eta_k(t)\,dt\rightarrow j\quad\text{cuando }\,k\rightarrow\infty. \]
Dado que ambas partes en esta última expresión se encuentran acotadas inferiormente y \(j\) es finito, ambas partes están acotadas. Lo anterior permite tomar una subsucesión, que por la facilidad y simplicidad seguiremos denotando con \([k]\), tal que \(g(t_{1_k},x_k(t_{1_k}),t_{2_k},x_k(t_{2_k}))\rightarrow j^\prime,\,\int_{t_{1_k}}^{t_{2_k}}\eta_k(t)\,dt\rightarrow j^{\prime\prime}\), ambas \(j^\prime\) y \(j^{\prime\prime}\) finitas con \(j^\prime+j^{\prime\prime}=j\). Dado que \(Q(t,x_k(t))=f(t,x_k(t),U(t,x_k(t)))\), tenemos que \(|\dot{x}_k(t)|\leq N\) para toda \(t\) y \(k\); por lo tanto, las funciones \(x_k(t)\) son equi-Lipschitzianas (ver Definición 1.14), y por tanto equicontinuas (ver Definición 1.15). Dado que \((t,x_k(t))\in A\), tenemos que \(-N\leq t_{1_k}< t_{2_k}\leq N,\,|x_k(t)|\leq N\) para toda \(t\) y \(k\).
Por el teorema de Arzelà-Ascoli (ver Teorema 1.1), existe una subsucesión \([k_\ell]\) tal que \(t_{1_{k_\ell}}\rightarrow t_1,\,t_{2_{k_\ell}}\rightarrow t_2\) cuando \(\ell\rightarrow\infty\), y existe una función continua \(x(t),\,t_1\leq t\leq t_2\), tal que \(x_{k_\ell}(t)\rightarrow x(t)\) en la metrica \(\rho\). Dado que \(A\) y \(B\) son cerrados, \((t,x(t))\in A\) y \((t_1,x(t_1),t_2,x(t_2))\in B\). Como \(g\) es semicontinua inferiormente, tenemos también que \(g(t_1,x(t_1),t_2,x(t_2))\leq j^\prime\) Ya que las funciones \(x_k\) son equi-Lipschitzianas, \(x\) también es Lipschitziana (ver Definición 1.14) y por lo tanto es absolutamente continua. Por el teorema de la cerradura inferior (ver @), con \(\phi(t)=-N\), existe una función \(L\)-integrable \(\eta(t),\, t_1\leq t\leq t_2\), tal que \((\eta(t),\dot{x}(t))\in\tilde{Q}(t,x(t)),\,t\in[t_1,t_2]\) (a.e.), y \(\int_{t_1}^{t_2}\eta(t)\,dt\leq j^{\prime\prime}\). Por lo que \[ J[x,\eta]=g(t_1,x(t_1),t_2,x(t_2))+\int_{t_1}^{t_2}\eta(t)\,dt\leq j^\prime+j^{\prime\prime}=j. \]
Pero \((x,\eta)\in\Omega^\prime\), así que \(J[x,\eta]\geq j\), y esto demuestra que \(J[x,\eta]=j\).
Notemos que \(\tilde{Q}(t,x)\) es la imagen continua de \(U(t,x)\times[0,+\infty)\) bajo el mapeo \((u,v)\rightarrow[f(t,x,u),\,f_0(t,x,u)+v]\), y \((\eta(t),\dot{x}(t))\in\tilde{Q}(t,x(t))\). También sabemos que los conjuntos \(\tilde{Q}(t,x)\) tiene la propiedad (K), y más aún, para casí toda \(\bar{t}\in[t_1,t_2]\), los conjuntos \(\tilde{Q}(t,x)\) tienen la propiedad (Q) con respecto a \((t,x)\) en \((\bar{t},x(\bar{t}))\). Por el teorema de la función implicita (ver Teorema 1.2), deducimos que existen funciones medibles \(u(t),\,v(t),\, t_1\leq t\leq t_2,\,u(t)\in U(t,x(t)),\,v(t)\geq 0\), tales que \(\dot{x}(t)=f(t,x(t),u(t)),\,\eta(t)=f_0(t,x(t),u(t))+v(t)\). Debido a que \(j\) es mínimo, debemos tener que \(v(t)=0\) a.e. en \([t_1,t_2]\). Así \[ \begin{split} J[x,\eta]&=I[x,u]\\ &=g(t_1,x(t_1),t_2,x(t_2))+\int_{t_1}^{t_2}f_0(t,x(t),u(t))\,dt=j=i. \end{split} \]