1  Preliminares

El propósito de este capítulo es reunir conceptos, resultados y convenciones que serán utilizados a lo largo del trabajo. Se busca establecer las bases necesarias para el desarrollo de los temas posteriores, facilitando la comprensión y evitando repeticiones innecesarias.

1.1 Notación

En esta sección fijamos la notación que utilizaremos durante todo el trabajo. Adoptamos las convenciones usuales en análisis real, cálculo variacional y teoría de control óptimo, tomando como referencia principalmente a Rudin (1976), Cesari (1983), Rockafellar (197d. C.).

Denotamos por \(\mathbb{R}^n\) el espacio euclidiano \(n\)-dimensional, provisto del producto interno usual \[ \langle x,y\rangle=\sum_{i=1}^n x_iy_i, \]

y de la norma inducida \(||x||=\sqrt{\langle x,x\rangle}\). Cuando el contexto lo permita, escribiremos simplemente \(\langle\cdot,\cdot\rangle\) y \(\|\cdot\|\) para denotar este producto interno y la norma asociada. Además, utilizaremos \(\mathbb{N}\) para el conjunto de los números naturales, \(\mathbb{Z}\) para los enteros, y \(\mathbb{Q}\) para los racionales. El conjunto de los números reales se denota por \(\mathbb{R}\), y el de los complejos por \(\mathbb{C}\).

La transpuesta de un vector o matriz \(A\) se denotará por \(A^\top\). El producto matricial de dos matrices \(A\) y \(B\) se denota por \(AB\), y se siguen las reglas usuales. Para el producto escalar entre dos vectores \(x, y \in \mathbb{R}^n\) escribiremos \(x^\top y=\langle x, y \rangle\).

Si \(x=(x_1,\dots,x_n)\), el símbolo \(x_i\) designa su \(i\)-ésima componente.

En el caso de funciones vectoriales \(y:\mathbb{R}^n\rightarrow\mathbb{R}^m\), denotamos por \(Dy(x)\) a su matriz jacobiana sobre \(x\), y por \(D_i y\) la derivada parcial respecto a la \(i\)-ésima variable.

Para un campo \(F = (F_1, \dots, F_n): \mathbb{R}^n \to \mathbb{R}^n\) y \(x = (x_1, \dots, x_n)\), definimos su divergencia como \[ \operatorname{div} F = \sum_{i=1}^n \frac{\partial F_i}{\partial x_i}. \]

Este operador mide la tasa neta o el flujo del campo en un punto dado.

Cuando una propiedad se cumpla casi en todas partes sobre un conjunto medible, lo indicaremos mediante la abreviatura c.t.p.

Estas convenciones se mantendrán uniformes en todo el trabajo, y cualquier notación adicional se introducirá en las secciones donde sea necesaria.

1.2 Conjuntos y Espacios

En esta sección introducimos las definiciones y propiedades básicas de conjuntos y espacios, que serán esenciales para el desarrollo posterior. Nos enfocaremos en las operaciones fundamentales entre conjuntos, así como en la estructura de los espacios donde se desarrollan los problemas de interés. Las definiciones y propiedades presentadas siguen la exposición clásica de Munkres (2000) Rudin (1976), Rockafellar (197d. C.), proporcionando el marco necesario para el análisis matemático riguroso.

Definición 1.1 (Conjunto) Un conjunto se considera una colección de objetos en la que cada uno se denomina como punto (o elemento).

Si \(x\) es un elemento que pertenece a un conjunto \(A\), lo expresamos con la notación \(x\in A\), análogamente, si \(x\) no es un elemento que pertenece al conjunto \(A\), escribimos \(x\notin A\). El conjunto vacío \(\emptyset\) es el conjunto que no tiene elementos.

Definición 1.2 (Subconjunto) Decimos que \(A\) es un subconjunto de \(B\), si cada elemento de \(A\) también es un elemento de \(B\), y expresamos esto escribiendo \(A\subset B\).

En general, todos los conjuntos se consideran subconjuntos de un conjunto universal (o espacio o universo), que contiene a todos los elementos bajo consideración en un contexto dado. Este conjunto universal se denota comúnmente por \(U\). En muchos casos, se toma \(U=\mathbb{R}^n\) para algún \(n\in\mathbb{N}\), dependiendo del problema o área de estudio. Esta noción permite definir las operaciones entre conjuntos.

Definición 1.3 (Conjunto Abierto) Un conjunto \(A\) se dice abierto si para todo \(x \in A\) existe \(\varepsilon > 0\) tal que la bola abierta centrada en \(x\) y de radio \(\varepsilon\), definida por \[ B_\varepsilon(x) = \{ y \in \mathbb{R}^n : \|y - x\| < \varepsilon \}, \] está contenida en \(A\), es decir, \(B_\varepsilon(x) \subset A\).

Definición 1.4 (Conjunto Cerrado) Un conjunto \(C\) se dice cerrado si su complemento \(U \setminus C\) es un conjunto abierto, es decir, si todo punto que no pertenece a \(C\) admite una vecindad completamente contenida fuera de \(C\). Equivalentemente, \(C\) es cerrado si contiene todos sus puntos de acumulación.

Definición 1.5 (Clausura de un Conjunto) La clausura (o cerradura) de un conjunto \(A\), denotada por \(\overline{A}\), es el conjunto formado por todos los puntos de \(A\) junto con todos sus puntos de acumulación. Es el conjunto cerrado más pequeño que contiene a \(A\), es decir, \[ \overline{A} = \bigcap \{ C \subset U : C \text{ es cerrado y } A \subset C \}. \]

Definición 1.6 (Compacidad) Un conjunto \(K\) es compacto si para toda familia de conjuntos abiertos \(\{U_\alpha\}_{\alpha \in A}\) tal que \(K \subset \bigcup_{\alpha \in A} U_\alpha\), existe una subfamilia finita \(\{U_{\alpha_1}, \dots, U_{\alpha_m}\}\) con \(K \subset \bigcup_{j=1}^m U_{\alpha_j}\). Es decir, toda cubierta abierta de \(K\) admite una subcubierta finita.

Por el teorema de Heine-Borel, en \(\mathbb{R}^n\), un conjunto es compacto si y solo si es cerrado y acotado (Rudin (1976)).

Definición 1.7 (Conjunto Convexo) Un conjunto \(C\) se dice convexo si para cualesquiera dos puntos \(x, y \in C\) y para todo \(\lambda \in [0,1]\), el punto \[ \lambda x + (1-\lambda) y\in C. \]

Definición 1.8 (Proyección) Sea \(A\subset X\times Y\), donde \(X\) y \(Y\) son espacios euclidianos. La proyección de \(A\) sobre \(X\) se define como \[ \pi_X(A)=\{x\in X:\exists y\in Y\text{ tal que } (x,y)\in A\}. \]

De manera análoga, la proyección de \(A\) sobre \(Y\) es \[ \pi_Y(A)=\{y\in Y:\exists x\in X\text{ tal que } (x,y)\in A\}. \]

Proposición 1.1 (Proyección de un conjunto compacto) Si \(K \subset X \times Y\) es un conjunto compacto, entonces su proyección sobre \(X\) (respectivamente sobre \(Y\)), \(\pi_X(K)\), también es un conjunto compacto.

Prueba. Sea \(\{U_\alpha\}_{\alpha \in A}\) una familia de abiertos en \(X\) tal que \(\pi_X(K) \subset \bigcup_{\alpha \in A} U_\alpha\). Entonces, \(\{U_\alpha \times Y\}_{\alpha \in A}\) es una familia de abiertos en \(X \times Y\) que cubre \(K\), ya que si \((x, y) \in K\), entonces \(x \in \pi_X(K)\) y existe \(\alpha\) tal que \(x \in U_\alpha\), por lo que \((x, y) \in U_\alpha \times Y\). Como \(K\) es compacto, existe una subfamilia finita \(\{U_{\alpha_1} \times Y, \dots, U_{\alpha_n} \times Y\}\) que cubre \(K\). Por lo tanto, \(\{U_{\alpha_1}, \dots, U_{\alpha_n}\}\) cubre \(\pi_X(K)\), mostrando que \(\pi_X(K)\) es compacto.

Para elementos \(x(t),\,y(t),\,t_1\leq t\leq t_2\), definidos sobre el mismo intervalo, la función de distancia usual \[ d(x, y) = \sup_{t_1 \leq t \leq t_2} \|x(t) - y(t)\|, \]

es una manera natural de medir su separación. (Cesari (1983))

Definición 1.9 (Metrica rho (\(\rho\))) Si \(x(t),\,a\leq t\leq b\), y \(y(t),\,c\leq t\leq d\), están definidos sobre intervalos que pueden ser distintos, entonces definimos \[ \rho(x,y)=|a-c|+|b-d|+\sup_{t\in[a,b]\cap[c,d]}|x(t)-y(t)| \]

1.3 Elementos de análisis funcional

En esta sección introducimos las nociones fundamentales de funciones reales y vectoriales que serán empleadas en el desarrollo posterior. Presentamos definiciones, propiedades y ejemplos básicos que servirán como herramientas esenciales para el análisis y la formulación de resultados en los capítulos siguientes. El enfoque estará en los aspectos más relevantes para el cálculo variacional y la teoría de control óptimo, siguiendo la notación y convenciones establecidas previamente, tomando como referencia a Rudin (1976) y Spivak (2008).

Definición 1.10 (Función continua) Una función \(f\) es continua en \(a\) si \[ \lim_{x\rightarrow a}f(x)=f(a). \]

Diremos que una función es continua en un conjunto \(X\) si es continua en todo punto de este.

Definición 1.11 (Función acotada) Una función \(f\) es acotada si existe una constante \(M > 0\) tal que \(||f(x)|| \leq M\) para todo \(x\) en el dominio de \(f\).

Definición 1.12 (Función absolutamente continua) Una función \(f:[a,b]\to\mathbb{R}^n\) es absolutamente continua si para todo \(\varepsilon>0\) existe \(\delta>0\) tal que para cualquier colección finita de intervalos disjuntos \([(x_k, y_k)]\) en \([a,b]\) con \(\sum_k |y_k - x_k| < \delta\), se cumple \[ \sum_k \|f(y_k) - f(x_k)\| < \varepsilon. \]

Toda función absolutamente continua es continua y, además, derivable casi en todas partes, con \[ f(x) = f(a) + \int_a^x f'(t)\,dt \] para todo \(x\in[a,b]\).

Definición 1.13 (Función L-integrable) Una función \(f\) se dice ser \(L^p\)-integrable en un conjunto medible \(X \subset \mathbb{R}^n\) si \[ \int_X \|f(x)\|^p\,dx < \infty \] para algún \(1 \leq p < \infty\). El conjunto de todas las funciones \(L^p\)-integrables en \(X\) se denota por \(L^p(X)\).

Definición 1.14 (Funciones Equi-Lipschitzianas) Decimos que una función \(f\) es Lipschitziana en un conjunto \(E\) si existe una constante \(L > 0\) tal que \[ \|f(x) - f(y)\| \leq L \|x - y\|,\qquad\forall x,y\in E \]

Por otra parte, una familia de funciones \(\mathcal{F}\) definidas en \(E\) es equi-Lipschitziana si existe una constante \(L > 0\) tal que toda \(f\in\mathcal{F}\) es Lipschitziana.

Definición 1.15 (Funciones equicontinuas) Una familia de funciones \(\mathcal{F}\) definidas en un conjunto \(E\) es equicontinua si para todo \(\varepsilon > 0\) existe \(\delta > 0\) tal que para todo \(x, y \in E\) con \(\|x - y\| < \delta\) y para toda \(f \in \mathcal{F}\) se cumple \[ \|f(x) - f(y)\| < \varepsilon. \]

Definición 1.16 (Convergencia puntual) Una sucesión de funciones \(\{f_n\}\) converge puntualmente a una función \(f\) si \[ \lim_{n\rightarrow\infty} f_n(x)=f(x), \] para todo \(x\) en el dominio

Definición 1.17 (Convergencia uniforme) Una sucesión de funciones \(\{f_n\}\) converge uniformemente a una función \(f\) si \[ \forall\varepsilon>0,\,\exists\,N\text{ tal que } |f_k(x)-f(x)|<\varepsilon, \] para todo \(x\) en el dominio y \(k\geq N\).

Definición 1.18 (Mínimo y máximo de una función) Sea \(f\) una función definida sobre un conjunto \(A\). Decimos que \(f\) alcanza su mínimo en \(x_0 \in A\) si \[ f(x_0) \leq f(x), \quad \forall x \in A. \]

El valor \(f(x_0)\) se llama el mínimo absoluto de \(f\) en \(A\).

Análogamente, \(f\) alcanza su máximo en \(x_1 \in A\) si \[ f(x_1) \geq f(x), \quad \forall x \in A, \]

y el valor \(f(x_1)\) se llama el máximo absoluto de \(f\) en \(A\).

Definición 1.19 (Arg min y Arg max) Sea \(f\) una función definida sobre un conjunto \(A\). El conjunto de puntos donde \(f\) alcanza su mínimo se denota por \[ \operatorname{argmin}_{x\in A} f(x) = \{x^* \in A : f(x^*) \leq f(x),\ \forall x \in A\}. \]

Análogamente, el conjunto de puntos donde \(f\) alcanza su máximo se denota por \[ \operatorname{argmax}_{x\in A} f(x) = \{x^* \in A : f(x^*) \geq f(x),\ \forall x \in A\}. \]

1.4 Resultados importantes

Definición 1.20 (Propiedad (K) y Propiedad (Q)) Sea \(x\mapsto Q(x)\), con \(x\in X,\, Q(x)\subset Y\), una aplicación multivaluada de un espacio métrico \(X\) hacia un espacio topológico \(Y\).

Decimos que se tiene la propiedad (K) en \(x_0\in X\) si \[ Q(x_0)=\bigcap_{\delta>0}\overline{\bigcup_{x\in N_\delta(x_0)}Q(x)}. \tag{1.1}\]

Por otro lado, se tiene la propiedad (Q) en \(x_0\) si \[ Q(x_0)=\bigcap_{\delta>0}\overline{\operatorname{co}\bigcup_{x\in N_\delta(x_0)}Q(x)}. \]

Teorema 1.1 (Arzelá-Ascoli) Sean \(K\) un espacio métrico compacto. Si una sucesión \(\{f_n\}\subseteq C(K)\) es puntualmente acotada y equicontinua, entonces tiene una subsucesión que converge uniformemente.

Prueba. Vease (67.2. p.336 de McShane (2015))

Teorema 1.2 (Función implicita) Sea \(A\) un subconjunto cerrado de \(\mathbb{R}^v+n\). Para cada \((t,x)\in A\) sea \(U(t,x)\) un subconjunto de \(\mathbb{R}^m\). Supongamos que el conjunto \[ M=\{(t,x,u)\mid (t,x)\in A, u\in U(t,x)\}\subset\mathbb{R}^{v+n+m}, \]

es cerrado. Sean \(f=(f_1,\dots,f_r)\) y \(f_0(t,x,u)\) funciones continuas en \(M\). Y para cada \((t,x)\in A\) sea \[ \tilde{Q}(t,x)=\{(z_0,z)\mid z_0\geq f_0(t,x,u), z=f(t,x,u), u\in U(x)\}\subset\mathbb{R}^{r+1}. \]

Sea \(G\) un subconjunto medible de \(\mathbb{R}^v\), y sean \(\eta(t),\xi(t)=(\xi_1,\dots,\xi_r), x(t)=(x_1,\dots,x_n),\,t\in G\), funciones medibles tales que \((t,x(t))\in A,\,(\eta(t),\xi(t))\in\tilde{Q}(t,x(t)), t\in G\) (c.t.p). Entonces exite una función medible \(u(t)=(u_1,\dots,u_m),\,t\in G\), tal que \(u(t)\in U(t,x(t)),\eta(t)\geq f_0(t,x(t),u(t)),\,\xi(t)=f(t,x(t),u(t)),\,t\in G\) (c.t.p).

Prueba. Vease (8.2.iii. p.278 de Cesari (1983))

Proposición 1.2 Sean \(A\subset\mathbb{R}^v\) y, para cada \(x\in A\), sea \(U(x)\subset\mathbb{R}^m\). Definamos \[ M=\{(x,u)\mid x\in A, u\in U(x)\}\subset\mathbb{R}^{v+m}. \]

Sea \(f=(f_1,\dots,f_n):M\rightarrow\mathbb{R}^n\) y sea \(f_0:M\rightarrow \mathbb{R}\) funciones continuas en \(M\). Para cada \(x\in A\) sean \[ Q(x)=f(x,U(x))=\{z\mid z=f(x,u),\,u\in U(x)\}\subset\mathbb{R}^n, \] y \[ \tilde{Q}(x)=\{(z_0,z)\mid z_0\geq f_0(x,u), z=f(x,u), u\in U(x)\}. \]

También, sean \[ M_0=\{(x,z)\mid x\in A, z\in Q(x)\}\subset\mathbb{R}^{v+n}, \] y \[ \tilde{M}_0=\{(x,z_0,z)\mid x\in A,(z_0,z)\in\tilde{Q}(x)\}\subset\mathbb{R}^{v+1+n}. \]

Si \(M\) es compacto y \(f_0,f\) son continuas en \(M\), entonces todos los conjuntos \(\tilde{Q}(x)\) son cerrados y cuya proyección \(Q(x)\) sobre \(\mathbb{R}^n\) es compacta. Además son semicontinuos superiormente respecto al conjunto inclusión, por lo que tienen la propiedad (K) en \(A\), si además son convexos, entonces también la propiedad (Q) en \(A\). Además se tiene que \(\tilde{M}_0\) es cerrado y su proyección \(M_0\) sobre \(\mathbb{R}^{v+n}\) es compacta.

Prueba. La compacidad de \(M\) implica la compacidad de \(A\) y de cada conjunto \(U(x)\) (Proposición 1.1). Sea \(x\in A\) arbitrario, como \(U(x)\) es compacto y \(f\) es continua, entonces su imagen \(f(x,U(x))=Q(x)\) es compacta.

Veamos que \(\tilde{Q}(x)\) es cerrado. Sea \(((z_0^k,z^k))_{k\in\mathbb{N}}\subset\tilde{Q}(x)\) una sucesión convergente a \((z_0,z)\in\mathbb{R}^{1+n}\). Por definición, para cada \(k\) existe \(u_k\in U(x)\) tal que \[ z^k=f(x,u_k),\qquad z_0^k\geq f_0(x,u_k). \]

Como \(U(x)\) es compacto, la sucesión \((u_k)\) tiene una subsucesión convergente \(u_{k_j}\rightarrow u^*\in U(x)\). Dado que \(f\) y \(f_0\) son continuas en \(M\), se cumple \[ f(x,u_{k_j})\rightarrow f(x,u^*)\quad\text{y}\quad f_0(x,u_{k_j})\rightarrow f_0(x,u^*). \]

Ya que \(z^{k_j}\rightarrow z\), se sigue que \(z=f(x,u^*)\), y tomando límites en \(z_0^{k_j}\geq f_0(x,u^{k_j})\) se obtiene \(z_0\geq f_0(x,u^*)\). Por lo tanto, \((z_0,z)\in\tilde{Q}(x)\), y así, \(\tilde{Q}(x)\) es cerrado.

Probemos ahora que los conjuntos \(\tilde{Q}(x)\) son semicontinuos superiormente respecto al conjunto inclusión.

Sea \(x_0\in A\) y consideremos una sucesión \((x_k)_{k\in\mathbb{N}}\subset A\) con \(x_k\rightarrow x_0\). Para cada \(k\) tomamos un punto \((z_0^k,z^k)\in\tilde{Q}(x_k)\), por definición existen \(u_k\in U(x_k)\) tales que \[ z^k=f(x_k,u_k),\qquad z_0^k\geq f_0(x_k,u_k). \] La sucesión \((x_k,u_k)\) se encuentra en \(M\), que es compacto; por lo tanto existe una subsucesión \((x_{k_j},u_{k_j})\) y un punto \((x^*,u^*)\in M\) tales que \((x_{k_j},u_{k_j})\rightarrow (x^*,u^*)\). Como la proyección de \(M\) sobre la coordenada \(x\) es \(A\) y \(x_{k_j}\rightarrow x_0\), necesariamente \(x^*=x_0\) y, por tanto, \(u^*\in U(x_0)\).

Si la sucesión \(((z_0^k,z^k))\) no tiene ninguna subsucesión convergente, la condición de semicontinuidad superior se satisface por vacuidad (no hay límite que comprobar). En caso contrario, consideramos una subsucesión convergente, de modo que \[ (z_0^{k_j},z^{k_j})\rightarrow (z_0,z). \]

Como \(f\) y \(f_0\) son continuas, obtenemos \[ f(x_{k_j},u_{k_j})\rightarrow f(x_0,u^*),\qquad f_0(x_{k_j},u_{k_j})\rightarrow f_0(x_0,u^*). \] Dado que \(z^{k_j}=f(x_{k_j},u_{k_j})\) y \(z^{k_j}\rightarrow z\), entonces \(z=f(x_0,u^*)\). Además, de \(z_0^{k_j}\geq f_0(x_{k_j},u_{k_j})\), se sigue que \(z_0\geq f_0(x_0,u^*)\). Por tanto \((z_0,z)\in\tilde{Q}(x_0)\).

Esto muestra la caracterización por sucesiones de la semicontinuidad superior: si \(x_k\to x_0\) y \((z_0^k,z^k)\in\tilde{Q}(x_k)\) converge a \((z_0,z)\), entonces \((z_0,z)\in\tilde{Q}(x_0)\). Luego \(\tilde{Q}\) es semicontinuo superiormene respecto a la inclusión.

En consecuencia, la correspondencia \(x\mapsto\tilde{Q}(x)\) es semicontinua superiormente y toma valores cerrados y acotados en \(\mathbb{R}^{1+n}\); por lo que tiene valores compactos. De acuerdo con la definición (Definición 1.20), la semicontinuidad superior de \(\tilde{Q}\) junto con la compacidad de sus valores implica la propiedad (K) en \(A\); y si además los conjuntos \(\tilde{Q}\) son convexos, también la propiedad (Q). Además notemos que \(\tilde{M}_0\) es un grafo de \(\tilde{Q}\) y tomando en cuenta la definición equivalente de la semicontinuidad que dice que una aplicación multivaluada \(Q\) con valores cerrados es semicontinua superiormente si y solo si su grafo es cerrado, concluimos que \(\tilde{M}\) es cerrado. Finalmente, notemos que \(M_0\) es la imagen de \(M\) bajo la función continua \((x,u)\mapsto(x,f(x,u))\), y ya que \(M\) es compacto concluimos que \(M_0\) es compacto.