Condizioni di Karush-Kuhn-Tucker
Siano \( f,g \in C^1(\mathbb{R}^n ) \) e \( \Sigma_g := \{ \mathbf{x} \in \mathbb{R}^n : g(\mathbf{x})\geq 0 \} \)
Supponiamo che \( \nabla g \neq 0 \) quando \( g= 0 \). Supponiamo che \( f \) ammette un minimo locale su \( \Sigma_g \) e notiamo \( x^* \in \Sigma_g \) il punto dove è raggiunto questo minimo locale. Per tutti gli \( (\mathbf{x},\lambda) \in \mathbb{R}^{n+1} \) definiamo \( \mathcal{L}(\mathbf{x},\lambda) = f(\mathbf{x})-\lambda g(\mathbf{x}) \) la funzione lagrangiana.
Dimostra che esiste \( \lambda^* \) tale che \( (\mathbf{x}^*,\lambda^*) \in \mathbb{R}^{n+1} \) che soddisfa le condizioni seguenti
\( \nabla_{\mathbf{x}}\mathcal{L}(\mathbf{x}^*, \lambda^*) = 0 \)
\( \lambda^* \geq 0 \)
\( \lambda^* g(\mathbf{x}^*) =0 \)
Io ho pensato a questo
Per la condizione necessaria di ottimalità abbiamo che se \( g(\mathbf{x}^*) = 0 \) allora abbiamo che \( \nabla g(\mathbf{x}^*) \neq 0 \) dunque esiste \( \lambda^* \in \mathbb{R} \) tale che \( \nabla f(\mathbf{x}^*) = \lambda^* \nabla g(\mathbf{x}^*) \), pertanto è evidente che
\[ \nabla_{\mathbf{x}}\mathcal{L}(\mathbf{x}^*, \lambda^*) = \nabla f(\mathbf{x}^*) - \lambda^* \nabla g(\mathbf{x}^*) =\lambda^* \nabla g(\mathbf{x}^*) - \lambda^* \nabla g(\mathbf{x}^*)= 0 \]
e \( \lambda^* g(\mathbf{x}^*)=0 \)
(non so come dimostrare che \( \lambda^* \geq 0 \) )
Se \( g(\mathbf{x}^*) > 0 \) allora \( \lambda^* = 0 \) soddisfa
\( \lambda^* = 0 \geq 0 \),
\( \lambda^* g(\mathbf{x}^*) = 0 \)
Ma non so come dimostrare che \( \nabla_{\mathbf{x}}\mathcal{L}(\mathbf{x}^*, \lambda^*) = 0 \) infatti
\( \nabla_{\mathbf{x}}\mathcal{L}(\mathbf{x}^*, \lambda^*) = \nabla f(\mathbf{x}^*) - \lambda^* \nabla g(\mathbf{x}^*) =\nabla f(\mathbf{x}^*) \)
Cioé dovrei dimostrare che \( \mathbf{x}^* \) è un minimo di \( f \) su \( \mathbb{R}^n \) e non solo un minimo sulla condizione \( g(\mathbf{x}) \geq 0 \) perché altrimenti non ho la certezza che \( \nabla f=0 \)
O sbaglio?
Supponiamo che \( \nabla g \neq 0 \) quando \( g= 0 \). Supponiamo che \( f \) ammette un minimo locale su \( \Sigma_g \) e notiamo \( x^* \in \Sigma_g \) il punto dove è raggiunto questo minimo locale. Per tutti gli \( (\mathbf{x},\lambda) \in \mathbb{R}^{n+1} \) definiamo \( \mathcal{L}(\mathbf{x},\lambda) = f(\mathbf{x})-\lambda g(\mathbf{x}) \) la funzione lagrangiana.
Dimostra che esiste \( \lambda^* \) tale che \( (\mathbf{x}^*,\lambda^*) \in \mathbb{R}^{n+1} \) che soddisfa le condizioni seguenti
\( \nabla_{\mathbf{x}}\mathcal{L}(\mathbf{x}^*, \lambda^*) = 0 \)
\( \lambda^* \geq 0 \)
\( \lambda^* g(\mathbf{x}^*) =0 \)
Io ho pensato a questo
Per la condizione necessaria di ottimalità abbiamo che se \( g(\mathbf{x}^*) = 0 \) allora abbiamo che \( \nabla g(\mathbf{x}^*) \neq 0 \) dunque esiste \( \lambda^* \in \mathbb{R} \) tale che \( \nabla f(\mathbf{x}^*) = \lambda^* \nabla g(\mathbf{x}^*) \), pertanto è evidente che
\[ \nabla_{\mathbf{x}}\mathcal{L}(\mathbf{x}^*, \lambda^*) = \nabla f(\mathbf{x}^*) - \lambda^* \nabla g(\mathbf{x}^*) =\lambda^* \nabla g(\mathbf{x}^*) - \lambda^* \nabla g(\mathbf{x}^*)= 0 \]
e \( \lambda^* g(\mathbf{x}^*)=0 \)
(non so come dimostrare che \( \lambda^* \geq 0 \) )
Se \( g(\mathbf{x}^*) > 0 \) allora \( \lambda^* = 0 \) soddisfa
\( \lambda^* = 0 \geq 0 \),
\( \lambda^* g(\mathbf{x}^*) = 0 \)
Ma non so come dimostrare che \( \nabla_{\mathbf{x}}\mathcal{L}(\mathbf{x}^*, \lambda^*) = 0 \) infatti
\( \nabla_{\mathbf{x}}\mathcal{L}(\mathbf{x}^*, \lambda^*) = \nabla f(\mathbf{x}^*) - \lambda^* \nabla g(\mathbf{x}^*) =\nabla f(\mathbf{x}^*) \)
Cioé dovrei dimostrare che \( \mathbf{x}^* \) è un minimo di \( f \) su \( \mathbb{R}^n \) e non solo un minimo sulla condizione \( g(\mathbf{x}) \geq 0 \) perché altrimenti non ho la certezza che \( \nabla f=0 \)
O sbaglio?
Risposte
Ma appunto... nel caso in cui \( \partial x_i g(x^*) <0 \) avremmo
\( \lim\limits_{t \to 0 } \frac{g(x^* + t e_i ) - g(x^*)}{t} <0 \) dunque \( \exists \delta >0 \) tale che \( \forall t \in ]0,\delta[ \) e pertanto
\( g(x^* + t e_i ) < g(x^*) =0 \) allora \( x^* + t e_i \not\in \Sigma_g \) quindi il segmento non sta nel mio insieme \( \Sigma_g \) quindi non posso trarre delle informazioni sul segno di \( f \)...
\( \lim\limits_{t \to 0 } \frac{g(x^* + t e_i ) - g(x^*)}{t} <0 \) dunque \( \exists \delta >0 \) tale che \( \forall t \in ]0,\delta[ \) e pertanto
\( g(x^* + t e_i ) < g(x^*) =0 \) allora \( x^* + t e_i \not\in \Sigma_g \) quindi il segmento non sta nel mio insieme \( \Sigma_g \) quindi non posso trarre delle informazioni sul segno di \( f \)...
Guarda, non lo so, e non avrò tempo di pensarci di sicuro. Sono certo che si tratta solo di un dettaglio, credo tu abbia comunque capito il senso della dimostrazione.
Ho completato il post precedente con una dimostrazione che secondo me è più chiara.
Ho completato il post precedente con una dimostrazione che secondo me è più chiara.
"dissonance":
Guarda, non lo so, e non avrò tempo di pensarci di sicuro. Sono certo che si tratta solo di un dettaglio, credo tu abbia comunque capito il senso della dimostrazione.
Ho completato il post precedente con una dimostrazione che secondo me è più chiara.
Figurati grazie infinite, tra l'altro per completare, ho pure capito il motivo per cui dice senza perdità di generalità, infatti
Nel caso supponi \( \partial_{x_i} g(x^{*} ) < 0 \) allora basta fare la sostituzione \( x_i \mapsto \tilde{x}_i:= -x_i \) e abbiamo che \( \partial_{\tilde{x}_i} g(x^{*} ) > 0 \). E tutto il ragionamento rimane invariato e \( \partial_{\tilde{x}_i} f(x^*) \geq 0 \), dunque \( \partial_{x_i} f(x^*) \leq 0 \)