[Automazione] REGOLAZIONE LINEARE QUADRATICA
Ciao a tutti, sto studiando per l'esame di automazione e sono arrivata all'argomento della regolazione lineare quadratica(LQR) e non riesco a capire un concetto e vorrei il vostro aiuto.
La formulazione matematica del problema utilizza come indice di performance la funzione di costo quadratica seguente:
$\idehat{J}(X, U)= 1/2\sum_(K=0)^(N-1)(x_k^(\top) Q x_k + u_k^(\top)R u_k) + 1/2 x_N^(\top) Q x_N$
So il significato dei tre termini, ovvero che uno penalizza la deviazione dello stato desiderato, uno penalizza lo sforzo di controllo e l'altro penalizza la deviazione dello stato finale dallo stato desiderato, ma non ho capito da dove sono usciti questi termini e come è stata definita la funzione di costo
La formulazione matematica del problema utilizza come indice di performance la funzione di costo quadratica seguente:
$\idehat{J}(X, U)= 1/2\sum_(K=0)^(N-1)(x_k^(\top) Q x_k + u_k^(\top)R u_k) + 1/2 x_N^(\top) Q x_N$
So il significato dei tre termini, ovvero che uno penalizza la deviazione dello stato desiderato, uno penalizza lo sforzo di controllo e l'altro penalizza la deviazione dello stato finale dallo stato desiderato, ma non ho capito da dove sono usciti questi termini e come è stata definita la funzione di costo
Risposte
Ho qualche difficoltà ad interpretare il tuo dubbio, ma magari è più intuitivo vedere il tutto in tempo continuo e nel caso monodimensionale.
In tal caso si può scrivere più semplicemente (in generale lo stato finale ha un peso diverso)
$J = 1/2 int_0^T (q*x^2(t)+ r*u^2(t)) dt + 1/2 s x^2(T) $
Si vede che:
1) Compare un integrale che ha lo scopo di cercare di considerare l'andamento complessivo ("evoluzione" del sistema) e non un singolo valore (ad eccezione del valore finale che ovviamente conta parecchio)
2) Tutti i termini sono al quadrato in modo da pesare allo stesso modo comportamenti in eccesso sia in senso positivo che negativo (allo stesso modo in cui si calcolano e si minimizzano gli errori quadratici per fare la regressione ai minimi quadrati)
3) Compaiono dei guadagni q, r, s che sono delle costanti che vengono scelte dal progettista per previlegiare certi tipi di risposte rispetto ad altre. Ad esempio se q è grande ed r è piccolo il sistema tenderà ad esercitare delle forti azioni di controllo al fine di ridurre l'errore. Il contrario se q è piccolo ed r è grande.
L'estensione ai sistemi multi-variabili conduce poi ad introdurre dei vettori di stato e di comando e quindi delle matrici di guadagni.
Infine il tempo discreto sostituisce all'integrale una sommatoria.
Spero di esserti stato di aiuto. Per ulteriori approfondimenti comunque puoi vedere questa dispensa http://www.dii.unimore.it/~lbiagiotti/M ... Ottimo.pdf
In tal caso si può scrivere più semplicemente (in generale lo stato finale ha un peso diverso)
$J = 1/2 int_0^T (q*x^2(t)+ r*u^2(t)) dt + 1/2 s x^2(T) $
Si vede che:
1) Compare un integrale che ha lo scopo di cercare di considerare l'andamento complessivo ("evoluzione" del sistema) e non un singolo valore (ad eccezione del valore finale che ovviamente conta parecchio)
2) Tutti i termini sono al quadrato in modo da pesare allo stesso modo comportamenti in eccesso sia in senso positivo che negativo (allo stesso modo in cui si calcolano e si minimizzano gli errori quadratici per fare la regressione ai minimi quadrati)
3) Compaiono dei guadagni q, r, s che sono delle costanti che vengono scelte dal progettista per previlegiare certi tipi di risposte rispetto ad altre. Ad esempio se q è grande ed r è piccolo il sistema tenderà ad esercitare delle forti azioni di controllo al fine di ridurre l'errore. Il contrario se q è piccolo ed r è grande.
L'estensione ai sistemi multi-variabili conduce poi ad introdurre dei vettori di stato e di comando e quindi delle matrici di guadagni.
Infine il tempo discreto sostituisce all'integrale una sommatoria.
Spero di esserti stato di aiuto. Per ulteriori approfondimenti comunque puoi vedere questa dispensa http://www.dii.unimore.it/~lbiagiotti/M ... Ottimo.pdf