Open-access Controle de sistemas lineares incertos por modos deslizantes e observador de alto ganho sem peaking

Resumos

Neste trabalho, propõe-se um controlador por modelo de referência e modo deslizante baseado em observador de alto ganho. Para plantas monovariáveis com grau relativo maior do que um, a lei de chaveamento é gerada utilizando-se o estado observado, enquanto que a função de modulação da lei de controle utiliza sinais gerados por filtros de estado. Mostra-se que este esquema possui estabilidade global e exponencial em relação a um conjunto residual arbitrariamente pequeno. Além disso, o sistema em malha fechada não apresenta o fenômeno de peaking que pode prejudicar o desempenho. Resultados experimentais ilustram o bom desempenho obtido pelo algoritmo em condições realistas.

Modo deslizante; estrutura variável; observador de alto ganho; modelo de referência


A model-reference variable structure controller based on a high gain observer (HGO) is proposed and analyzed. For single-input-single-output plants with relative degree larger than one, the switching law is generated using the observed state while the modulation function in the control law is generated using signals from state variable filters. With this scheme, global exponential stability with respect to an arbitrarily small residual set is achieved. Moreover, the closed loop system shows no peaking phenomena which could degrade the performance. Experimental results illustrate the good performance obtained with the algorithm in actual conditions.

Sliding mode; Variable structure; High gain observer; Reference-Model


SISTEMAS LINEARES

Controle de sistemas lineares incertos por modos deslizantes e observador de alto ganho sem peaking

José Paulo Vilela Soares da CunhaI; Liu HsuII; Ramon R. CostaII; Fernando LizarraldeII

IDepartamento de Eletrônica e Telecomunicações - Faculdade de Engenharia, Universidade do Estado do Rio de Janeiro, Rua São Francisco Xavier 524, sala 5036A - 20559-900 - Rio de Janeiro - RJ - Brasil, jpaulo@ieee.org

IIPrograma de Engenharia Elétrica - COPPE - Universidade Federal do Rio de Janeiro, Cx. P. 68504 - 21945-970 - Rio de Janeiro - RJ - Brasil, liu@coep.ufrj.br, ramon@coep.ufrj.br, fernando@coep.ufrj.br

RESUMO

Neste trabalho, propõe-se um controlador por modelo de referência e modo deslizante baseado em observador de alto ganho. Para plantas monovariáveis com grau relativo maior do que um, a lei de chaveamento é gerada utilizando-se o estado observado, enquanto que a função de modulação da lei de controle utiliza sinais gerados por filtros de estado. Mostra-se que este esquema possui estabilidade global e exponencial em relação a um conjunto residual arbitrariamente pequeno. Além disso, o sistema em malha fechada não apresenta o fenômeno de peaking que pode prejudicar o desempenho. Resultados experimentais ilustram o bom desempenho obtido pelo algoritmo em condições realistas.

Palavras-chave: Modo deslizante, estrutura variável, observador de alto ganho, modelo de referência.

ABSTRACT

A model-reference variable structure controller based on a high gain observer (HGO) is proposed and analyzed. For single-input-single-output plants with relative degree larger than one, the switching law is generated using the observed state while the modulation function in the control law is generated using signals from state variable filters. With this scheme, global exponential stability with respect to an arbitrarily small residual set is achieved. Moreover, the closed loop system shows no peaking phenomena which could degrade the performance. Experimental results illustrate the good performance obtained with the algorithm in actual conditions.

Keywords: Sliding mode, Variable structure, High gain observer, Reference-Model.

1 INTRODUÇÃO

O controle a estrutura variável (variable structure control - VSC) é reconhecidamente bem adequado a sistemas incertos. As estratégias VSC, como propostas originalmente, necessitam de todo o estado do sistema para sua implementação (e.g., (Utkin, 1978)), o que nem sempre é disponível devido a aspectos técnicos ou econômicos como, por exemplo, a impossibilidade de instalação ou de construção de alguns sensores, o custo de sensores e de sistemas de comunicação entre os sensores e o controlador. Isto justifica o desenvolvimento de estratégias baseadas na realimentação de saída, em que são medidas apenas as variáveis que devem seguir sinais de referência.

Nesse contexto, o artigo pioneiro de (Bondarev et al., 1985) introduziu o uso de observadores assintóticos (Kailath, 1980) para resolver um problema fundamental do VSC, ou seja, a realização do modo deslizante "ideal" na prática. Em sistemas reais, o modo deslizante pode não ocorrer devido a atrasos em atuadores ou sensores, que usualmente não são modelados para o projeto do controlador. A idéia chave de (Bondarev et al., 1985) é o projeto do controle para se obter o modo deslizante no estado observado do sistema nominal, tratando-se os atrasos como perturbações singulares (vide também (Utkin et al., 1999, Seção 8.3)), (Hsu, 1997, Seção 2) e (Hsu et al., 2002, Seção 1.1)).

A estabilização robusta por realimentação de saída e VSC tem motivado diversos trabalhos num passado recente, e.g., (Walcott and ak, 1988; Emelyanov et al., 1992; Esfandiari and Khalil, 1992; Oh and Khalil, 1995; Edwards and Spurgeon, 1998). Em particular, se for desejado especificar o desempenho do sistema em malha fechada, pode-se empregar o modelo de referência, o que é bastante usual no controle adaptativo (Sastry and Bodson, 1989; Ioannou and Sun, 1996). O controle por modelo de referência e modos deslizantes já foi aplicado a sistemas lineares de uma entrada e uma saída (single-input-single-output — SISO) (Hsu and Costa, 1989; Hsu et al., 1994), a sistemas lineares de múltiplas entradas e múltiplas saídas ( multi-input-multi-output — MIMO) (Tao and Ioannou, 1989; Chien et al., 1996; Hsu et al., 2002; Cunha, Hsu, Costa and Lizarralde, 2003), a sistemas não-lineares SISO (Oh and Khalil, 1997; Min and Hsu, 2000) e a sistemas não-lineares MIMO (Edwards and Spurgeon, 1996; Hsu et al., 2003).

Neste artigo propõe-se uma solução alternativa à apresentada em (Hsu et al., 1994; Hsu et al., 1997) para o controle por modelo de referência e modo deslizante para sistemas lineares SISO com grau relativo arbitrário (n* > 1). Esta solução utiliza simultaneamente um observador de estado para a geração da superfície de deslizamento e filtros de estado para gerar as funções de modulação. O observador assintótico utilizado por (Bondarev et al., 1985) é projetado para uma planta nominal e pode não ser robusto a grandes incertezas. O algoritmo aqui proposto utiliza um observador de alto ganho (high gain observer — HGO) pois este é insensível a incertezas paramétricas e perturbações na planta (Oh and Khalil, 1997).

A principal contribuição deste artigo é a introdução de um novo mecanismo para a eliminação do fenômeno conhecido como peaking, que é um problema associado ao transitório do HGO, usualmente presente neste esquema, e que pode instabilizar o controle de sistemas não-lineares (Sussmann and Kokotovi, 1991). O fenômeno de peaking também é indesejável no controle de sistemas lineares pois poderia demandar muita potência, saturar ou danificar atuadores. Mostra-se que este novo algoritmo possui estabilidade global e exponencial em relação a um conjunto residual arbitrariamente pequeno, ao passo que o controlador proposto por (Oh and Khalil, 1997), embora mais geral e aplicável a sistemas não-lineares, é apenas semi-globalmente estável.

O controlador desenvolvido em (Hsu et al., 1994), denominado VS-MRAC ( variable structure model-reference adaptive controller), também possui estabilidade exponencial global e não apresenta o fenômeno peaking. No entanto, o algoritmo aqui proposto apresenta algumas vantagens dignas de nota: a solução via HGO é mais intuitiva (de certa forma, reduz o problema ao caso em que n* = 1), a estrutura do controlador resultante é mais simples e somente um único relé é necessário para a sua implementação. A análise rigorosa da estabilidade, de ambos controladores, é igualmente complexa.

Este artigo está organizado da seguinte forma. Após a formulação do problema, revisa-se na Seção 5 o controle de sistemas de grau relativo unitário (n* = 1) tendo em vista desenvolver o caso mais geral n* > 1. A abordagem proposta por (Hsu and Costa, 1989) é baseada em estrutura variável e realimentação de saída sem o uso de observadores. No entanto, (Edwards and Spurgeon, 1998) empregam observadores por modo deslizante no controle de sistemas com n* = 1 com a finalidade de gerar a função de modulação da lei de controle, sem nenhuma vantagem aparente em relação à abordagem de (Hsu and Costa, 1989; Cunha, Hsu, Costa and Lizarralde, 2003; Cunha, 2004). Evita-se o uso de observadores através da aplicação de filtros de estado para a geração das funções de modulação. Esta abordagem parece mais simples e natural para sistemas incertos do que o uso de observadores, pois os filtros de estado são mais simples e não requerem a malha de alto ganho ou modo deslizante adotada em observadores para sistemas incertos, e.g., (Edwards and Spurgeon, 1996; Edwards and Spurgeon, 1998).

Nas Seções 6 a 8, propõe-se uma estratégia que evita a ocorrência de peaking no sinal de controle e nos sinais da planta, apesar de não se eliminar o peaking no HGO. Para se evitar o surgimento de peaking nestes sinais, utilizam-se filtros de estado para a geração da função de modulação da lei de controle. Os esquemas de (Emelyanov et al., 1992; Esfandiari and Khalil, 1992) são sujeitos ao fenômeno peaking pois o HGO também é utilizado na geração da função de modulação da lei VSC. Na Seção 9, o peaking é eliminado do HGO através do escalonamento adequado do estado estimado. A Seção 10 apresenta um exemplo de aplicação do esquema proposto a um servomecanismo e inclui resultados experimentais.

1.1 Preliminares

São usados os seguintes conceitos e notações:

  • ||x|| denota a norma Euclidiana de um vetor x e ||A|| denota a norma da matriz A induzida pela norma Euclidiana, que é dada pelo seu maior valor singular.

  • A norma

    ¥e do sinal x(t) Î n é definida como ||xt||¥ := sup0<t<t ||x(t)|| (Ioannou and Sun, 1996, p. 70). Quando o tempo inicial é t0< t, pode-se utilizar a norma

  • Adota-se a representação mista do domínio do tempo com o domínio da transformada de Laplace (cálculo operacional). No entanto, para se definir precisamente estas representações, serão adotadas as seguintes notações: o sinal de saída y de um sistema linear e invariante no tempo com matriz de transferência H(s) e entrada u é dado por H(s)u; a convolução pura h(t)*u(t), sendo h(t) a resposta impulsiva de H(s), será escrita eventualmente como H(s)*u, por simplicidade.

2 FORMULAÇÃO DO PROBLEMA

2.1 Planta

Considera-se uma planta SISO linear, invariante no tempo, observável, controlável e descrita pela equação de estado

onde xp Î n é o vetor de estado, u é o sinal de entrada, y é o sinal de saída e d é uma perturbação não mensurável. O modelo entrada/saída é dado pela função de transferência

onde Kp é o ganho de alta freqüência, Np(s) e Dp(s) são polinômios mônicos. Assume-se que os valores dos parâmetros da planta são incertos, mas pertencem a conjuntos conhecidos.

2.2 Hipóteses sobre a planta

A planta deve satisfazer as seguintes hipóteses:

(A1)G(s) é de fase mínima.

(A2)G(s) é estritamente própria.

(A3) A ordem do sistema (n) é conhecida.

(A4) O grau relativo de G(s), n*, é conhecido.

(A5) O sinal de Kp é conhecido. Por simplicidade, assume-se que seja positivo.

(A6) A perturbação d(t) é contínua por partes e se conhece um majorante (t) tal que |d(t)| < (t) < sup < +¥, "t > 0.

As hipóteses (A1) e (A2) são comumente adotadas em controle adaptativo por modelo de referência (Ioannou and Sun, 1996). A hipótese (A3) serve para estabelecer a ordem dos filtros de estado (11). A hipótese (A3) poderia ser relaxada de forma a se requerer apenas um majorante para n, como é feito em (Ioannou and Sun, 1996, Seção 6.3.1). No entanto, isto acarretaria um aumento da ordem dos filtros de estado utilizados na estrutura do controle por modelo de referência e no aumento do número de parâmetros do controlador. A hipótese (A4) também poderia ser relaxada, no entanto, a lei de controle resultante seria mais complexa (Ioannou and Sun, 1996, Seção 6.7).

Se Kp < 0, então o sinal de entrada da planta deve ser invertido para satisfazer a hipótese (A5).

2.3 Modelo de referência

O modelo de referência é definido por (Ioannou and Sun, 1996, Seção 6.3.1)

onde yM é o sinal de saída, r é um sinal de referência contínuo por partes e uniformemente limitado, KM > 0 é o ganho de alta freqüência do modelo de referência, NM(s) e DM(s) são polinômios Hurwitz e mônicos.

Para plantas com grau relativo unitário, a função de transferência do modelo de referência WM(s) deve ser estritamente real positiva (strictly positive real — SPR) (Hsu and Costa, 1989), hipótese necessária na Seção 5. Para plantas com grau relativo n* > 1, em (Hsu et al., 1994; Hsu et al., 1997) escolhe-se um polinômio mônico e Hurwitz L(s) de grau N := n* – 1 de forma que a função de transferência WM(s)L(s) seja SPR. Aqui a escolha do modelo de referência é mais restritiva pois se requer que WM(s)L(s) = KM/(s + g), com g > 0, em virtude da estrutura do HGO e da aplicação do Lema 6 (Apêndice AApêndice A) na prova se estabilidade do sistema de controle em malha fechada. Assim, para plantas com n* > 1, a função de transferência do modelo de referência é

Deve-se notar que aqui as raízes de L(s) não precisam ser reais. Neste aspecto há mais liberdade no projeto do que no VS-MRAC de (Hsu et al., 1994; Hsu et al., 1997), que requer que L(s) tenha apenas raízes reais, uma vez que o operador L(s) é realizado loc. cit. por uma conexão em cascata de N filtros de avanço de fase baseados em estrutura variável com zeros simples e reais.

2.4 Objetivo de controle

O objetivo é projetar uma lei de controle u de forma que a saída da planta y rastreie assintoticamente a saída yM do modelo de referência, admitindo-se um pequeno erro residual. Mais precisamente, o objetivo de controle é obter a convergência assintótica do erro de saída

para zero ou para uma pequena vizinhança residual de zero.

3 PARAMETRIZAÇÃO DO CONTROLE

Se a planta e a perturbação d(t) fossem perfeitamente conhecidas, então uma lei de controle que casaria o sistema em malha fechada com o modelo de referência seria dada por (Cunha, Hsu, Costa and Lizarralde, 2003)

onde o vetor de parâmetros é dado por

com , Î (n–1), , Î e o vetor regressor é dado por

onde w1 e w2 são gerados pelos filtros de estado

onde L(s) é um polinômio arbitrário, mônico, Hurwitz, de grau n – 1 e que contém NM(s) como fator, i.e., L(s) = L0(s)NM(s), c.f. (Ioannou and Sun, 1996, Seção 6.3.2).

Considerando-se que não há perturbação de entrada, a função de transferência de r para y será WM(s) se = KM (Ioannou and Sun, 1996, eq. (6.3.12)) e for satisfeita a seguinte equação Diofantina:

A lei de controle (7) é desenvolvida na literatura de controle adaptativo para plantas sem perturbação de entrada (d(t) º 0), e.g., (Ioannou and Sun, 1996, Seção 6.3.2). O sinal Wd(s) * d(t) cancela a perturbação de entrada conforme é mostrado na Fig. 1 (Cunha, Hsu, Costa and Lizarralde, 2003).


4 EQUAÇÃO DO ERRO

Defina-se o vetor X := TÎ 3n–2. Seja {Ac,Bc,Co} uma realização não-mínima de WM(s) com vetor de estado XM. Então, o estado do erro (Xe := X – XM) e o erro de saída satisfazem (Hsu et al., 1994; Hsu et al., 2002)

onde K := ()–1 = Kp. O erro de saída pode ser escrito a partir de (14)-(15) como

A partir desta parametrização do controle, assume-se que

(A7) A lei de controle satisfaz a desigualdade ||ut,0||¥<kw||wt,0||¥ + krd, onde kw, krd > 0.

Isto impede o escape em tempo finito dos sinais do sistema. De fato, os sinais do sistema serão regulares e, portanto, podem crescer no máximo exponencialmente (Sastry and Bodson, 1989). A hipótese (A7) não restringe a classe de sistemas que podem ser controlados, mas apenas se aplica à amplitude da lei de controle e, conseqüentemente, sobre a função de modulação da lei VSC, conforme os Teoremas 1, 3 e 4 adiante.

5 CONTROLE DE SISTEMAS DE GRAU RELATIVO UNITÁRIO

Para n* = 1, tem-se que N = n* – 1 = 0, L(s) = 1 e o modelo de referência WM(s) pode ser escolhido SPR. Assim, a partir da equação do erro (16) e de acordo com o Lema 5 (Apêndice AApêndice A), a lei de controle a estrutura variável por modelo de referência (VS-MRAC) originalmente proposta em (Hsu and Costa, 1989) é dada por (Hsu et al., 1994)

onde qnom é o valor nominal de q*. O controle nominal unom permite a redução da amplitude da função de modulação r se a incerteza ||q* – qnom|| for pequena.

A aplicação do Lema 5 (Apêndice AApêndice A) permite concluir que o algoritmo acima é exponencialmente estável desde que a função de modulação r Î + satisfaça a desigualdade

onde d > 0 é uma constante arbitrária. Uma função de modulação que satisfaz a desigualdade (19) e a hipótese (A7) é

com

onde c1> ||q* – qnom||. O majorante (21) é obtido pela aplicação do Lema 7 (Apêndice AApêndice A), de onde se tem que c2> 0 é uma constante apropriada e gd satisfaz g0 > gd > 0, sendo g0 a margem de estabilidade do filtro com matriz de transferência A(s)L–1(s), c.f. (69). Alguns métodos para a computação dos coeficientes c2 e gd do filtro (21) são propostos em (Cunha, Costa and Hsu, 2003). À frente, na Seção 10.2, é apresentado um exemplo de projeto da função de modulação. O seguinte resultado de estabilidade foi provado originalmente em (Hsu and Costa, 1989):

Teorema 1 Para n* = 1, considere-se o sistema formado pela equação do erro (14)-(15) e pela lei de controle (17)-(18). Se as hipóteses (A1)-(A6) forem satisfeitas e a função de modulação satisfizer a hipótese (A7) e a desigualdade (19), então a estratégia VS-MRAC é globalmente exponencialmente estável, i.e., $k,l > 0 tais que ||Xe(t)|| < ke–lt||Xe(0)||, "t > 0. Além disso, se d > 0, então o erro de saída e(t) se tornará nulo após algum tempo finito.

Prova: Aplica-se o Lema 5 ao sistema composto pela realização não-mínima da equação (16), dada pela equação do erro (14)-(15), e pela lei de controle (17)-(18).

No esquema do VS-MRAC na Fig. 2 foi assinalado o laço do modo deslizante "ideal", no qual a função de transferência do sinal U para o sinal e é de fase mínima e possui grau relativo unitário, o que possibilita a ocorrência do modo deslizante na superfície de deslizamento e = 0 (Utkin et al., 1999, Seção 8.3).


6 CONTROLE DE SISTEMAS DE GRAU RELATIVO SUPERIOR A UM

Para n* > 1, o controle à estrutura variável baseado em realimentação de saída não pode ser aplicado diretamente, uma vez que o modelo de referência não é SPR. A abordagem VS-MRAC de (Hsu et al., 1994; Hsu et al., 1997) é baseada no erro de predição e em filtros de avanço de fase por estrutura variável.

Aqui se propõe uma estratégia de controle alternativa baseada em um HGO, que parece ser mais simples do que o VS-MRAC. Uma idéia natural seria estimar o estado da planta como no controlador para estabilização robusta em (Oh and Khalil, 1995). No entanto, aqui se utiliza o modelo de referência (sem incerteza) em vez do modelo da planta (incerto) para reconstruir o estado da equação do erro, adotando-se o argumento de (Chang and Lee, 1996) de que é mais fácil construir um observador para o modelo de referência do que para a planta. Uma abordagem similar a esta é proposta por (Oh and Khalil, 1997) para o rastreamento de trajetórias em sistemas não-lineares. No entanto, tanto (Oh and Khalil, 1995) quanto (Oh and Khalil, 1997) utilizam uma lei VSC em que a função de modulação é globalmente limitada a fim de se eliminar o fenômeno peaking, mas pagando-se o preço de que as propriedades de estabilidade são semi-globais.

Aqui se utiliza um HGO para gerar a lei de chaveamento e, ao mesmo tempo, se utiliza uma função de modulação gerada por filtros de estado para se obter a estabilidade global sem que o fenômeno peaking se manifeste na planta e no sinal de comando, embora o peaking ocorra no HGO.

Considere-se a realização {AM,BM,CM} de ordem mínima na forma canônica do observador para o modelo de referência WM(s) dada pelas matrizes

Então, a equação do erro (14)-(15) pode ser reescrita como

onde a condição inicial xe(0) e o sinal escalar exponencialmente decrescente pe(t) são adequados para representar os efeitos das condições iniciais dos modos observáveis mas não-controláveis na equação do erro (14)-(15). O sinal pe(t) satisfaz |pe(t)| < Ke||Xe(0)||, "t > 0, com constantes apropriadas ke, le > 0. A Observação 1 na Seção 7.1 justifica a inclusão do sinal pe(t) na equação dinâmica em vez de se acrescentar um sinal exponencialmente decrescente na equação de saída para representar os efeitos das condições iniciais dos modos observáveis mas não-controláveis, como poderia parecer mais natural.

É possível projetar uma matriz S Î n* que define a superfície de chaveamento ideal s(xe) = 0, onde s(xe) := Sxe, para que {AM,BM,S} seja uma realização da função de transferência SPR WM(s)L(s). Tendo em vista o modelo de referência (5) e as matrizes (22), tem-se (Kailath, 1980, pp. 39–45)

onde li são os coeficientes do polinômio L(s) = sN + lN–1sN–1 + ... + l1s + l0 e N = n* – 1.

Assumindo-se que uma estimativa

e de xe esteja disponível, então uma lei de controle é

onde o controle nominal unom é dado por (18). Se e(t) º xe(t) e a função de modulação r satisfizer a desigualdade (19) então o estado xe e o erro de saída e convergem exponencialmente para zero, como se pode concluir através da aplicação do Lema 6 (Apêndice AApêndice A) com b(t) º 0.

7 OBSERVADOR DE ALTO GANHO

Como o estado xe não é disponível, a lei de controle utilizará o estado e estimado pelo HGO

onde é o erro de saída do observador, Knom é o valor nominal do ganho K e o vetor

Os coeficientes ai no vetor de realimentação do observador (Lu and Spurgeon, 1998)

devem ser escolhidos de forma que o polinômio característico do observador em malha fechada seja Hurwitz, o que se obtém se o polinômio

for Hurwitz e e > 0. Para que as incertezas e perturbações no sistema afetem pouco o estado estimado

e, a norma do ganho da realimentação do observador (||a(e–1)||) deve ser alta, o que requer que e seja pequeno.

7.1 Majorante do erro de estimação

A seguir, o Teorema 2 estabelece majorantes para a norma do erro de estimação do estado

e(t) := e(t) – xe(t) do observador de alto ganho, tendo em vista a prova de estabilidade do sistema de controle em malha fechada.

Para simplificar este Teorema, assume-se que a margem de estabilidade do polinômio Na(s) (a := minj{–Â(zj)}, onde {zj} são as raízes de Na(zj) = 0) e o escalar la satisfaçam a desigualdade 0 < le < la < a. Também se impõe que 0 < e < 1.

Teorema 2 Considere o observador (26)-(29) e a equação do erro (14)-(15). Se a hipótese (A7) for satisfeita, os sinais r(t) e d(t) forem uniformemente limitados, o polinômio Na(s) for Hurwitz e o parâmetro e for mantido na faixa 0 < e < 1, então $k1,...,k6 > 0 tais que o erro de estimação do estado (

e) satisfaz as desigualdades

"t > 0, onde

Prova: Reescreve-se a equação do erro de saída do observador (27) como = CM

e. Subtraindo-se (23) de (26) se obtém a equação da dinâmica do erro de estimação do estado

onde são utilizados a matriz

e o sinal

Então, aplicando-se a transformação

reescreve-se a equação do erro (34) como

onde

e é uma matriz constante na forma companheira com polinômio característico Na(s), M(e) = [0,...,0,en*–1]TKM e, conseqüentemente, ||M(e)|| = en*–1KM. Assim sendo, a norma do estado e pode ser majorada por

Uma vez que a hipótese (A7) é satisfeita e os sinais r(t) e d(t) são uniformemente limitados, conclui-se a partir de (36) que > 0 tais que ||t,0||¥ < w||wt,0||¥ + , "t > 0. Por outro lado, a partir da definição da transformação (37), tem-se que ||T(e)|| = 1 e ||T–1(e)|| = en*, uma vez que e Î (0,1]. Utilizando-se estes fatos, obtém-se a partir de (39) os majorantes (31) e (32) para a norma do erro de estimação do estado.

Observação 1 Poderia parecer mais natural representar os efeitos das condições iniciais dos modos observáveis mas não-controláveis da equação do erro (14)-(15) através da inclusão de um sinal exponencialmente decrescente e(t) na equação de saída (23), que passaria a ser

e permitiria a eliminação do sinal pe(t) da equação (23). No entanto, a inclusão do termo e(t) resultaria no majorante

onde se nota que o termo ||Xe(0)|| é muito mais conservador do que o termo k2e||Xe(0)|| presente no majorante (31), que é obtido utilizando-se a equação do erro (23). Naturalmente, deve-se considerar que o estado xe(t) da equação do erro (23) é modificado no caso em que se elimina o sinal pe(t) desta equação.

Observação 2 O uso das transformações T(e) e T–1(e) na obtenção dos majorantes (31) e (32) para ||e|| pode gerar resultados muito conservadores, como se pode concluir do fato de que ||T(e)T–1(e)|| = 1, embora o majorante para esta norma estabelecido por ||T(e)|| ||T–1(e)|| = 1/en*–1 torna-se exageradamente grande na medida que e ® +0, uma vez que n* > 2. O uso da norma ||T–1(e)|| na função de modulação do controle em (Emelyanov et al., 1992, eq. (18)) pode resultar em peaking, que pode ser observado no controlador proposto loc. cit. segundo (Oh and Khalil, 1997).

7.2 Fenômeno peaking

O fenômeno peaking no observador de alto ganho é caracterizado pelo termo

presente nos majorantes do erro de estimação do estado (31) e (32). Por um lado deve-se escolher o parâmetro e suficientemente pequeno para reduzir o erro de estimação residual e para tornar mais rápido o transitório do observador. Por outro lado, isto pode resultar no aumento do pico do erro de estimação do estado durante o transitório inicial na proporção de 1/en*–1.

Para ilustrar o fenômeno peaking no HGO, considera-se a equação dinâmica

que representa o erro de estimação do estado (34) de um HGO de segunda ordem quando (t) º 0 e pe(t) º 0. Assim, o majorante (31) resulta em

Notando-se que a margem de estabilidade do polinômio Na(s) = s2 + 2s + 1 é a = 1s–1, escolheu-se la = 0,3s–1 < a para que o pico do majorante seja pequeno e o seu transitório seja razoavelmente rápido. A constante k1 = 1,2 foi computada para minimizar o valor de pico do majorante (44) para o valor estipulado de la. A Fig. 3 apresenta a norma do erro de estimação do estado durante o transitório de (43). O fenômeno peaking fica evidente quando o parâmetro e é reduzido de 1 para 0,1. Nota-se que os majorantes estabelecidos pela desigualdade (44) são bastante conservadores. No entanto, o majorante reflete o peaking, pois a sua amplitude e a sua taxa de decaimento aumentam na medida em que o parâmetro e é reduzido, tal qual ocorre com a norma do estado.


Um conceito importante sobre observadores de alto ganho é o tempo de extinção do pico, que é definido abaixo conforme a Figura 4.


Definição 1 Considere-se a equação da dinâmica do erro de estimação do estado (e(t)) de um HGO com (t) º 0 e pe(t) º 0 dada por

onde a matriz Hurwitz Ae(e–1) é definida em (35). O tempo de extinção do pico (te) do HGO é o menor valor que satisfaz a desigualdade

para um valor fixo do parâmetro e Î (0,1].

O tempo de extinção do pico de um HGO pode ser difícil de ser calculado. Por isso, pode ser mais conveniente estimá-lo através do majorante (31) com (t) º 0 e pe(t) º 0, o que resulta na desigualdade

onde

e> te, (vide Figura 4), da qual se conclui que

Para se compreender a dependência do tempo de extinção do pico em relação ao parâmetro e, define-se o majorante normalizado do tempo de extinção do pico

que é dado por

onde Kpm := (n* – 1)–1ln(k1). A família de curvas na Figura 5 representa e(e, Kpm) para alguns valores da constante Kpm. Pode-se concluir que o majorante do tempo de extinção do pico é uniformemente limitado em relação ao parâmetro e Î (0,1] e tende a zero na medida que e ® +0, para valores fixos dos parâmetros k1> 1, la > 0 e n* > 2.


Observação 3 O observador de alto ganho sem peaking proposto por (Chitour, 2002) para sistemas sem sinal de entrada pode ser representado por

onde H : + × + ® n* é um vetor variante no tempo. Inicialmente o vetor H(t, e–1) tem norma pequena para que o peaking seja evitado. Então, o vetor H(t, e–1) converge exponencialmente para o vetor a(e–1) a fim de que o erro de estimação seja pequeno após o transitório inicial. No entanto, (Chitour, 2002) reconhece que o observador (51) não teria sucesso em situações reais nas quais perturbações poderiam causar o peaking quando a norma do vetor H(t, e–1) for grande, embora o seu observador elimine o peaking em condições ideais durante o transitório inicial.

8 CONTROLE SEM PEAKING NA PLANTA

O primeiro controlador proposto utiliza a lei de controle a estrutura variável (25) conjugada com o HGO (26)-(27). Para se evitar o peaking no sinal de controle u e nos sinais da planta, utiliza-se os filtros de estado (11) na síntese da função de modulação r. No entanto, ocorre o peaking no estado estimado, pois este fenômeno é intrínseco no HGO (26)-(27).

Para analisar a estabilidade do sistema de controle para plantas com grau relativo n* > 2, levando-se em conta de forma completa as condições iniciais, utiliza-se o vetor de estado z := []T. O Teorema 3 estabelece as propriedades de estabilidade do sistema com todas as equações dos sinais de erro dadas por (14)-(15) e (34). Para n* = 1 a estabilidade global exponencial é estabelecida no Teorema 1. No que segue, todos os k's e l's simbolizam constantes positivas genéricas, 's são funções da classe e a norma de um operador (||·||) é induzida pela norma ¥e.

Teorema 3 Para N = n* – 1 > 1, considere-se a planta (2), a lei de controle (25) e (18), os filtros de estado (11) e o observador (26)-(27). Se as hipóteses (A1)-(A6) forem satisfeitas e a função de modulação r satisfizer a desigualdade (19) e a hipótese (A7), então, para e > 0 suficientemente pequeno, o sistema composto pelas equações dos erros (14)-(15) e (34) com estado z será globalmente exponencialmente estável em relação a um conjunto residual que converge exponencialmente para ordem e, isto é, existem constantes kz,lz > 0 e uma função X(e) da classe tais que, "z(0), "t > 0,

Prova: Vide Apêndice BApêndice B.

Observação 4 O controlador de rastreamento de trajetória de (Oh and Khalil, 1997) é baseado em estrutura variável e num HGO. Esse controlador evita o fenômeno peaking na planta através da saturação global do sinal de controle. No entanto, os resultados obtidos loc. cit. garantem apenas a estabilidade semi-global e o estado da equação do erro de rastreamento converge em tempo finito para um conjunto residual de ordem . Nesses aspectos, esses resultados não são tão bons quanto estes estabelecidos no Teorema 3, em que se obtém a estabilidade global e os estados das equações dos erros convergem exponencialmente para um conjunto residual de ordem e. Em contrapartida, aqui a planta deve ser linear e invariante no tempo, ao passo que a abordagem de (Oh and Khalil, 1997) foi orientada a plantas não-lineares.

9 CONTROLADOR LIVRE DE PEAKING

O segundo controlador aqui proposto utiliza um HGO para o estado da equação do erro (23) escalonado pela transformação

O HGO livre do peaking no estado estimado é obtido através da aplicação da transformação = T(e)e ao HGO (26)-(27), resultando no observador dinâmico

onde

M(e) = eT(e)AMT–1(e), = eT(e)a(e–1) e M(e) = eT(e)aM.

Conclui-se que este observador é livre do peaking pois a equação da dinâmica do erro de estimação do estado e(t): = (t) – z(t) é dada por (38), que não exibe peaking conforme o majorante para norma do erro de estimação do estado (39).

A lei de controle a estrutura variável neste caso é definida pela superfície de chaveamento s(

e) = 0, onde s(e) := S
e = ST–1(e). Uma vez que o sinal s(T–1(e)) poderia apresentar peaking devido ao uso da transformação T–1(e) cuja norma é en*, este é escalado adequadamente resultando no sinal () := en*–1ST–1(e) que não exibe peaking. Assim a lei de controle é dada por

onde (e) := en*–1ST–1(e) e o controle nominal unom é dado por (18). Este controlador é descrito na Tabela 1 e no diagrama de blocos na Fig. 6. Neste diagrama de blocos foi assinalado o laço do modo deslizante "ideal", no qual a função de transferência do sinal U para o sinal é de fase mínima e possui grau relativo unitário, o que possibilita a ocorrência do modo deslizante (Bondarev et al., 1985). O relé que gera o controle chaveado faz parte de uma malha de realimentação que passa diretamente através do observador, que realiza o bypass da dinâmica da planta. Assim, o chattering que poderia ser causado por dinâmicas parasitas na planta, sensores e atuadores pode ser evitado pelo uso do observador na malha com controle por modo deslizante (Young et al., 1999), (Utkin et al., 1999, Seção 8.3).


Para analisar a estabilidade do sistema de controle que utiliza o HGO livre do peaking, utiliza-se o vetor de estado := []T. O Teorema 4 estabelece as propriedades de estabilidade do sistema com todas as equações dos sinais de erro (14)-(15) e (38).

Teorema 4 Para N = n* – 1 > 1, considere-se a planta (2), a lei de controle (56) e (18), os filtros de estado (11) e o observador (55). Se as hipóteses (A1)-(A6) forem satisfeitas e a função de modulação r satisfizer a desigualdade (19) e a hipótese (A7), então, para e > 0 suficientemente pequeno, o sistema composto pelas equações dos erros (14)-(15) e (38) com estado será globalmente exponencialmente estável em relação a um conjunto residual que converge exponencialmente para ordem e, isto é, existem constantes kz, lz > 0 e uma função X(e) da classe tais que, "(0), "t > 0,

Prova: Segue a prova do Teorema 3, considerando-se que o erro de estimação é dado por e(t) = T(e) e(t).

Observação 5 Os Teoremas 3 e 4 estabelecem a estabilidade global exponencial dos controladores propostos baseados em estrutura variável e em HGOs em relação a um conjunto residual. Os sinais r(t) e d(t) que excitam o sistema resultam no termo exponencialmente decrescente X(e) presente nos majorantes do estado (52)-(53) e (57). No caso autônomo, i.e., r(t) º 0 e d(t) º 0, pode-se escolher X(e) º 0. Em contraste, o VS-MRAC para sistemas SISO (Hsu et al., 1997) é globalmente exponencialmente estável em relação a um conjunto residual de ordem t sem o termo X(t)e-at nos majorantes das normas dos erros, ainda que as funções r(t) e d(t) estejam ativas.

10 EXEMPLO DE APLICAÇÃO

Para ilustrar a aplicação do controlador proposto, escolheu-se um servomecanismo em que se controla a posição de um carro acionado por um motor DC com ímãs permanentes ao longo de um trilho (Apkarian, 1995, Seções 3.1 e 5.2.1). A simplicidade deste servomecanismo clássico facilita o desenvolvimento do exemplo do projeto do controlador na Seção 10.2. Além disso, os experimentos descritos na Seção 10.4 permitem a avaliação do algoritmo proposto em condições realistas com perturbações (e.g., atrito seco), ruído de medição, dinâmica não modelada e grandes incertezas paramétricas.

A posição do carro (y) é medida por um potenciômetro multivoltas que gera uma tensão (ep) proporcional à posição. O eixo do motor e o eixo do potenciômetro são conectados por engrenagens a uma cremalheira instalada no trilho, conforme a Figura 7.


A interface com o computador utiliza um conversor A/D e um conversor D/A com resolução de 12 bits e tensões de entrada e de saída na faixa de –5V a +5V. O sinal de controle (u) atua na tensão enviada ao motor do carro.

O algoritmo de controle baseado no HGO livre de peaking (Tabela 1) é codificado num computador digital utilizando-se integração numérica pelo método de Euler. As variáveis são amostradas com periodicidade de 1 ms.

10.1 Modelo da dinâmica do carro

A modelagem da dinâmica do carro permite concluir que a sua função de transferência é dada por

onde os parâmetros incertos pertencem às faixas: p1Î [–15;–9,5] e Kp Î [1,59;2,99]. Para o projeto do controle nominal, estimou-se a função de transferência da planta nominal (Gnom(s) = 2,41/[s(s + 13,4)]) a partir da sua resposta em freqüência medida experimentalmente. A perturbação mais significativa é o atrito, que é incorporado como perturbação de entrada (tensão). Essa perturbação é uniformemente limitada por sup = 0,3V, valor obtido experimentalmente.

10.2 Projeto

O modelo de referência escolhido é WM(s) = 50/[(s + 5)(s + 10)], que tem ganho DC unitário. Escolheu-se o polinômio L(s) = s + 10 para cancelar o pólo em –10s–1 do modelo de referência. Os filtros de estado são escolhidos com l(s) = s + 10. O vetor de parâmetros utilizado no controle nominal é calculado para casar a planta nominal Gnom(s) com o modelo de referência, o que resulta na solução da equação Diofantina (13) dada por qnom = [–1,6 –22,6 –18,5 20,7]T.

A função de modulação escolhida (r(t) = c1||w(t)|| + (t)) deve ser projetada de forma que o majorante (19) seja satisfeito considerando-se que os parâmetros da planta são incertos. Além disso, deve-se manter o sinal de controle com pequena amplitude, o que pode ser conseguido se as constantes da função de modulação forem pequenas. A constante c1 = 44 da função de modulação foi calculada numericamente de forma que a desigualdade

seja satisfeita, onde q*(Kp,p1) é a solução da equação Diofantina (13) que depende dos parâmetros incertos da planta.

Uma vez que o atrito é uniformemente limitado, utilizou-se o majorante (t) º 0,47 para permitir o cancelamento do efeito do atrito. Esse é um majorante para o valor em regime permanente da resposta do filtro (8) a um degrau de amplitude sup, dado por

A computação de cada constante foi tratada como um problema de otimização. Naturalmente, o método de otimização deve ser adequado ao sistema e às suas incertezas.

10.3 Resultados de simulação

Nas simulações e nos experimentos (Seção 10.4) o sinal de referência é uma onda quadrada com amplitude 20mm e freqüência 3rad/s. Nas simulações não há perturbação aplicada na entrada da planta, embora no sistema real haja atrito seco que poderia ser incluído como perturbação de entrada. No entanto, para se avaliar os efeitos das incertezas paramétricas, nas simulações os valores dos parâmetros da função de transferência do servomecanismo são bastante distintos dos valores nominais, isto é, Gdist(s) = 1,59/[s(s + 15)]. Todas as condições iniciais são nulas, exceto a posição inicial do carro que é y(0) = 100mm.

As Figuras 8 e 9 apresentam os resultados de simulação obtidos para dois valores do parâmetro e a fim de se avaliar a influência de e no desempenho do sistema de controle. O bom desempenho do controlador é evidenciado pela rápida convergência do erro de saída que pode ser apreciada na Figura 8. Conforme esperado, o erro residual após o transitório inicial é significativamente reduzido na medida em que e passa de 0,1 (Figura 8.a) para 0,01 (Figura 8.b).





O fenômeno peaking não ocorre em nenhum dos sinais simulados, uma vez que este controlador é livre de peaking. Particularmente, nota-se que o peaking não ocorre nas variáveis de estado estimadas 1 e 2, pois quando o valor do parâmetro e é reduzido de 0,1 para 0,01 as amplitudes dos picos destas variáveis ficam praticamente inalteradas, bem como as constantes de tempo dos modos mais lentos, conforme se percebe comparando-se a Figura 9.a com a Figura 9.b.

10.4 Resultados experimentais

Para a verificação da importância do controle a estrutura variável, na Fig. 10 aplica-se apenas o controle linear nominal (i.e., u = (qnom)Tw) e a massa do carro é nominal (0,455kg). Verifica-se que esse controle é incapaz de realizar o rastreamento preciso. A principal causa dos erros exagerados é o atrito seco, cujo efeito é mais evidente quando a velocidade do carro é pequena.


Na Fig. 11, o controle a estrutura variável (25) inclui o controle nominal, mas a massa do carro é aumentada para 0,665kg. Esta alteração é bastante significativa em comparação com a massa nominal (46%). Obtém-se um rastreamento bastante preciso, ainda que a massa do carro tenha sido aumentada.


Uma característica importante é a natureza do sinal de controle u. Na Fig. 12 o sinal de controle linear nominal é bastante suave e de pequena amplitude. O algoritmo baseado em estrutura variável e no HGO sem peaking resulta no sinal controle chaveado em alta freqüência e de grande amplitude apresentado na Fig. 13. Conseqüentemente, a potência dissipada em calor no motor foi maior no esquema baseado em estrutura variável do que no caso do controlador linear nominal. Em ambos experimentos a massa do carro é nominal. Na Fig. 13 observa-se que inicialmente o sinal u ultrapassa um pouco as tensões de saturação do conversor D/A (±5V), o que não prejudicou o desempenho do controlador.



Comprovou-se que o uso do observador reduziu as oscilações em baixa freqüência (chattering), que poderiam ser causadas pela dinâmica não modelada (e.g., dinâmica elétrica da armadura do motor, filtro antialiasing no sistema de aquisição de dados). Apesar disto, o controle a estrutura variável resulta em vibrações que poderiam desgastar os componentes mecânicos. As causas aparentes dessas vibrações são o ruído na medição da posição y e a freqüência de amostragem relativamente baixa (1kHz) que pôde ser obtida com o sistema de aquisição de dados utilizado.

11 CONCLUSÃO

Neste artigo foi desenvolvido um controlador baseado em estrutura variável e observador de alto ganho para sistemas lineares SISO incertos que, em malha fechada, resulta em um sistema globalmente exponencialmente estável em relação a um conjunto residual e livre do fenômeno peaking. A principal contribuição deste artigo é a introdução de um novo mecanismo para a eliminação do fenômeno de peaking. Em (Esfandiari and Khalil, 1992; Emelyanov et al., 1992) o uso do HGO resultou em peaking, conforme foi mostrado em (Oh and Khalil, 1995). Algumas alternativas utilizadas para se evitar o peaking são:

1. A limitação do sinal de controle empregando-se saturações (Oh and Khalil, 1995; Oh and Khalil, 1997), cuja pena é se obter apenas a estabilidade semi-global.

2. O uso de um HGO com ganho variante no tempo (Chitour, 2002), vide Observação 3.

3. O uso de um observador de semi-alto ganho (Lu and Spurgeon, 1998; Lu and Spurgeon, 1999), que de fato é um HGO em que se usa um valor para o parâmetro e que não seja muito conservador, mas que é computado para se garantir a estabilidade do sistema em malha fechada.

Uma característica interessante do esquema de controle aqui proposto é que este guarda alguma semelhança com o VS-MRAC para sistemas SISO (Hsu et al., 1994; Hsu et al., 1997) e o UV-MRAC para sistemas MIMO (Hsu et al., 2002), conforme se poderia observar comparando-se o diagrama de blocos do UV-MRAC, que é semelhante ao diagrama de blocos do VS-MRAC, com o diagrama de blocos do controlador baseado no HGO (Fig. 6). O VS-MRAC, o UV-MRAC e o controlador aqui proposto são livres do fenômeno peaking e globalmente exponencialmente estáveis em relação a conjuntos residuais da ordem de pequenos parâmetros, que em condições ideais devem ser diminuídos para se reduzir o erro de rastreamento.

Os resultados experimentais obtidos com o controlador baseado em estrutura variável e no HGO livre de peaking indicam que se pode obter bom desempenho em situações realistas com perturbações não-lineares, ruído de medição, dinâmica não modelada e grandes incertezas paramétricas.

AGRADECIMENTOS

Este trabalho foi parcialmente financiado pela FAPERJ e pelo CNPq.

Artigo submetido em 16/12/04

1a. Revisão em 27/04/05

2a. Revisão em 01/12/05

3a. Revisão em 16/12/05

ARTIGO CONVIDADO:

Versão completa e revisada de artigo apresentado no CBA-2004

Aceito sob recomendação do Ed. Assoc. Prof. Paulo Eigi Miyagi

Neste Apêndice são apresentados lemas que são aplicados no desenvolvimento do VS-MRAC. O Lema é utilizado na revisão do VS-MRAC para sistemas com grau relativo unitário. O Lema 6 é aplicado na prova de estabilidade do controlador baseado num observador de alto ganho. O Lema 7 é aplicado na função de modulação do controle a estrutura variável.

No que segue, o termo p1(t) é um sinal escalar exponencialmente decrescente, i.e., |p1(t)| < Re–lt, "t > 0, para algumas constantes reais R > 0 e l > 0. Usa-se a abreviatura "LI" para denotar localmente integrável segundo Lebesgue.

Lema 5 Considere o sistema SISO

onde M(s) é uma função de transferência SPR. Assume-se que o sinal dU(t) é LI e o sinal p1(t) é LI e exponencialmente decrescente. Se

onde r é LI e d > 0 é uma constante arbitrária, então $c1,c2,l1 > 0 tais que a desigualdade

é satisfeita "t > 0, onde xe é o estado de qualquer realização estabilizável e detectável de (61) (possivelmente não-mínima). Além disso, se d > 0, então e(t) se torna identicamente nulo após algum tempo finito ts > 0.

Prova: A prova segue (Hsu and Costa, 1989).

Lema 6 Considere o sistema SISO que tem relação entrada-saída dada por

e o sinal (t) = s(t) – p1(t) – b(t), onde Kp,g > 0 são constantes escalares, ,s, U,dU,b,p1Î , dU(t) é LI, p1(t) é exponencialmente decrescente e os sinais p1(t) e b(t) são absolutamente contínuos, "t > 0. Se

onde r é LI e satisfaz

então, os sinais s(t) e (t) são limitados por

onde l1 < min(g,l).

Prova: Vide prova do Lema 2 em (Hsu et al., 1997).

Lema 7 Considere um sistema com matriz p × m de funções de transferência W(s). Seja

a margem de estabilidade de W(s), onde {pj} são os pólos de W(s) e seja gd := g0 – d com d > 0 sendo uma constante arbitrária. Seja (t) um majorante instantâneo para o sinal d(t), i.e., ||d(t)|| < (t), "t > 0. Então, $c1 > 0 tal que a resposta impulsiva w(t) do sistema satisfaça ||w(t)||< < c1

e se verifica a desigualdade

Prova: Vide prova do Lema 2 em (Hsu et al., 2003).

Uma vez que a hipótese (A7) sobre o sinal de controle u é satisfeita, os sinais do sistema podem crescer no máximo exponencialmente. Como se pode representar o vetor regressor w = W1X + W2r com matrizes W1 e W2 adequadas (Hsu et al., 2002, eq. (47)) e lembrando-se que o sinal r(t) é uniformemente limitado, tem-se que ||w|| < kM + kW||Xe||. Então, conclui-se que, "t > 0,

Como te < e dado por (48) pode ser majorado por uma função de e da classe , o majorante (71) pode ser majorado "t Î [0,te] por

que, em conjunto com o majorante do erro de estimação do estado (32), permite concluir que, "t Î [0,te],

Agora o desenvolvimento de um majorante para o estado z prossegue para t > t1 := te. Tomando-se t1 como um novo instante inicial após a extinção do pico no transitório do HGO, tem-se

Reescreve-se a equação do erro (23) como

onde dU := (qnom – q*)T w + Wd(s)*d(t).

Uma vez que o controle utiliza o estado estimado (

e(t) = xe(t) + e(t)), pode-se reescrever a lei de controle (25) como

Lembrando-se que {AM,BM,S} é uma realização não-mínima e controlável de WM(s)L(s) = e que K = Kp, o sinal de chaveamento s(e) pode ser representado a partir da equação dinâmica (75) e da equação algébrica (77) como

com p1(t) + b(t) = *pe(t) + S

e(t). Utilizando-se o majorante para ||e|| dado por (74), tem-se, "t > t1,

Então, uma vez que se assumiu que Kp > 0 e a que função de modulação satisfaz r(t) > |dU(t)| ("t > 0), pode-se aplicar o Lema 6 (Apêndice AApêndice A) ao sistema formado por (78) e pela lei de controle (76), o que resulta no majorante

onde := s - p1(t) – b(t). Relembrando-se que u = unom + U, nota-se que em (78) opera no mesmo sinal U + dU que aquele em (14). A partir de (78) se conclui que U + dU = [ + g]. Então, a partir de (14), o erro de rastreamento do modelo pode ser reescrito como

Para eliminar a derivada , emprega-se a transformação de variáveis e := Xe – BcK resultando em

Uma vez que Ac é Hurwitz e que o sinal satisfaz o majorante (81), tem-se "t > t1 que

Além disso, conforme é esclarecido abaixo, "t > t1,

De fato, as desigualdades em (85) vêm de Xe = e + BcK. Uma vez que ||w|| < kM + kW||Xe||, então, se obtém (86) a partir de (85). Agora, a partir de (33) e (86), pode-se concluir que C(t,t1) também pode ser majorado por C(t,t1) < eke22C(t,t1) + ke21||z(0)|| + , do qual se obtém por intermédio de manipulações algébricas o majorante (87), que é válido para e < . Os majorantes (74) para ||e|| e (85) para ||Xe|| podem ser conjugados no majorante

"t > t1, no qual pode-se utilizar o majorante (87) para C(t,t1) resultando em

que para 0 < e < ke < min(1,) pode ser reescrito como

de onde pode-se afirmar que, "t > t1 tem-se

onde o termo residual O(e) é independente das condições iniciais. Notando-se que o instante inicial é irrelevante na derivação das expressões acima, pode-se escrever

para t > ti > t1 (i = 1,2,3,...) arbitrário. Esta desigualdade conduz à desigualdade linear recursiva

com l = ke30 + eke31 e algum período T1 = ti+1 – ti > 0. Para 0 < e < e* < e escolhendo-se o período T1 > 0 adequadamente longo, obtém-se l < 1. Assim conclui-se que para e > 0 suficientemente pequeno, a recursão (93) converge em progressão geométrica para um conjunto residual de ordem e.

Conjugando-se a convergência exponencial do estado z(t) para um conjunto residual de ordem e a partir do instante t1, o que se conclui da recursão (93), aos majorantes (72) para ||Xe|| e (73) para ||e||, válidos para 0 < t < t1, obtém-se finalmente os majorantes (52) e (53) para as normas dos vetores de estado das equações dos erros que são válidos "t > 0.

Referências bibliográficas

  • Apkarian, J. 1995 . A Comprehensive and Modular Laboratory for Control Systems Design and Implementation, Quanser Consulting.
  • Bondarev, A. G., Bondarev, S. A., Kostyleva, N. E. Utkin, V. I. 1985 . Sliding modes in systems with asymptotic state observers, Autom. Remote Control 46(6): 679-684. Pt. 1.
  • Chang, P. H. Lee, J. W. 1996 . A model reference observer for time-delay control and its application to robot trajectory control, IEEE Trans. Contr. Syst. Tech. 4(1): 2-10.
  • Chien, C.-J., Sun, K.-C., Wu, A.-C. Fu, L.-C. 1996 . A robust MRAC using variable structure design for multivariable plants, Automatica 32(6): 833-848.
  • Chitour, Y. 2002 . Time-varying high-gain observers for numerical differentiation, IEEE Trans. Aut. Contr. 47(9): 1565-1569.
  • Cunha, J. P. V. S. 2004 . Controle de Sistemas Multivariáveis Incertos por Realimenta căo de Saída e Modo Deslizante, PhD thesis, Programa de Engenharia Elétrica, COPPE/UFRJ, Rio de Janeiro.
  • Cunha, J. P. V. S., Costa, R. R. Hsu, L. 2003 . Design of first order approximation filters applied to sliding mode control, Proc. IEEE Conf. on Decision and Control, Maui, Hawaii, pp. 3531-3536.
  • Cunha, J. P. V. S., Hsu, L., Costa, R. R. Lizarralde, F. 2003 . Output-feedback model-reference sliding mode control of uncertain multivariable systems, IEEE Trans. Aut. Contr. 48(12): 2245-2250.
  • Edwards, C. Spurgeon, S. K. 1996 . Robust output tracking using a sliding-mode controller/observer scheme, Int. J. Contr. 64(5): 967-983.
  • Edwards, C. Spurgeon, S. K. 1998 . Sliding Mode Control: Theory and Applications, Taylor & Francis Ltd.
  • Emelyanov, S. V., Korovin, S. K., Nersisian, A. L. Nisenzon, Y. Y. 1992 . Output feedback stabilization of uncertain plants: a variable structure systems approach, Int. J. Contr. 55(1): 61-81.
  • Esfandiari, F. Khalil, H. K. 1992 . Output feedback stabilization of fully linearizable systems, Int. J. Contr. 56: 1007-1037.
  • Hsu, L. 1997 . Smooth sliding control of uncertain systems based on a prediction error, Int. J. on Robust and Nonlinear Control 7: 353-372.
  • Hsu, L., Araújo, A. D. Costa, R. R. 1994 . Analysis and design of I/O based variable structure adaptive control, IEEE Trans. Aut. Contr. 39(1): 4-21.
  • Hsu, L. Costa, R. R. 1989 . Variable structure model reference adaptive control using only input and output measurement: Part I, Int. J. Contr. 49(2): 399-416.
  • Hsu, L., Costa, R. R. Cunha, J. P. V. S. 2003 . Model-reference output-feedback sliding mode controller for a class of multivariable nonlinear systems, Asian Journal of Control 5(4): 543-556.
  • Hsu, L., Cunha, J. P. V. S., Costa, R. R. Lizarralde, F. 2002 . Multivariable output-feedback sliding mode control, in X. Yu and J.-X. Xu (eds), Variable Structure Systems: Towards the 21st Century, Springer-Verlag, pp. 283-313.
  • Hsu, L., Lizarralde, F. Araújo, A. D. 1997 . New results on output-feedback variable structure adaptive control: design and stability analysis, IEEE Trans. Aut. Contr. 42(3): 386-393.
  • Ioannou, P. A. Sun, J. 1996 . Robust Adaptive Control, Prentice-Hall.
  • Kailath, T. 1980 . Linear Systems, Prentice Hall.
  • Lu, X.-Y. Spurgeon, S. K. 1998 . Output feedback stabilization of SISO nonlinear systems via dynamic sliding modes, Int. J. Contr. 70(5): 735-759.
  • Lu, X.-Y. Spurgeon, S. K. 1999 . Output feedback stabilization of MIMO non-linear systems via dynamic sliding mode, Int. J. of Robust and Nonlinear Control 9: 275-305.
  • Min, L. J. Hsu, L. 2000 . Sliding controller for output feedback of uncertain nonlinear systems: global and semi-global results, Proc. 6th IEEE Int. Workshop on Variable Structure Sys., Gold Coast, Australia, pp. 169-178.
  • Oh, S. Khalil, H. K. 1995 . Output feedback stabilization using variable structure control, Int. J. Contr. 62(4): 831-848.
  • Oh, S. Khalil, H. K. 1997 . Nonlinear output-feedback tracking using high-gain observer and variable structure control, Automatica 33(10): 1845-1856.
  • Sastry, S. Bodson, M. 1989 . Adaptive Control: Stability, Convergence and Robustness, Prentice-Hall.
  • Sussmann, H. J. Kokotovic, P. V. 1991 . The peaking phenomenon and the global stabilization of nonlinear systems, IEEE Trans. Aut. Contr. 36(4): 424-440.
  • Tao, G. Ioannou, P. A. 1989 . A MRAC for multivariable plants with zero residual tracking error, Proc. IEEE Conf. on Decision and Control, Tampa, USA, pp. 1597-1600.
  • Utkin, V., Guldner, J. Shi, J. 1999 . Sliding Mode Control in Electromechanical Systems, Taylor & Francis Ltd.
  • Utkin, V. I. 1978 . Sliding Modes and Their Application in Variable Structure Systems, MIR.
  • Walcott, B. L. and Zak, S. 1988 . Combined observer-controller synthesis for uncertain dynamical systems with applications, IEEE Trans. Syst. Man and Cyber. 18(1): 88-104.
  • Young, K. D., Utkin, V. I. Özgüner, U. 1999 . A control engineer's guide to sliding mode control, IEEE Trans. Contr. Syst. Tech. 7(3): 328-342.

Apêndice A

Apêndice B

Datas de Publicação

  • Publicação nesta coleção
    08 Maio 2006
  • Data do Fascículo
    Dez 2005

Histórico

  • Revisado
    01 Dez 2005
  • Recebido
    16 Dez 2004
  • Aceito
    16 Dez 2005
location_on
Sociedade Brasileira de Automática Secretaria da SBA, FEEC - Unicamp, BLOCO B - LE51, Av. Albert Einstein, 400, Cidade Universitária Zeferino Vaz, Distrito de Barão Geraldo, 13083-852 - Campinas - SP - Brasil, Tel.: (55 19) 3521 3824, Fax: (55 19) 3521 3866 - Campinas - SP - Brazil
E-mail: revista_sba@fee.unicamp.br
rss_feed Acompanhe os números deste periódico no seu leitor de RSS
Acessibilidade / Reportar erro