Resumos
Estudamos a solução de problema de rastreamento com controle de horizonte retrocedente (receding) de sistemas lineares com saltos Markovianos a tempo discreto sujeitos à entradas de ruído, saltos nos alvos dinâmicos e nas entradas exógenas. O índice de desempenho é quadrático, e a informação disponível para o controlador não envolve observações dos estados da cadeia de Markov. Uma seqüência de ganhos de realimentação linear de estados é adotada para resolver este problema, motivado pela síntese de controle. Condições necessárias de otimalidade são desenvolvidas, e propomos um método recursivo, baseado em procedimento variacional, que permite satisfazer as condições acima. Uma aplicação para um modelo econômico é apresentada.
Controle estocástico; sistemas lineares sujeitos a saltos markovianos; controle com horizonte retrocedente; controle com observação incompleta; alvos dinâmicos
We study the solution for the tracking problem of receding horizon control of discrete-time Markov jump linear systems subject to noisy inputs, switching targets and jumps in the exogenous input variables. The performance index is quadratic and the information available to the controller does not involve observations of Markov chain states. A fixed sequence of state linear feedback gains is adopted to solve the control synthesis problem. Necessary conditions of optimality is provided and we propose an recursive method based on a variational procedure which attains the necessary conditions. An application to an economic model is presented.
Stochastic control; linear systems subject to Markovian jumps; receding horizon control; control with incomplete observation; switching targets
SISTEMAS LINEARES
Controle de horizonte retrocedente de sistemas lineares com saltos Markovianos para o problema de rastreamento com alvos dinâmicos
Alessandro N. VargasI; João B. R. do ValI; Eduardo F. CostaII
IDepto. de Telemática, Univ. Estadual de Campinas (UNICAMP) 13081-970, Campinas, S.P., Brasil. vargas@dt.fee.unicamp.br, jbosco@dt.fee.unicamp.br
IIDepto. de Ciências de Computação e Estatística, Univ. de São Paulo (USP) Cx. Postal 668, 13560-970, São Carlos, S.P., Brasil. efcosta@icmc.usp.br
RESUMO
Estudamos a solução de problema de rastreamento com controle de horizonte retrocedente (receding) de sistemas lineares com saltos Markovianos a tempo discreto sujeitos à entradas de ruído, saltos nos alvos dinâmicos e nas entradas exógenas. O índice de desempenho é quadrático, e a informação disponível para o controlador não envolve observações dos estados da cadeia de Markov. Uma seqüência de ganhos de realimentação linear de estados é adotada para resolver este problema, motivado pela síntese de controle. Condições necessárias de otimalidade são desenvolvidas, e propomos um método recursivo, baseado em procedimento variacional, que permite satisfazer as condições acima. Uma aplicação para um modelo econômico é apresentada.
Palavras-chave: Controle estocástico, sistemas lineares sujeitos a saltos markovianos, controle com horizonte retrocedente, controle com observação incompleta, alvos dinâmicos
ABSTRACT
We study the solution for the tracking problem of receding horizon control of discrete-time Markov jump linear systems subject to noisy inputs, switching targets and jumps in the exogenous input variables. The performance index is quadratic and the information available to the controller does not involve observations of Markov chain states. A fixed sequence of state linear feedback gains is adopted to solve the control synthesis problem. Necessary conditions of optimality is provided and we propose an recursive method based on a variational procedure which attains the necessary conditions. An application to an economic model is presented.
Keywords: Stochastic control, linear systems subject to Markovian jumps, receding horizon control, control with incomplete observation, switching targets
1 INTRODUÇÃO
Sistemas Lineares com Saltos Markovianos (SLSM) formam uma importante classe de sistemas lineares estocásticos, e um considerável interesse tem sido focado nestes sistemas nos últimos anos. SLSM podem ser utilizados para modelar sistemas dinâmicos sujeitos a fenômenos aleatórios que apresentam mudanças abruptas em sua estrutura ou parâmetros. Diversos resultados considerando aplicações, condições de estabilidade e problemas de controle ótimo podem ser encontrados na literatura. Podemos citar (Ji e Chizeck, 1990; Costa e Fragoso, 1993; Costa e Fragoso, 1995) como importantes contribuições no desenvolvimento teórico de SLSM.
O problema de controle de horizonte retrocedente tem sido estudado na literatura e alguns trabalhos que abriram perspectivas foram (Bitmead et al., 1990) e (Kwon et al., 1983) para os sistemas lineares determinísticos, e (Mayne e Michalska, 1990) para sistemas não-lineares. Resultados aplicados aos SLSM são mais recentes, vide (do Val e Baar, 1999; Costa e do Val, 2000; Park et al., 2001; Park e Kwon, 2002).
Também é conhecido como controle de horizonte deslizante, ou ainda como Model Predictive Control (MPC), vide, por exemplo (Camacho e Bordons, 1999; Mosca, 1995; Mayne et al., 2000), o controle por horizonte retrocedente tem-se mostrado como uma estratégia de sucesso, tanto no meio acadêmico como na indústria, em diversas aplicações em processos industriais.
O princípio de controle retrocedente permite-nos assumir que o sistema tem um modelo preciso somente dentro dos curto e médio prazos, ou seja, os possíveis valores dos parâmetros do modelo e a probabilidade de transição entre seus valores são conhecidas somente dentro destes prazos. Depois de certo período, entretanto, não há um modelo apropriado, acarretando sérias dificuldades para a abordagem do problema de longo prazo. Nas próximas seções abordaremos o mecanismo de funcionamento do controle por horizonte retrocedente aplicado aos SLSM.
Normalmente saltos nos sistemas SLSM estão associados principalmente a mudanças que ocorrem na estrutura do problema e nas matrizes que representam o índice de desempenho a ser otimizado. Além disto, os saltos no modelo também podem refletir mudanças em alvos desejados para o estado e/ou variáveis de controle. Uma motivação para o estudo de problemas dessa natureza são as possíveis aplicações em modelos macro-econômicos, como por exemplo, nas políticas de regras consistentes com alvos inflacionários (Rudebusch e Svensson, 1998). Problemas de alvos também aparecem em sistemas onde se deseja suprir uma demanda aleatória caracterizada por saltos entre níveis distintos (vide (Costa e do Val, 1998)).
Em do Val e Baar (1999), os autores formularam e resolveram o problema de rastreamento com controle de horizonte retrocedente para SLSM com observação completa dos estados e com observação parcial da Cadeia de Markov em termos de grupamentos (clusters) de estados. Entretanto, o modelo proposto por do Val e Baar (1999) não considera ruído aditivo no sistema, e esta característica também é desejável, na medida em que generaliza o modelo; por exemplo, permite modelar erros de pequena monta devido à imprecisão nominal.
Neste trabalho desenvolvemos a solução para problema de rastreamento não-autônomo com controle de horizonte retrocedente para SLSM, no qual o sistema possui as seguintes características: saltos nos alvos dinâmicos dos estados e das variáveis de controle; saltos nas entradas exógenas; entradas de ruído estacionário. Os estados da cadeia de Markov não são observados, com exceção da distribuição inicial, que é conhecida antecipadamente, e restringimos o controle na forma de realimentação linear de estados.
Na seção apresentamos alguns resultados básicos, na seção provemos a formulação do problema, conceitos de realimentação e apresentamos a condição necessária de otimalidade obtida. A seção apresenta ainda um método de solução recursivo baseado em um procedimento variacional. Na seção apresentamos uma aplicação macroeconômica que ilustra a teoria desenvolvida. Finalmente, na seção , apresentamos algumas conclusões.
2 DEFINIÇÕES E CONCEITOS BÁSICOS
Seja : = {1, ¼, n} um conjunto finito e r,s (r) a representação de um espaço linear formado por todas as matrizes reais r × s (r × r). Definimos r,s como sendo o espaço linear de todas as -seqüências de matrizes tais que r,s = {U = (U1, ¼, Un) : Ui Î r,s, i Î }. Seja r a representação do subespaço linear normalizado de r de matrizes simétricas, ou seja, r = {U Î r : U = U¢}, sendo que U¢ denota o transposto de U. Considere também r 0 (r +) o cone fechado (aberto) de matrizes semi-definidas (definidas) positiva de r, ou seja, r0 = {U Î r : U > 0}, r+ = {U Î r : U > 0)}. Definimos r como sendo o espaço linear de todas as -seqüências de matrizes tais que r = {U = (U1, ¼, Un) : Ui Î r, i Î }. Também escrevemos r0 (r+) quando Ui Î r0 (Î r+) para todo i Î .
Utilizaremos com certa freqüência, ao longo deste trabalho, a representação
r () para denotar um vetor-coluna real r-dimensional (escalar), e r () para denotar todas as -seqüências de vetores (escalares).Empregamos o ordenamento U > V (U > V) para elementos de r, significando que Ui - Vi é definido positivo (semi-definido positivo) para todo i Î . Para U Î r, usamos a norma ||·||2:
sendo que tr {·} é o operador traço. Sabe-se que
r,s com o produto interno abaixo
forma um espaço de Hilbert.
Definimos A = {Ai Î r : i Î }, B = {Bi Î r,s : i Î }, H = {Hi Î r,l : i Î }, Q = {Qi Î r0 : i Î }, R = {Ri Î s+ : i Î } e F = {Fi Î r0 : i Î } como um conjunto de matrizes. Elas serão utilizadas mais adiante.
Seja (W, ,{k}, P) o espaço de probabilidade fundamental. Seja ainda Q: = {q(k); k > 0} uma Cadeia de Markov homogênea a tempo discreto, tomando valores no conjunto , tendo = [pij], "i, j Î como matriz de transição de probabilidade. O estado da Cadeia de Markov, num certo instante t, condicionado ao conhecimento até o instante k, é determinado conforme uma certa distribuição de probabilidade µt|k em , ou seja, µt|k(i): = Pr(q(t) = i | k). Considerando o vetor n-dimensional µt|k = [µt|k(0), ¼, µt|k(i), ¼, µt|k(n)]¢, "i Î , a distribuição do estado da cadeia µt|k é definido como µt|k = (¢)tµk|k. Nas próximas seções, utilizaremos intensamente k = 0, e assim denotaremos µt|0 simplesmente por µt quando k = 0.
Representamos o sistema SLSM autônomo e discreto no tempo na forma
com k Î [k0, k1] Ì , Aq(k)Î r e o estado do sistema é representado pelo par {x, q}.
Os resultados de representação a seguir são uma extensão dos resultados encontrados em (do Val e Baar, 1999; Costa e do Val, 2000) e serão intensamente utilizados ao longo das próximas seções.
Definimos como a função indicadora do conjunto , e Xt: = {Î r0} Î r0 e := {Î r} Î r como um conjunto de matrizes associadas de modo que
em que Ex0,m0[ · ] º E[ · |x(0) = x0, q(0) ~ µ0].
Para a prova do lema a seguir, vide Apêndice A APÊNDICE A .
Lema 1Sejam quaisquer seqüências U = {Ui Î r0 : i Î } Î r0, f = {fiÎ r : i Î } Î r e a = {aiÎ : i Î } Î . As seguintes identidades são válidas:
3 FORMULAÇÃO DO PROBLEMA
Considere o processo , que leva em conta o problema de rastreamento, definido num espaço de probabilidade subjacente conforme:
sendo que x é um vetor r-dimensional e q é o índice da Cadeia de Markov, tal modo que o estado do sistema é um processo markoviano conjunto {x, q}. Além disto, u representa o vetor de controle s-dimensional, e as demais expressões em representam o custo por estágio e o custo final, nesta ordem, representados por q e p. O modelo representa um sistema linear estocástico a tempo discreto sujeito a saltos markovianos nos parâmetros, estruturado na forma de variáveis de estado. Os estados e as entradas de controle possuem um conjunto de alvos conhecidos ou valores de trajetória prescritos, que podem variar aleatoriamente no tempo, de acordo com uma Cadeia de Markov subjacente, em que i(k) Î r e i(k) Î s, "i Î , k > k0, representam os alvos para estado e alvos para entradas de controle, respectivamente, quando q(k) = i. Para cada i Î , a seqüência fixa {ei(k), k > k0} Î é conhecida antecipadamente e representa entradas exógenas no sistema. Além disto, o processo estocástico {w(k); k > k0} é uma seqüência de vetores aleatórios de segunda ordem i.i.d. -dimensionais, com média nula e matriz de covariância finita definida por S := E[w(k)w(k)¢] Î r0, "k > k0 . Também sabemos que {w(k); k > k0} é independente de {q(k);k > k0}; em particular, x(k) e w(k) são vetores aleatórios independentes.
O problema de rastreamento considerado neste trabalho é descrito a seguir.
O índice de desempenho associado a é uma função custo quadrática padrão com um horizonte de N estágios, definida por
tal que [ · ] º E[ · |x(k) = xk, q(k) ~ µk] e N > 0. O princípio de controle de horizonte retrocedente afirma que o custo funcional deve ser minimizado para cada instante de tempo k = k0, ¼, k1. A entrada corrente u(k) é obtida através da determinação da seqüência de entradas {u*(k), ¼, u*(k + N - 1)} que minimiza Jk,N, e fazendo-se u(k) = u*(k). A seqüência restante é descartada, e esse procedimento é subsequentemente repetido a cada instante. O modelo , em princípio, é válido somente quando o índice do tempo k é tal que k0< k < k1 + N.
3.1 Conceitos de Realimentação
Um controle de horizonte retrocedente para é definido como uma ação de realimentação de estados conforme
para cada instante de tempo k = k0, ¼, k1.
Seja K := {Kt Î s,r, t = 0, ¼, N} uma seqüência de ganhos de realimentação e r := {rt Î s, t = 0, ¼, N} uma seqüência de sinais de referência. Denotaremos por n o par formado pelas seqüências K e r, ou seja, n: = (K, r). Em correspondência, o custo funcional em (3) é associado às seqüências (K, r) e ao sistema , com realimentação na forma:
e será chamado por . Para simplificação notacional, faremos o estágio inicial k coincidir com a origem do tempo (k = 0), sem nenhuma perda em generalidade, e desta maneira, chamamos o custo funcional simplesmente por , ou seja,
com controle na forma u(t) = rt + Ktx(t), t = 0, ¼, N - 1.
A classe admissível de todos os possíveis controles (K, r) é denominada neste caso de . Adotaremos, nas próximas seções, a convenção de chamar o sistema com um controle (K, r) na classe .
3.2 Funcionais Associados
Desenvolvemos, nesta seção, uma forma equivalente determinística de expressar o custo , para se obter uma representação mais conveniente para otimização.
Relembremos aqui a notação Xt = {Î r0} Î r0 e = {Î r} Î r feita em (1) e (2), sendo x(0) = x0 um vetor conhecido.
Apresentamos YtÎ r0 definido conforme
e os operadores
via
"i Î , t = 0, ¼, N, sendo que f Î r0, f Î r ou f Î , e := Ai + BiKt, "i Î .
O lema a seguir será importante no desenvolvimento de uma dinâmica para Xt e .
Lema 2 As seguintes igualdades são válidas:
Prova: (i) Avaliamos
Perceba que x(t + 1) não depende de q(t + 1). Assim, empregando a propriedade
em (9), segue que o lado esquerdo da igualdade em (7) é equivalente à
em que na igualdade acima empregamos o fato que u(t) = rt + Ktx(t) e = Ai + BiKt. Segue que é equivalente à
no qual a caracterização da seqüência de ruído foi utilizada. Levando em conta que = µj(t), e empregando as definições (1) e (2) em (11), obtemos (7), mostrando o resultado.
(ii) Procedendo de maneira equivalente a prova anterior, avaliamos
Segue de (12), aplicando-se u(t) = rt + Ktx(t) e = Ai + BiKt, que:
na passagem acima foi utilizada a hipótese de média nula para o ruído. Empregando (2) em (13), obtemos o resultado (8).
O resultado a seguir estabelece a dinâmica de e envolvendo os operadores introduzidos anteriormente.
Proposição 3 Para cada t = 0, ¼, N - 1, temos que:
são relações válidas observando-se = µ0(i)x(0)x(0)¢, "i Î , e = µ0(i)x(0), "i Î .
Prova: (i) Por indução. Para t = 0, temos pela definição em que
"i Î . Empregando a definição de , , Yt, (1)-(2) e o estágio t = 0, é possível reescrever na forma
e o resultado é válido para t = 1. Suponha que o resultado seja válido para t. Então, similarmente obtemos
e consequentemente o resultado é válido para t + 1. Este argumento por indução completa a prova.
(ii) Também por indução, de forma análoga ao item anterior. Para t = 0, temos pela definição em (2) que = µ0(i)x(0) = , "i Î .
Empregando a definição de , e o estágio t = 0, é possível reescrever (8) na forma
e o resultado é válido para t = 1. Suponha que o resultado seja válido para t. Então, similarmente obtemos
e consequentemente o resultado é válido para t + 1. Este argumento por indução completa a prova.
Comentário 4 A Proposição 3 mostra-nos que as entradas exógenas do sistema eq(t)(t) influenciam na evolução da dinâmica de Xt através de Yt e dos operadores e . Além disto, o ruído atua na dinâmica de Xt através de matrizes constantes Yt.
Para o restante do artigo vamos considerar também as seguintes relações recursivas. Suponha que Vt Î r0, t = 0, ¼, N, com = Fi para todo i Î , satisfaz
e também, vt Î r, t = 0, ¼, N, com = -2Fi
i(N) para todo i Î , satisfaz:
Finalmente, seja wtÎ , com = i(N)¢Fi
i(N) para todo i Î , e
com
para todo i Î .
Seja um sistema com uma política de controle representada pelo par n = (K, r) Î . Definimos o funcional
indexado no instante t correspondente ao par n. Pela definição acima e por (6), percebemos que (0) = .
Apresentamos a seguir uma expressão determinística equivalente ao funcional (t) que será útil no processo de otimização.
Proposição 5 Para o sistema , sejam Vt, vt e wt, t = 0, ¼, N definidos de acordo com (16)-(18), respectivamente. Então, o funcional (t) é idêntico a
A prova desta proposição está detalhada no Apêndice BAPÊNDICE B , contemplando alvos dinâmicos. Definimos, para um controle n = (, uma variável aleatória na forma Relembramos, primeiramente, que q(t) e p(N) são definidos conforme , contemplando alvos dinâmicos. Definimos, para um controle n = (K, r) Î , uma variável aleatória na forma .
4 ANÁLISE DE OTIMALIDADE
Nesta seção obtém-se as condições de otimalidade de um elemento na classe de controles = {(Kt, rt): Kt Î r,s, rt Î s, t = 0, ¼, N - 1} definida na seção 3.1. O resultado a seguir é uma adaptação do Teorema 14 em do Val e Baar (1999), e apresenta uma condição necessária de otimalidade a ser atendida pelo controle (K, r) Î .
Teorema 6Se (K, r) = , então (K, r) conjuntamente satisfazem:
com, , Vt, vt e wt, t = 0, ¼, N - 1 definidos conforme (14)-(18), respectivamente.
Prova: Para qualquer par de seqüências n = (K, r) Î , avaliamos o efeito da escolha de um ganho (Kt, rt) no custo , e empregamos a representação dada na Proposição 5 para o funcional (23) desde o instante t qualquer. Em seguida aplicaremos o argumento de indução retroativa em relação à t. Para t = N - 1, temos com as condições de contorno = Fi, = -2Fi
i(N), = i(N)¢Fii(N), "i Î , que
O resultado é certamente verdadeiro, pois aplicando-se diferenciação direta com respeito a rN-1 e KN-1 em (26), obtemos (24) e (25) para t = N - 1. Adotando-se nas equações (16)-(18) = Fi, = -2Fi
i(N), = i(N)¢ Fii(N), "i Î e (KN-1, rN-1) que satisfazem (24) e (25) conjuntamente, definem-se os argumentos VN-1, vN-1 e wN-1.Suponha que o resultado seja válido para t = k + 1, e podemos tomar os argumentos Vk+1, vk+1 e wk+1 conhecidos. É válida a seguinte igualdade, conforme a Proposição 5.
Aplicamos diferenciação direta com respeito a rk e Kk em (27), obtemos (24) e (25) com t = k, respectivamente. De maneira análoga podemos obter os argumentos Vk, vk e wk utilizando as equações (16)-(18). Em particular, note que para t = 0 têm-se (0) = , que recupera exatamente o funcional de custo a ser minimizado. Finalmente, conclui-se que o par ótimo (K, r) = ({Kt}, {rt}), t = N - 1, ¼, 0 em satisfaz conjuntamente (24) e (25), completando a prova.
Comentário 7 Empregando (1)-(2), (14)-(18) e (24)-(25), podemos assegurar, pelo Teorema 6, que a solução satisfaz condições necessárias de otimalidade.
4.1 Método variacional de solução
Uma vez que (14)-(18), (24) e (25) não possuem solução algébrica direta, por se tratarem de equações matriciais acopladas umas às outras, proveremos, adiante, um método variacional para encontrar a solução do problema, baseado no resultado do Teorema 6.
Definimos G(h): = {G0(h), ¼, GN(h)} Î s,r, r(h) := {r0(h), ¼, rN(h)} Î sh = 0, 1, ¼ como uma seqüência de controles, e n(h) := (G(h), r(h)) como o par associado. Vamos associar (h) Î r, Lt(h) Î s+, (h) Î r, (h) Î r,s e os operadores via
"i Î , tal que f Î r0, ou f Î r ou f Î . Um algoritmo que envolve cálculos recursivos simples é apresentado a seguir:
Passo 1: Grave contador de iterações h = 0. Escolha seqüência inicial (G(0), r(0)) Î .
Passo 2: Para t = 1, ¼, N, encontre Xt(h) Î r0 e (h), soluções dos seguintes conjuntos de equações:
com (h) = µ0(i)x0 e (h) = µ0(i)x0, "i Î . Faça h = h + 1 e t = N - 1.
Passo 3: Encontre Gt(h) e rt(h) definidos por
Calcule Vt(h) Î r0, vt(h) Î r e wt(h) Î via
com (h) = Fi, (h) = -2Fi
i(N) e (h) = i(N)¢ Fii(N), "i Î . Grave t = t - 1; se t > 0, retorne ao Passo 3.Passo 4: O critério de parada deve ser baseado na variação ocorrida entre custos (h-1) e (h)N. Se o critério de parada não for satisfeito, então retorne ao Passo 2.
Teorema 8As seqüências (G(h), r(h)), h = 0, 1, ¼, geradas no Algoritmo acima são tais que (h+1)< (h), e limh ® ¥ (G(h), r(h)) satisfaz a condição (24) e (25) do Teorema 6.
A prova do Teorema 8 é extensa, e por brevidade não a reproduziremos aqui. A consulta aos detalhes pode ser feita em Vargas (2004, pags. 55-63), que se encontra disponível na forma eletrônica.
Comentário 9 As equações (29) e (30) podem ser colocadas na forma padrão de uma equação linear utilizando-se produto de Kronecker, vide do Val e Baar (1999, Appendix). Essa equação linear resultante pode não ser única, e para contornar esta questão, utilizamos a solução de norma-2 mínima, como também adotada em (do Val e Baar, 1999). Essa escolha irá garantir a unicidade da seqüência n.
5 APLICAÇÃO
Neste seção, desenvolvemos uma aplicações de forma a ilustrar qualitativamente a teoria desenvolvida para o problema de rastreamento com saltos. Analisaremos um pequeno modelo macroeconômico dos EUA sujeito a alvos inflacionários.
5.1 O modelo macroeconômico
Muitos países possuem uma política pública de metas inflacionárias, entre eles o Brasil, Nova Zelândia, Reino Unido, Canadá, Austrália, Espanha. Normalmente, a autoridade monetária (Banco Central) implementa políticas de controle de forma a obter níveis inflacionários que se aproximem ao máximo de alvos previamente estabelecidos.
Atingir os alvos (ou metas) inflacionários pode ter difícil implementação, pelo simples fato de que o Banco Central não possui um controle preciso sobre a inflação. O nível inflacionário pode ser afetado por:
distúrbios (ruídos) econômicos;
lacuna de produção da economia, que pode ser definido como o desvio percentual do Produto Interno Bruto (PIB) atual em relação ao valor potencial.
taxa de juros.
O objetivo nesta seção é aplicar o SLSM com ruído para modelos existentes da economia dos EUA, adotando-se o método de controle por horizonte retrocedente. Esta é uma aplicação inédita neste contexto com ruído, e o método é visto como bem adaptado para manipular problemas macroeconômicos (do Val e Baar, 1999).
Verificaremos o comportamento dos principais indicadores econômicos, sejam eles inflação, lacuna de produção e taxa de juros, segundo os modelos macroeconômicos dos EUA usados por Rudebusch e Svensson (1998) e Dennis (2001).
O problema será tratado aqui como o de rastreamento, no qual os alvos dos indicadores econômicos serão previamente fixados. Os resultados são analisados ao final desta seção.
5.1.1 O modelo monetário da inflação e da lacuna de produção
O modelo monetário considerado, conforme (Rudebusch e Svensson, 1998; Dennis, 2001), possui duas equações auto-regressivas na forma geral
sendo que as variáveis p, y e z representam a inflação, a lacuna de produção e a taxa de juros, respectivamente. Estas variáveis são dadas em valores percentuais. O ruído no sistema é representado por wp(k), wy(k), e e0, e1 representam entradas exógenas.
Adota-se cinco modelos distintos; e os valores dos parâmetros a0, ¼, a4, b0, ¼, b12, e0, e1 são tomados conforme descrito na Tabela 1 (Rudebusch e Svensson, 1998; Dennis, 2001), e cada modelo representa um cenário hipotético distinto da economia.
Os Modelos 1-5 podem ser reescritos na forma de variáveis de estado conforme:
com
e parâmetros
com conforme Tabela 1. Assumimos que mudanças abruptas ocorrem nestes modelos de acordo com uma Cadeia de Markov, de forma que q(k) em (36) representa o estado da cadeia, e portanto (36) torna-se um SLSM com q(k) = i Î := {1, ¼, 5}. Assumimos também que os estados de Markov não são observados pela autoridade monetária, definindo portanto um conjunto de estados de Markov não acessíveis ao controlador.
Segundo do Val e Baar (1999), o controle por horizonte retrocedente é bem adaptado para lidar com problemas macroeconômicos, pois a escolha do comprimento do horizonte N pode corresponder ao horizonte no estágio t que limita o conhecimento do modelo. Como conseqüência, empregamos esta técnica de controle no SLSM (36). O SLSM possui um conjunto de trajetórias prescritas para variáveis de estado e controle, e a autoridade monetária deseja minimizar um funcional com sentido econômico, que é equivalente ao funcional quadrático (6) quando as seguintes as matrizes são adotadas:
A autoridade monetária deseja verificar o comportamento da economia, ao longo dos próximos 50 trimestres, mediante os seguintes alvos: 1,2% de inflação; 0,5% de lacuna de produção; 1,5% de taxa de juros. Para tal intento, fixamos
q(k)(k) º [1,2 0,5 0 0 0 0 0 0]¢ e q(k)(k) º [1,5 0 0 0 0]¢, "k.O valor do estado inicial foi obtido de (Rudebusch e Svensson, 1998), e é igual a x0 = [2,269 1,634 1,647 1,608 1,12 1,472 1,127 0,974]¢; Fazemos k0 = 0, k1 = 50; horizonte de N = 4 estágios; distribuição inicial µ0 = [0,5 0,2 0,1 0,1 0,1]¢; e matriz de transição de probabilidade dada por
Na próxima seção, analisamos graficamente a sensibilidade do sistema com saltos (36), quando submetido a duas intensidades de ruído distintas, de médias nulas e matrizes de covariância dadas como:
Caso 1: S = 0,0125 I4;
Caso 2: S = 0,1 I4.
5.2 Considerações de implementação e resultados
Para realizar a simulação completa de , no intervalo de validade k0< k < k1 + N do modelo, além do método variacional desenvolvido na seção 4.1, implementamos computacionalmente o descrito no Procedimento 1.
A idéia principal da implementação é a de executar um procedimento de Monte-Carlo envolvendo simulações independentes com objetivo de obter dados estatísticos confiáveis. Neste problema em particular, devido a grande quantidade de dados gerados pela implementação e a aleatoriedade envolvida, a análise deve ser baseada em gráficos que representam a média e desvio padrão de x, u e para todos os instantes k0< k < k1.
Utilizamos o Procedimento 1 com Nrep = 500 simulações independentes de Monte-Carlo. Os resultados obtidos estão expostos nas Figs. 1-4, conforme os Casos 1 e 2.
Os resultados macroeconômicos são apresentados na forma de gráficos, e mostram a evolução das variáveis econômicas ao longo dos 50 trimestres.
Todas as figuras mostram que no Caso 2 as curvas de desvio estão mais acentuadas que no Caso 1, devido a matriz de covariância no Caso 2 possuir magnitude maior que a do Caso 1, embora apresentem certa concordância.
A Fig. 1 ilustra a evolução da inflação. A linha horizontal em 1,2% indica o alvo inflacionário, enquanto que a curva central representa a média, sendo esta limitada superiormente e inferiormente pelas curvas de soma ou subtração do desvio padrão. Note que, após o vigésimo trimestre, a autoridade monetária consegue controlar a inflação para patamares, em termos médios, menores que o alvo inflacionário.
A Fig. 2 mostra a evolução da lacuna de produção, sendo esta caracterizada ao longo de todo o processo por níveis acima do alvo fixado em 0,5%. Este resultado caracteriza um cenário positivo, demonstrando que a economia está crescendo com taxa maior que a fixada pelo Banco Central.
A intensidade do controle empregado em (36) é representada na Fig. 3, que mostra a evolução da taxa de juros controlada pelo Banco Central. Confirmando a conjuntura favorável dos demais indicadores econômicos, a taxa de juros, após o quinto trimestre, é menor em termos médios que o alvo fixado em 1,5%.
Percebemos, através das Figs. 1-3, que p, y e z, em termos médios, não alcançam com exatidão os seus respectivos alvos prescritos. Isto ocorre pois os alvos escolhidos não representam a condição de equilíbrio do sistema dinâmico (36).
A Fig 4 mostra a evolução do custo que tende a se estabilizar em termos médios após o décimo quinto trimestre. A linha horizontal em zero representa o limite mínimo, por definição, que o funcional de custo pode atingir. Frisamos que no Caso 2 o custo médio é maior que no Caso 1, devido a maior magnitude do ruído empregado no Caso 2 em relação ao Caso 1.
Podemos concluir, baseado nos resultados das Figuras 1-4, que o controle, em termos médios, e de maneira geral, obtém um bom comportamento de rastreamento dos alvos fixados após a resposta transiente que pode durar até 20 trimestres. Para tornar este transiente mais rápido, bastaria aumentar o peso relativo das matrizes Q frente às matrizes R do controle. Nessa situação verificar-se-á uma maior oscilação da taxa de juros.
6 CONCLUSÕES
Neste artigo, estudamos o problema de controle através da técnica de horizonte retrocedente em SLSM sujeito a ruído aditivo, sendo o tratamento com a inclusão de ruído ao modelo a nossa principal contribuição. Analisamos o SLSM sempre sob hipótese de que o Estado de Markov q não é observado, o estado x é observado e a distribuição µk|k e matriz são conhecidas. Em muitas aplicações o estado da cadeia subjacente não é conhecido, e o controlador desenvolvido minimiza o funcional de custo na classe de controles por realimentação linear sem dependência do estado da cadeia. O resultado é obtido através de operadores de evolução do valor esperado da matriz de momentos de segunda ordem da trajetória e do custo. Um procedimento variacional, que obtém a solução de acordo com condições necessárias de otimalidade, foi desenvolvido e implementado computacionalmente para a aplicação apresentada na seção anterior.
AGRADECIMENTOS
Agradecemos ao Prof. Dr. Thomas Vallee - Faculté des Sciences Économiques et de Gestion - Université de Nantes - França, pelo auxílio na formulação do sistema macroeconômico como um sistema SLSM com alvos dinâmicos.
Este trabalho contou com o apoio financeiro do projeto temático FAPESP Proc. 03/06736-7 e bolsa FAPESP Proc. 04/06947-0, do CNPq Proc. 300721/86-2 e PRONEX 015/98 'Controle de Sistemas Dinâmicos' e do CAPES.
Artigo submetido em 26/01/05
1a. Revisão em 22/03/05
ARTIGO CONVIDADO:
Versão completa e revisada de artigo apresentado no CBA-2004
Aceito sob recomendação do Editor Associado Prof. José Roberto C. Piqueira
Neste apêndice é apresentada a prova do Lema 1.
Prova: Das definições, as seguintes identidades são verdadeiras:
Neste apêndice desenvolvemos a prova da Proposição 5. Alguns resultados preliminares serão introduzidos.
t = 0, ¼, N - 1 que será útil na simplificação da expressão do funcional de custo. Podemos reescrever a equação acima de maneira equivalente à
em que na terceira igualdade utilizamos o fato de que o processo conjunto {x(t), q(t)} é markoviano (vide Teorema 2.19 em Çinlar, 1975, p.37)).
A prova do Lema a seguir está detalhada em (Vargas, 2004).
Lema 10Considere quaisquer seqüências Z = {Zi, i Î } Î r0, z = {zi, i Î } Î r e r = {ri, i Î } Î . A igualdade a seguir é válida:
com Lq(t), rq(t),0 e Kq(t),0definidos, respectivamente, como
Suponha que Vt Î r0, t = 0, ¼, N - 1, com = Fi, "i Î , satisfaz (16) e também vt Î r, t = 0, ¼, N - 1, com = -2Fi
i(N), "i Î satisfaz (17). Suponha ainda que wtÎ , t = 0, ¼, N - 1, com = i(N)¢ Fii(N), "i Î , satisfaz (18). com , e definidos, respectivamente, conforme (19)-(21).Lema 11O funcional (37) é expresso equivalentemente pela função quadrática
com
satisfazendo (16)-(18), respectivamente, com q(t) = i Î .Prova: Procedemos por indução. Para t = N, utilizamos (37) e obtemos
no qual o resultado segue imediatamente pelo fato que = Fq(N), = -2Fq(N)
q(N)(N) e = q(N)(N)¢ Fq(N)q(N)(N) para q(N) Î .Suponha que
seja válido.
Empregando o resultado do Lema 10 com Zq(t+1) = , podemos escrever (38) de maneira equivalente à
e a última passagem segue de (16)-(18). Desta maneira, o resultado é válido para t, completando a prova.
Prova da Proposição 5
Prova: Empregando a definição de (t) em (22), (37) e Lema 11, temos
válido para cada t = 0, ¼, N. Aplicando-se o Lema 1 em (41), obtemos (23).
Referências bibliográficas
- Bitmead, R. R., Gevers, M. e Wertz, V. (1990). Adaptive Optimal Control:the thinking man's GPC, Prentice Hall, Sydney, Australia.
- Camacho, E. F. e Bordons, C. (1999). Model Predictive Control, Springer-Verlag, London.
- Çinlar, E. (1975). Introduction to stochastic processes, Prentice Hall, New York.
- Costa, E. F. e do Val, J. B. R. (2000). Stability of receding horizon control of Markov jump linear systems without jump observations, American Control Conference, Chicago, USA, pp. 42894293.
- Costa, O. L. V. e do Val, J. B. R. (1998). Jump LQ-optimal control for discrete-time Markovian systems with stochastic inputs, Stochastic Analysis and Applications 16(5): 843858.
- Costa, O. L. V. e Fragoso, M. D. (1993). Stability results for discrete-time linear systems with Markovian jumping parameters, Journal of Mathematical Analysis and Aplications 179: 154178.
- Costa, O. L. V. e Fragoso, M. D. (1995). Discrete-time LQ-optimal control problems for finite Markov jump parameters systems, IEEE Transactions on Automatic Control 40: 20762088.
- Dennis, R. (2001). The policy preferences of the U.S. Federal Reserve, Federal Reserve Bank of San Francisco, Working Papers in Applied Economic Theory 08
- do Val, J. B. R. e Basar, T. (1999). Receding horizon control of jump linear systems and a macroeconomic policy problem, Journal of Economics Dynamics and Control 23: 10991131.
- Ji, Y. e Chizeck, H. J. (1990). Controllability, stabilizability and continuous-time Markovian jump linear quadratic control, IEEE Transactions on Automatic Control 35(7): 777788.
- Kwon, W. H., Bruckstein, A. M. e Kailath, T. (1983). Stabilizing state-feedback design via the moving horizon method, International Journal of Control 37: 631643.
- Mayne, D. Q., J. B. Rawlings, C. V. R. e Scokaert, P. O. M. (2000). Constrained model predictive control: stability and optimality, Automatica 36: 789814.
- Mayne, D. Q. e Michalska, H. (1990). Receding horizon control of nonlinear systems, IEEE Transactions on Automatic Control 35: 814824.
- Mosca, E. (1995). Optimal, Predictive, and Adaptive Control, Prentice Hall.
- Park, B.-G. e Kwon, W. H. (2002). Robust one-step receding horizon control of discrete-time Markovian jump uncertain systems, Automatica 38(7): 12291235.
- Park, B.-G., Kwon, W. H. e Lee, J.-W. (2001). Robust receding horizon control of discrete-time Markovian jump uncertain systems, IEICE Trans. on Fundamentals 9: 22722279.
- Rudebusch, G. D. e Svensson, L. E. O. (1998). Policy rules for inflation targeting, National Bureau of Economic Research Conference on Monetary Policy Rules
- Vargas, A. N. (2004). Controle por horizonte retrocedente de sistemas lineares com saltos markovianos e ruído aditivo, Dissertação de Mestrado, Universidade Estadual de Campinas. Disponível eletronicamente em http://libdigi.unicamp.br/
APÊNDICE A
APÊNDICE B
, contemplando alvos dinâmicos. Definimos, para um controle n = (, uma variável aleatória na formaRelembramos, primeiramente, que q(t) e p(N) são definidos conforme , contemplando alvos dinâmicos. Definimos, para um controle n = (K, r) Î , uma variável aleatória na forma
Datas de Publicação
-
Publicação nesta coleção
08 Maio 2006 -
Data do Fascículo
Dez 2005
Histórico
-
Aceito
22 Mar 2005 -
Revisado
22 Mar 2005 -
Recebido
26 Jan 2005