Resumos
Este artigo trata do problema de identificação de Sistemas a Eventos Discretos Max-plus lineares mono-entrada e mono-saída. O objetivo é estimar os parâmetros temporais do sistema a partir da observação dos instantes de disparo das transições de entrada e de saída, supondo que alguns parâmetros estruturais sejam conhecidos. A partir dessas condições, o método de identificação proposto é desenvolvido tendo como base o cálculo de um limitante superior para o parâmetro de temporização do ciclo. Obtém-se uma condição suficiente de excitação, relativa à variável de entrada, para a convergência do algoritmo proposto. Exemplos ilustram o método proposto.
Sistemas a Eventos Discretos; Identificação de Sistemas; Álgebra Max-plus; Grafos de Eventos Temporizados
This paper deals with the identification problem of Max-plus linear Discrete Event Systems with single input and single output. The objective is to estimate the temporal parameters of the system by using the observation of input and output transition firing times assuming that some structural parameters are known. With those assumptions, the identification method is developed by using an upper bound for cycle duration. The paper presents a sufficient excitation condition, concerning the input signal, for the convergence of the algorithm. Examples Illustrate the proposed method.
Discrete Event Systems; System Identification; Max-plus Algebra; Timed Event Graphs
SISTEMAS A EVENTOS DISCRETOS
Identificação de Sistemas a Eventos Discretos Maxplus lineares
Carlos Andrey MaiaI; Rafael Santos MendesII; Laurent HardouinIII
IDepto. de Engenharia Elétrica - UFMG - Av. Antônio Carlos 6627 - Pampulha - 31270-010 Belo Horizonte - MG - Brasil - maia@cpdee.ufmg.br
IIFaculdade de Engenharia Elétrica e de Computação - UNICAMP - DCA/FEEC/UNICAMP-C.P. 6101 - 13083-970 Campinas - SP - Brasil - rafael@dca.fee.unicamp.br
IIILaboratoire d'Ingénierie des Systèmes Automatisés - ISTIA/Université d'Angers - Av. Notre Dame du Lac 62 - 49000 Angers - França - laurent.hardouin@istia.univ-angers.fr
RESUMO
Este artigo trata do problema de identificação de Sistemas a Eventos Discretos Max-plus lineares mono-entrada e mono-saída. O objetivo é estimar os parâmetros temporais do sistema a partir da observação dos instantes de disparo das transições de entrada e de saída, supondo que alguns parâmetros estruturais sejam conhecidos. A partir dessas condições, o método de identificação proposto é desenvolvido tendo como base o cálculo de um limitante superior para o parâmetro de temporização do ciclo. Obtém-se uma condição suficiente de excitação, relativa à variável de entrada, para a convergência do algoritmo proposto. Exemplos ilustram o método proposto.
Palavras-chave: Sistemas a Eventos Discretos, Identificação de Sistemas, Álgebra Max-plus, Grafos de Eventos Temporizados.
ABSTRACT
This paper deals with the identification problem of Max-plus linear Discrete Event Systems with single input and single output. The objective is to estimate the temporal parameters of the system by using the observation of input and output transition firing times assuming that some structural parameters are known. With those assumptions, the identification method is developed by using an upper bound for cycle duration. The paper presents a sufficient excitation condition, concerning the input signal, for the convergence of the algorithm. Examples Illustrate the proposed method.
Keywords: Discrete Event Systems, System Identification, Max-plus Algebra, Timed Event Graphs.
1 INTRODUÇÃO
Diversas tecnologias presentes em processos de manufatura, redes de comunicação, controle de tráfego aéreo, etc., podem ser descritas por modelos com algumas características em comum. Nestes sistemas, o espaço de estados é em geral discreto (em muitos casos finito) e mudanças de estado acontecem somente em resposta à ocorrência de eventos. Essas características os distinguem dos sistemas que tem sua dinâmica dirigida pelo tempo e seu espaço de estado contínuo, cuja modelagem é tradicionalmente feita através das equações diferenciais e das equações a diferenças. Tais sistemas são denominados Sistemas a Eventos Discretos (SED) (Cassandras e Lafortune, 1999). Uma maneira formal de descrever SED é através de Redes de Petri (Murata, 1989) sendo as Redes de Petri temporizadas particularmente úteis quando há interesse em avaliar o desempenho do sistema.
Este artigo trata da abordagem Max-plus. Esta técnica fundamenta-se em resultados algébricos relativos aos semi-anéis idempotentes (também chamados de dióides) e na Teoria de Residuação, cujas bases são sumariadas na seção 2. Sua principal característica é descrever a dinâmica de SED a partir de um sistema de equações algébricas lineares, escritas numa álgebra não convencional (Cohen et al., 1985). Quando SED apresentam fenômenos de sincronização de tarefas e de retardo no tempo, mas não há conflito na utilização de recursos, eles podem ser descritos pela álgebra Max-plus, sendo denominados SED Max-plus lineares (SEDMpl). Exemplos desses sistemas são as linhas de montagem em processos de manufatura. Conforme será discutido na seção 2, o comportamento desses tipos de SED coincide com o comportamento dos Grafos de Eventos Temporizados (GET) que são uma subclasse de Redes de Petri na qual todos os lugares têm uma única transição de entrada e uma única transição de saída (Baccelli et al., 1992). O uso dos GET como ferramenta gráfica facilita a compreensão da dinâmica dos SEDMpl.
Dois problemas centrais no estudo de SEDMpl são a identificação e o controle do sistema. O problema de controle é usualmente formulado dentro de um contexto just-in-time visando à minimizaçao dos estoques do sistema (Menguy et al. (2000b), Cottenceau et al. (2001), Lüders e Santos-Mendes (2002), Maia, Hardouin, Santos-Mendes e Cottenceau (2003)). O estudo da identificação de SEDMpl é abordado por que propõem a identificação paramétrica baseada na resposta impulsiva do modelo. A abordagem considera a estimação de dois modelos ARMA: um para o regime transitório e outro para o comportamento periódico. Gallot et al. (1998) consideram a identificação a partir da resposta impulsiva do sistema baseada na decomposição do sistema em uma soma de sub-sistemas de primeira ordem (a resposta impulsiva é decomposta em uma soma de termos chamados elementos simples). Dessa forma o método consiste na estimação de parâmetros de diversos sistemas de primeira ordem. Menguy et al. (2000a) desenvolvem um algoritmo para a identificação não-paramétrica (direta) baseado no refinamento da estimativa da resposta impulsiva.
Este trabalho apresenta novos resultados (notadamente sobre as condições de excitação do sistema) para o método de identificação paramétrica de SEDMpl com uma entrada e uma saída (SEDMpl SISO) similar aos propostos por Maia, Santos-Mendes e Hardouin (2003) e Maia (2003). Nesse método supõem-se conhecidos o número de disparos durante o período transitório (i.e. o comprimento do transitório) e o número de disparos ocorridos em cada ciclo do regime permanente. Este último parâmetro está relacionado com o número de fichas no circuito crítico do GET. Por outro lado, são consideradas desconhecidas as durações temporais do transitório e do ciclo do regime permanente. Estes parâmetros devem ser estimados juntamente com os parâmetros que definem completamente a resposta transitória e o comportamento em regime do sistema. A principal contribuição em relação aos métodos propostos anteriormente é que, conhecida a estrutura do modelo, o modelo estimado é mais próximo do modelo real do sistema do que o obtido pelo cálculo direto da maior resposta impulsiva.
O artigo é organizado da maneira seguinte. A introdução às ferramentas matemáticas básicas para a compreensão do artigo é feita na seção 2. O método de identificação é apresentado na seção 3, na qual os parâmetros supostos conhecidos e os parâmetros a serem estimados são formalmente explicitados. Na seção 4, são apresentados alguns exemplos ilustrativos e a conclusão é feita na seção 5.
2 PRELIMINARES
2.1 Sistemas max-plus lineares
Os resultados apresentados a seguir são extensivamente abordados em Baccelli et al. (1992).
Considere-se, a título de exemplo, o GET ilustrado pela figura 1, representando um sistema de montagem cuja produção máxima é de uma peça a cada duas unidades de tempo. Nessa figura u é a transição de entrada à qual serão associados os instantes de admissão de matéria-prima ao sistema; xi são as transições internas (doravante também chamadas de estados) e y é a transição de saída, que representa a conclusão do processo de montagem. Como é usual na literatura, a mesma notação será utilizada para designar uma transição de um GET e o instante de tempo de disparo (admissão de um produto em um dado setor do sistema) da transição. Dessa forma, o comportamento dinâmico do sistema é descrito pelas equações a seguir.
A variável inteira k corresponde à numeração do disparo, convencionando-se que k=0 corresponde ao primeiro disparo e k=n ao (n+1)-ésimo disparo.
Renomeando o operador max como sendo Å e o operador + como sendo Ä, pode-se reescrever:
Tem-se portanto um sistema de equações recursivas lineares numa nova álgebra que é um semi-anel idempotente (ou dióide) e se caracteriza por um conjunto e duas operações (soma e produto), notado (D, Å, Ä), tal que a soma seja associativa, comutativa e idempotente (a Å a = a), e o produto seja associativo (mas não necessariamente comutativo) e distributivo à esquerda e à direita em relação à soma. Além disso, devem existir elementos neutros para ambas as operações, notados por e (elemento nulo) e por e (elemento unitário), e o elemento nulo deve ser absorvente em relação ao produto, isto é, "a Î D, a Å e = a; a Ä e = a; a Ä e = e. Percebe-se que o conjunto z_bastão È {-¥} munido das duas operações Å º max e Ä º + é um dióide, no qual e = -¥ e e = 0. Num dióide uma relação de ordem é definida como a b Û b = a Å b. Em geral, um dióide é completo se ele for fechado em relação a somas infinitas e se o produto for distributivo em relação a somas infinitas, sendo o seu maior elemento denotado por T (topo). A operação Ù (ínfimo) é definida em a Ù b como sendo o maior elemento do dióide menor do que a e menor do que b. A estrutura (È {-¥} È {¥}, max, +) é um dióide completo usualmente denominado "max-plus" e notado por .
O exemplo mostrado na figura 1 utiliza o que se convenciona chamar de datadores, isto é, sequências crescentes {x(k)} que representam as datas ou instantes de ocorrência dos disparos da transição x.
De modo análogo ao que ocorre na teoria de sistemas contínuos, as manipulações das equações de SEDMpl ficam facilitadas se forem utilizadas transformadas das sequências de datadores definidas de modo semelhante ao das clássicas transformadas Z. Define-se, portanto, a g-transformada de uma sequência {x(k)} como sendo x(g) = x(k) gk, sendo g uma variável abstrata cujo significado é o de um operador "atraso em contagem", pois é imediato constatar que y(g) = gx(g) Û {y(k)} = {x(k - 1)}. As equações 1, submetidas à g-transformada resultam no seguinte sistema de equações algébricas:
É possível definir operações de soma e multiplicação entre séries formais do tipo
x(k) gk, utilizando-se para isso a soma e o produto adotados para combinados com os procedimentos usuais para somar e multiplicar séries formais. O conjunto de todas as séries formais em g, munido dessas duas operações também é um dióide, isto é, satisfaz a todas as propriedades utilizadas para caracterizar um dióide, sendo denominado . A valoração, um conceito que será utilizado a seguir, de uma série h em é o menor expoente de coeficiente não-nulo, sendo representado por val(h).A equação 2 pode ser colocada em forma matricial, resultando em x(g) = A(g)x(g) Å B(g)u(g) e y(g) = C(g)x(g), sendo A, B e C matrizes na variável abstrata gama de dimensões apropriadas e u(g), y(g) e x(g) vetores associados respectivamente às transições de entrada, de saída e internas ao sistema. De modo geral, em qualquer dióide, equações do tipo x = ax Å b tem como solução mínima x = a*b, sendo a* = e a0 = e. Esse resultado, chamado de teorema da estrela1 (Baccelli et al., 1992), pode ser generalizado para as equações matriciais anteriores, levando a y = CA*Bu, ou de modo sintético:
Nessa equação, h(g) = CA*B é chamada de função de transferência do sistema e (como na teoria de sistemas contínuos) coincide com a resposta do sistema a uma entrada impulsiva, u(g) = e, que corresponde a infinitos disparos da transição de entrada em t = 0. Conforme mostrado em Baccelli et al. (1992) todo SEDMpl SISO tem uma resposta impulsiva periódica que pode ser colocada na seguinte forma:
sendo p(g) = pi gi, pi Î e q(g) = qj gj, qi Î polinômios e n Î , s Î e r Î respectivamente o comprimento do transitório, a duração e o comprimento do regime permanente. O algoritmo de identificação proposto deverá, portanto, estimar os coeficientes dos polinômios p(g) e q(g) assim como o parâmetro s (duração do ciclo do regime permanente)2. Vale observar na equação 4, que h(i) = pi para (i < n) e que h(j) = qi para (j < r). A figura 2 ilustra graficamente o comportamento de uma série periódica.
Em algumas situações pode ser interessante trabalhar no domínio dos datadores. Nesse domínio a equação 3 é escrita como
Em outras palavras, isso significa que a saída é o resultado da convolução da entrada e da resposta ao impulso do GET. Esse resultado é obtido diretamente a partir da substituição da equação 4 na equação 3.
2.2 Teoria da residuação
As formulações discutidas na próxima seção envolvem a inversão de funções, isto é, a solução em x de equações do tipo y = f(x). Diferentemente do caso da álgebra tradicional a solução desse tipo de equação no dióide pode apresentar um número infinito de soluções ou nenhuma solução. A Teoria da Residuação (Blyth e Janowitz, 1972) se ocupa justamente da solução deste problema em conjuntos parcialmente ordenados. A seguir, alguns resultados fundamentais relativos a essa teoria serão apresentados.
Consideram-se inicialmente os mapeamentos f : ® , sendo e dióides completos. Se f for isotônico (preserva o ordenamento, i.e, x y Û f(x) f(y) ) e se existir um elemento máximo xop do conjunto {x | y f(x), x Î , y Î }, diz-se que xop é o resíduo do mapeamento f em y. Se f tiver um resíduo em qualquer ponto y Î , o mapeamento f é dito residuável, sendo o resíduo denotado por (y) (Baccelli et al., 1992). Dualmente, o mínimo do conjunto {x | y f(x), x Î , y Î }, se ele existir, é denominado resíduo dual sendo denotado por (y) e o mapeamento f é dito dualmente residuável.
As funções La(x) = a Ä x e Ra(x) = x Ä a são residuáveis, sendo seus resíduos denotados respectivamente por e . No caso particular do dióide tem-se = = x - a (operação de subtração da álgebra tradicional). A definição de residuação assegura que:
A função T(x) = x Å a é dualmente residuável, sendo seu resíduo dual denotado por x a. Por exemplo, no dióide , 3 1 = 3, pois, pela definição de resíduo dual, 3 1 é a menor solução da equação max(x, 1) > 3.
Conforme visto anteriomente, o dióide é importante para a descrição da dinâmica de um GET. Algumas propriedades das séries descritas nesse dióide, fundamentais para este artigo, são apresentadas a seguir.
Propriedade 1 (Maia (2003)) O datador associado à série (trajetória não decrescente) w(g) = y(g) x(g) é dado por w(k) = (y(i) x(i)).
Lema 2 (Residuação de séries)Sejam duas séries do dióide, u(g) = u(k) gk e v(g) = v(k) gk, então:
Vale dizer que a expressão (v(l) u(l + k)) corresponde ao coeficiente de gk, sendo (Ù) o operador min3 e v(l) u(l + k) = u(l + k) - v(l) (operação de subtração da álgebra tradicional). Convém ainda relembrar a definição de residuação, que assegura que y(g) = v(g) u(g) é a maior série tal que v(g) Ä y(g) u(g). Maiores detalhes sobre a residuação de séries são apresentados por Baccelli et al. (1992). Programas para a manipulação de séries na álgebra de dióides usando o pacote computacional SCILAB podem ser encontrados em http://www.istia-angers.fr/hardouin/outils.html.
3 MÉTODO DE IDENTIFICAÇÃO
No desenvolvimento do método proposto, assume-se que um modelo para o sistema existe e é expresso pela equação 3. A estrutura, i.e. parâmetros n e r (equação 4 ), é também suposta conhecida. O objetivo do método de identificação é, então, estimar os polinômios desconhecidos p(g), q(g) e a duração do período s. Mostra-se (Maia, 2003) que esse sistema pode ser representado pelas equações seguintes no dióide :
com condições iniciais tais que z(k) = u(k) = y(k) = e para k < 0 , sendo z(k) uma variável que modela o comportamento do ciclo.
Seguindo o mesmo raciocínio clássico da teoria de identificação para sistemas dinâmicos contínuos (Ljung, 1987), y(k) pode ser reescrito como:
sendo = [u(k) ¼ u(k - n + 1)z(k - n) ¼ z(k - n - r + 1)] o vetor de regressão e q = [p0¼ pn - 1 q0¼ qr - 1]T o vetor de parâmetros a ser estimado.
Dessa forma, a partir da observação de N disparos das transições de saída e de entrada, obtém-se a equação matricial:
na qual F = [j0¼ jN]T é a matriz de regressão e Y = [y(0) ¼ y(N)]T é o vetor de saída observado.
Para estimação do parâmetro q, é conveniente a definição de um critério de erro como
sendo a saída do modelo estimado ((k) = F Ä ) tal que (k) < y(k). Esse critério significa que, para uma mesma entrada, o melhor modelo deve produzir a maior saída possível que seja menor que a saída observada, i.e., deve-se escolher o maior tal que F Ä
Y.Por enquanto, apenas para o desenvolvimento do algoritmo, assume-se que a variável z é conhecida. Assim, um estimador ótimo para o critério J() é obtido diretamente através da Teoria da Residuação,
Explicitamente, a solução dessa equação é dada por:
Nota-se que
i > pi e j> qj pois é a maior solução de F Ä Y . Conseqüentemente, é uma solução para a equação (10), i.e., Y = F Ä . Esse resultado implica que i e j satisfazem a equação (8) para k = 1, ..., N. Atribuindo u(k) = y(k) = T para k > N (isso significa que nenhum evento ocorre para k > N), a equação (8) é satisfeita para todo k Î z_bastão. Dessa maneira, a aplicação da transformação g resulta em
Propriedade 3 A condição necessária e suficiente para a convergência do estimador apresentado nas equações 13 é: "i Î [0 n - 1], $k¢ Î [0 N] tal que y(k¢) = p(i) + u(k¢ - i). Analogamente, para a condição necessária e suficiente é: "j Î [0 r - 1] , $k¢ Î [0 N] tal que y(k¢) = q(j) + z(k - n - j).
Prova: Como i = u(k - i) y(k), a necessidade é obtida lembrando-se que para u(k - i) e y(k) finitos tem-se u(k - i) y(k) = y(k) - u(k - i). A suficiência é obtida através do fato de que é máximo e de que y(k¢) = p(i) + u(k¢ - i) implica em i< pi, ou seja, esses dois fatos resultam em i = pi. Para , a demonstração é análoga.
Contudo esse resultado tem pouca utilidade prática já que não explicita como deve ser a excitação do sistema para que a estimação seja correta. Uma condição de excitação suficiente é apresentada na proposição 5.
Lema 4Se a excitação do GET é tal que 0 < u(k) < (h(g) h(g))(k) para 0 < k < N então y(k) = h(k).
Prova:Pela fórmula 5, y(k) = h(l) Ä u(k - l). Dessa forma, y(k) > h(k) pois u(i) > 0 para 0 < i < N. Por outro lado: y(k) < h(l) (h(g) h(g)) (k - l) = h(l) (h(i) h(i + k - l)) < h(l) (h(l) h(k)), pois o lema 2, assegura que (h(g) h(g))(k - l) = h(i) h(i + k - l). Assim pela inequação 6, h(l)(h(l) h(k)) < h(k) = h(k) e, portanto, y(k) < h(k) para 0 < i < N. Como já foi mostrado que y(k) > h(k), conclui-se que y(k) = h(k).
Como conseqüência desse lema, se e u(g) h(g) h(g) então y(g) = h(g), em outras palavras h(g) h(g) é a maior entrada tal que a saída seja igual à resposta ao impulso. A interpretação desse resultado para um sistema de manufatura é que h(g) h(g) fornece os instantes máximos de disparo da transição de entrada u(g) de forma que a saída permaneça inalterada e igual a h(g). Em teoria de identificação de sistemas contínuos (Ljung, 1987), quando um sinal consegue excitar toda a faixa dinâmica de um sistema, diz-se que esse sinal é um "sinal de excitação rico" para o sistema. Analogamente, devido ao lema 4, uma seqüência de disparos da transição de entrada será considerada um "sinal de excitação rico" para um GET, se a condição e u(g) h(g) h(g) for verificada.
Proposição 5 Se o parâmetro s é conhecido e o sinal de entrada u é suficientemente "rico" (i.e., 0 < u(k) < (h(g) h(g))(k) para 0 < k < N sendo N > n + r - 1) então os estimadores dados em 13 convergem para os parâmetros reais do sistema, precisamente i = pi e j = qj para i Î [0 n - 1] e j Î [0 r - 1].
Prova: As hipóteses desta proposição para o sinal de entrada implicam, de acordo com o lema 4, que y(k) = h(k) para 0 < k < N. Dessa forma, i = u(k - i) h(k) < u(0) h(i) < h(i) = pi (i < n) pois u(0) > 0. Além disso, se s é conhecido, então z é também conhecido e os estimadores propostos sempre asseguram que i > pi e j > qj, pois eles são as maiores soluções para o problema. Assim, conclui-se que i = pi. O mesmo raciocínio é aplicado para a estimativa j lembrando que qj = h(n + j) para j < r.
Convém observar que se u(k) - u(0) < (h(g) h(g))(k), o estimador também converge. De fato, fazendo u(k) = (k) + u(0) = (k) Ä u(0) , então y(k) = (k) Ä u(0) sendo (k) = h(l) Ä (k - l). Do mesmo modo, mostra-se que z(k) = (k) Ä u(0). Dessa forma, a diferença entre os datadores (u, y, z) e (, , ) é o termo u(0). Como os resíduos das equações 13 são calculados a partir de diferenças entre datadores, o resultado obtido utilizando (u, y, z) é mesmo que se obtém utilizando (, , ).
Nota 6 Se u(k1) >> u(k1 - 1) para k1 > 0, então y(k1 + j) = u(k1) Ä (h(j - l) Ä (l)) para j > 0, sendo u(k1 + j) = u(k1) + (j) = u(k1) Ä (j). Esse resultado permite escrever a saída como y(k1 + j) = u(k1) Ä (j) sendo a saída do sistema para a entrada , ou seja, a partir do k1-ésimo disparo, o sistema desconsidera a influência dos disparos anteriores. Do mesmo modo, a variável interna é escrita como z(k1 + j) = u(k1) Ä (j) sendo a trajetória obtida utilizando a entrada . Como conseqüência dessa observação, se (i) < (h(g) h(g))(i) para 0 < i < n + r - 1, então os estimadores também convergem conforme observado anteriormente. De fato, sabe-se que:
Como u é crescente e u(k1) >> u(k1 - 1) então o segundo somatório é maior que o primeiro. Assim, como u(k1 + j) = u(k1) Ä (j), tem-se que:
Fazendo l = i - k1, obtém-se que y(k1 + j) = u(k1)(h(j - l) Ä (l)). Seguindo o mesmo argumento, mostra-se que z(k1 + j) = u(k1) Ä (j) sendo a trajetória obtida utilizando a entrada .
Uma interpretação para a situação apresentada na nota 6é que após o (k1 - 1)-ésimo disparo da transição de entrada espera-se um tempo tal que o sistema retorne à condição de "relaxado"4 para só assim disparar novamente essa transição. Dessa forma, a menos da translação temporal u(k1), o sistema passa a responder a partir do k1-ésimo disparo como se estivesse no início do processo.
Propriedade 7 Para o estimador proposto tem-se sempre 0 = p0, ou seja, 0 sempre converge para o valor real independentemente das condições de excitação do sistema.
Prova: Isso se deve o fato de que 0 = u(k) y(k) < u(0) y(0) = y(0) - u(0). Como y(0) = p0Ä u(0) = p0 + u(0), então 0< p(0). Entretanto, como discutido anteriormente, 0> p0, logo 0 = p0.
A estimação dos parâmetros qj apresentada nas equações 13 requer o conhecimento da variável z. Essa variável é desconhecida mas pode ser estimada. Se uma estimativa de s (representada por ) é disponível, então uma estimativa de z (representada por ) é obtida iterativamente segundo a equação (8), ou seja,
Dessa forma, estima-se a variável z a partir da estimativa de s. Para a estimativa da duração do período, s, deve-se recordar que as estimativas dadas na equação 13 devem satisfazer a equação 14. A partir desse resultado, demonstra-se a proposição 8.
Proposição 8 Um limitante superior de s é calculado a partir das expressões abaixo:
sendo L = e u(g) e y(g) respectivamente5 as séries correspondentes aos dados da entrada e da saída do sistema.
Prova: A demonstração é apresentada por Maia (2003) e utiliza os resultados da propriedade 1 e do lema 2.
Dessa forma, utiliza-se neste artigo o estimador para s como sendo = sup.
Uma condição suficiente para a convergência do estimador proposto é apresentada a seguir. Convém lembrar que para que os efeitos da periodicidade da função de transferência sejam percebidos na saída é sempre necessário pelo menos n + r observações dos disparos da transição de saída (ver figura 2).
Proposição 9 (Maia (2003)) Sejam winf(g) ¹ e, vw = val(winf(g)) e o número de observações tal que N > r + vw. Se 0 < u(k) < (h(g) h(g))(k) para 0 < k < N, então = s.
Vale ressaltar que a condição de convergência apresentada na proposição 9 é ampliada se o sinal de entrada satisfaz às hipóteses apresentadas na nota 6 para k1< k < k1 + N e vw > k1.
Finalmente, o método de identificação é sintetizado no algoritmo mostrado a seguir.
Algoritmo
begin
Iniciar variáveis: z(k) = u(k) = y(k) = -¥ para k < 0.
Coletar N > n + r pares de dados de entrada e saída (u(k), y(k));
fork = 0, ..., N
end
end
4 EXEMPLOS ILUSTRATIVOS
A figura 3 representa um GET que modela um sistema de montagem com 3 máquinas representadas pelos símbolos M1, M2 e M3. Sejam u e y respectivamente os datadores das transições de entrada e de saída e x1, x2 e x3 os datadores das transições internas desse GET. Utilizando a transformação g, obtém-se o sistema de equações (16) que relaciona essas variáveis no dióide .
A partir do teorema da estrela apresentado na introdução, obtém-se a equação que relaciona a entrada e a saída do sistema
sendo h(g) = 17 Å 21 g Å (25g2)(6g)* = 17 Å 21g Å 25g2 Å 31g3Å 37g5 Å 43g5 ¼] a função de transferência que apresenta parâmetros estruturais n = 2 e r = 1. Em outras palavras, a seqüência de disparos da resposta impulsiva é h = [17 21 25 31 37 43 ¼].
A planta descrita pela equação 17 será utilizada a seguir em diversas condições de excitação para ilustrar a aplicabilidade do método de identificação proposto. Nesse caso, a máxima entrada que garante a "excitação rica" do sistema é uh(g) = h(g) h(g) = 0 Å 4g Å 8g2 Å 14g3 Å 20g5Å 26g5 ¼, ou seja, a seqüência de disparos é dada por uh = [0 4 8 14 20 26 ¼]. Em cada exemplo, o par de entrada e saída (uh, h) é mostrado nos gráficos em linhas pontilhadas.
Exemplo 10 Considere-se a seqüência de disparos da transição de entrada dada por u = [0 2 5 8 17 20]. Conseqüentemente, a seqüência de disparos da transição de saída é y = [17 21 25 31 37 43]. A figura 4 mostra essas seqüências e o comportamento do GET em linhas pontilhadas quando a entrada é uh. Nesse caso, observa-se que u uh e que a condição de excitação do sistema satisfaz a hipótese da proposição 9. Como conseqüência, a aplicação do método de identificação proposto resulta em 0 = 17, 1 = 21, 0 = 25 e = 6. Isto é, o método converge para os parâmetros reais do sistema.
Exemplo 11 Neste exemplo, supõe-se que a seqüência de disparos da transição de entrada seja dada por u = [0 5 9 15 19 21]. Assim, a seqüência de disparos correspondentes para transição de saída é y = [17 22 26 32 37 43]. Esses dados são mostrados na figura 5. A aplicação do método de identificação proposto resulta em 0 = 17, 1 = 21, 0 = 25 e = 6. Isto é, o método converge para os parâmetros reais do sistema embora a condição de excitação não satisfaça a hipótese da proposição 9 (i.e. u uh). Esse exemplo mostra que a proposição é suficiente para convergência mas não necessária.
Exemplo 12 Um outro exemplo de simulação utiliza uma seqüência de disparos da transição de entrada dada por u = [0 3 11 15 17 27] cuja seqüência de disparos da transição de saída é y = [17 21 28 32 37 44]. Esses dados são apresentados na figura 6. Neste exemplo a condição de excitação é tal que u uh e os resultados obtidos pelo método de identificação são: 0 = 17, 1 = 24, 0 = e e = T. Nesse caso, os parâmetros não convergiram para os valores reais. Pode-se fazer uma analogia dessa situação com o caso de excitação "pobre" em sistemas dinâmicos contínuos.
Exemplo 13 A figura 7 mostra outra simulação para uma seqüência de disparos da transição de entrada dada por u = [0 7 15 22 30 37] cuja seqüência de disparos da transição de saída é y = [17 24 32 39 47 54]. Nesse caso, novamente a condição de excitação não é satisfeita (u uh). Os resultados obtidos pelo método de identificação são: 0 = 17, 1 = 24, 0 = e e = T, isto é, os parâmetros não convergiram para parâmetros reais da planta.
Exemplo 14 Nesta simulação a entrada é dada por u = [0 26 30 33 33 33] e a saída correspondente é y = [17 43 47 51 57 63]. A figura 8 mostra essas seqüências. Nesse caso, observar que u uh. Como aconteceu no exemplo 11, 0 = 17, 1 = 21, 0 = 25 e = 6, ou seja, mesmo não satisfazendo a condição suficiente de excitação, os resultados obtidos mostram que estimadores convergem para os parâmetros reais do modelo da planta.
Os exemplos 12 e 14 ilustram o fato que se a excitação u1 leva a uma estimação não-convergente então a excitação u2
u1 não necessariamente leva a uma estimação não convergente. Esse ponto pode ser compreendido com o auxílo na nota 6.O exemplo 13 ilustra particularmente o fato de que se incrementos na trajetória de u são muito grandes em relação aos de h, ou seja, a inclinação de u é suficientemente maior que a de h, o algoritmo de estimação sempre resulta em qj = e e s = T. Isso se deve ao fato de que se u(k) - u(k - 1) é suficientemente grande para todo k Î então as desigualdades h(0) Ä u(k) h(1) Ä u(k - 1) ¼ são verdadeiras. Como y(k) = h(l) Ä u(k - l) e pela equação 4, pi = h(i) para i Î [0 n - 1], então essas desigualdades permitem escrever que y(k) = p(l) Ä u(k - l). Dessa forma é tal que y(k) =
l Ä u(k - l), ou seja, é um modelo que assegura que o critério de erro é nulo. Intuitivamente, esse fato corresponde à situação em que a entrada de matéria-prima no sistema é lenta ao ponto de só se observarem fenômenos transitórios, isto é, a taxa de chegada de matéria-prima não permite que o polinômio q(g) influencie na solução. Dessa forma, segundo o método de estimação apresentado no algoritmo 1, winf(g)(k) = e e, conseqüentemente, c(g)(k) = T para todo k Î . Finalmente, isso resulta em = T e, para um número de observações N > 2r + n - 1, tem-se que qj = e para j Î [0 r - 1].A tabela 1 resume as condições de convergência observadas para os exemplos apresentados.
5 CONCLUSÃO
Este artigo apresentou alguns resultados para a estimação dos parâmetros temporais para SED Max-plus lineares que são uma extensão do trabalho apresentado por Maia, Santos-Mendes e Hardouin (2003). O método se baseia no conhecimento do comprimento do transitório e do comprimento do ciclo em regime permanente (respectivamente, parâmetros n e r) e visa à estimação das durações do transitório e do ciclo em regime permanente (respectivamente, parâmetros qo e s) assim como a estimação dos demais coeficientes do polinômios p(g) e do polinômio q(g). As principais contribuições são relativas às condições de excitação do sistema que asseguram a convergência do método. Vale dizer que o modelo desenvolvido para a estimação utiliza uma variável interna desconhecida para modelar o comportamento do circuito crítico e a estimação dessa variável interna apresenta dificuldades e constitui uma limitação para o método, devendo portanto ser objeto de atenção em trabalhos futuros. Outro resultado apresentado é a determinação de um majorante para a duração do ciclo em regime permanente (parâmetro s) mesmo que as condições suficientes de excitação definidas pela proposição 9 não sejam respeitadas.
Artigo submetido em 15/12/2004
1a. Revisão em 04/02/2005;
2a. Revisão em 12/04/2005;
ARTIGO CONVIDADO:
Versão completa e revisada de artigo apresentado no CBA-2004
Aceito sob recomendação do Ed. Assoc. Prof. Paulo Eigi Miyagi
Referências bibliográficas
- Baccelli, F., Cohen, G., Olsder, G. e Quadrat, J. (1992). Synchronisation and Linearity: An Algebra for Discrete Event Systems, John Wiley and Sons, New York.
- Blyth, T. e Janowitz, M. (1972). Residuation Theory, Pergamon Press, Oxford.
- Boimond, J., Hardouin, L. e Chiron, P. (1995). A Modeling Method of SISO Discrete-Event Systems in Max-Algebra, ECC'95, Rome, Italy, pp. 2023-2026.
- Cassandras, C. G. e Lafortune, S. (1999). Introduction to Discrete Event Systems, Kluwer Academic Publishers.
- Cohen, G., Dubois, D., Quadrat, J. e Viot, M. (1985). A linear system theoretic view of discrete event processes and its use for performance evaluation in manufacturing, IEEE Trans. on Automatic Control AC-30: 210-220.
- Cottenceau, B., Hardouin, L., Boimond, J. e Ferrier, J. (2001). Model Reference Control for Timed Event Graphs in Dioid, Automatica 37: 1451-1458.
- Gallot, F., Boimond, J. e Hardouin, L. (1998). Identification of Linear Systems using MA and ARMA Models in Dioids, IFAC Conference Structure and Control, Nantes, France.
- Ljung, L. (1987). System Identification : Theory for the User, Prentice Hall.
- Lüders, R. e Santos-Mendes, R. (2002). Generalized Multivariable Control of Discrete Event Systems in Dioid, 6th International Workshop on Discrete Event Systems (WODES'02), Zaragoza, Spain.
- Maia, C. A. (2003). Identificaçăo e Controle de Sistemas a Eventos Discretos na Álgebra (max,+), Tese de doutorado, UNICAMP, Campinas, SP, Brasil.
- Maia, C. A., Hardouin, L., Santos-Mendes, R. e Cottenceau, B. (2003). Optimal Closed-loop of Timed Event Graphs in Dioids, IEEE Trans. on Automatic Control 48(12): 2284-2287.
- Maia, C. A., Santos-Mendes, R. e Hardouin, L. (2003). Some Results on Identification of Timed Event Graphs in Dioids, 11th Mediterranean Conference on Control and Automation (MED'03), Rodes, Grécia.
- Menguy, E., Boimond, J., Hardouin, L. e Ferrier, J. (2000a). A First Step Towards Adaptive Control for Linear Systems in Max Algebra, Discrete Event Dynamic Systems.Theory and Applications 10: 347-367.
- Menguy, E., Boimond, J., Hardouin, L. e Ferrier, J. (2000b). Just-in-time Control of Timed Event Graphs Update of Reference Input, Presence of Uncontrollable Input, IEEE Trans. on Automatic Control 45(11): 2155-2158.
- Murata, T. (1989). Petri nets : properties, analysis and applications., Proceedings of the IEEE 77(4): 541-580.
Datas de Publicação
-
Publicação nesta coleção
08 Maio 2006 -
Data do Fascículo
Dez 2005
Histórico
-
Aceito
12 Abr 2005 -
Revisado
04 Fev 2005 -
Recebido
15 Dez 2004