Resumos
Os modelos bivariados tem sido utilizados com sucesso na análise de processos hidrológicos. Neste trabalho, são deduzidas as distribuições exatas das variáveis U = X + Y, P = XY e Q = X/ (X + Y) juntamente com seus respectivos momentos quando seguem o modelo bivariado gama beta II. Essas funções descrevem importantes variáveis hidrológicas. Os resultados obtidos são aplicados em dados de precipitações pluviométricas ocorridas na cidade de Passo Fundo-RS.
Distribuição gama beta II; combinação de variáveis aleatórias; precipitação pluviométrica
Bivariate gamma distributions have been used successfully on modeling hydrological processes. In this work, supposing that X: and Y: follow the gamma beta II bivariate gamma model, we deduce the exact distributions of the functions U = X + Y P = XY: and Q = X/ (X + Y),: as well as their respective moments. Those functions describe important hidrological variables. An application of the results is provided to rainfall data from Passo Fundo - RS.
Gamma beta II distribution; combination of random variables; rainfall
IUFSJ - Universidade Federal de São João del-Rei, Campus de Sete Lagoas, CSL, Cx. P. 56, 35701-970 Sete Lagoas, MG, Brasil. anapaula@ufsj.edu.br
IIDEPEN - Departamento de Ensino, IFBA - Instituto Federal de Educação, Ciência e Tecnologia da Bahia, 45823-431 Eunápolis, BA, Brasil. jailsondearaujo@yahoo.com.br
IIIDEX - Departamento de Ciências Exatas, UFLA - Universidade Federal de Lavras, Cx.P. 3037, 37200-000 Lavras, MG, Brasil. lucas@dex.ufla.br
IVDEX - Departamento de Ciências Exatas, UFLA - Universidade Federal de Lavras, Cx.P. 3037, 37200-000 Lavras, MG, Brasil. devaniljaques@dex.ufla.br
RESUMO
Os modelos bivariados tem sido utilizados com sucesso na análise de processos hidrológicos. Neste trabalho, são deduzidas as distribuições exatas das variáveis U = X + Y, P = XY e Q = X/ (X + Y) juntamente com seus respectivos momentos quando seguem o modelo bivariado gama beta II. Essas funções descrevem importantes variáveis hidrológicas. Os resultados obtidos são aplicados em dados de precipitações pluviométricas ocorridas na cidade de Passo Fundo-RS.
Palavras-chave: Distribuição gama beta II, combinação de variáveis aleatórias, precipitação pluviométrica.
ABSTRACT
Bivariate gamma distributions have been used successfully on modeling hydrological processes. In this work, supposing that X: and Y: follow the gamma beta II bivariate gamma model, we deduce the exact distributions of the functions U = X + Y P = XY: and Q = X/ (X + Y),: as well as their respective moments. Those functions describe important hidrological variables. An application of the results is provided to rainfall data from Passo Fundo - RS.
Keywords: Gamma beta II distribution, combination of random variables, rainfall.
1. Introdução
Motivados pelo crescente uso principalmente na análise de dados não normais, vários modelos bivariados podem ser encontrados na literatura [2]. Os trabalhos desenvolvidos por fl] impulsionaram o uso da distribuição gama bivariada na análise de processos hidrológicos, sendo atualmente um dos mais utilizados. Por exemplo, [15] estuda a aplicabilidade da distribuição gama bivariada de Smith na análise de freqüência das variáveis hidrológicas duração e volume; [16] apresentam uma revisão de vários modelos gama, com diferentes parâmetros de escala e forma, apontando as vantagens e desvantagens de cada modelo no estudo de precipitação; [9] estudam o comportamento de dados de seca do Estado de Nebraska considerando a distribuição gama bivariada de Cherian e [10] realizam o mesmo estudo com a distribuição exponencial bivariada de Friday e Patil; [7] aplica um modelo bivariado gama exponencial na modelagem de dados de seca.
Considerando que X e Y se distribuem segundo um modelo bivariado, funções dessas variáveis aleatórias, expressas por U = X + Y, P = XY e Q = X/(X + Y), têm um significado físico importante de modo que diferentes autores têm trabalhado no sentido de caracterizar essas distribuições e aplicá-las em diferentes áreas do no sentido de caracterizar essas distribuições e aplicá-las em diferentes áreas do conhecimento, em particular em hidrologia [6, 11, 4, 8, 14. . Por exemplo, se X representa o período de chuva e Y o período contíguo sem ocorrência de chuva, U = X + Y denota o período climático e Q = X/(X + Y) a proporção de chuva. Neste contexto, o trabalho têm por objetivo apresentar a distribuição bivariada Gama Beta tipo II e deduzir a distribuição exata das variáveis U = X + Y, P = XY e Q = X/(X + Y) sob a pressuposição de que X e Y seguem esse modelo. Como aplicação é realizado o ajuste dessas distribuições a dados de precipitação pluviométrica do município de Passo Fundo, RS.
1.1. Distribuições beta
Distribuição beta tipo I: Uma variável aleatória X temdistribuição beta tipo I com parâmetros α > 0 e β > 0 quando sua função densidade de probabilidade (fdp) é da forma:
em que 0 < x < 1 e B (α, β) representa a função beta,
Simbolicamente, quando X possui função densdidade de probabilidade dada por (1.1), denotamos por X ~ BI(α, β), ou apenas, X ~ B(α, β).
Distribuição beta tipo II: Uma variável aleatória X tem distribuição beta tipo II com parâmetros α > 0,β > 0 e λ > 0 quando sua função densidade de probabilidade (fdp) é da forma:
em que x > 0. Quando X possui função densidade de probabilidade dada por (1.3), denotamos por X ~ BII(α, β)
As duas distribuições beta estão relacionadas intrinsecamente por meio de uma transformação. Várias características referentes aos dois modelos podem ser encontradas em [3, 5].
Além da função beta, os cálculos envolvidos no trabalho incluem o uso de outras funções especiais como a função gama,
a função ψ(·),
a função hipergeomêtrica confluente,
com 0 < a < b e b ≠ 0, -1, -2, ... e a função cilíndrica parabólica,
As propriedades dessas funções especiais podem ser vistas em [3, 12]. Serão ainda utilizados os importantes Lemas 1.1 e 1.2.
Lema 1.1. (Equação 2.3.6.1, [13]). Se a > 0,
Lema 1.2. (Equação 2.3.15.1, [13]). Se α > 0 e β> 0,
2. O modelo
A distribuição bivariada gama beta tipo II tem função densidade de probabilidade (fdp) conjunta dada por:
com x > 0, y > 0, a > 0, c > 0,0 < β < α e K é aconstante de normalização definida por
Esse modelo pertence à família gama bivariada de Arnould (ver [2]) e com essa parametrização ainda não foi abordado na literatura.
2.1. Funções Densidade de Probabilidade
Considerando que X e Y têm distribuição conjunta dada pelo modelo (2.1), as fdps marginais de X e Y são respectiviamente:
Portanto, X ~ G (α - β, a) e Y - BII (β, α - β, ª/c).
Nos Teoremas 2.1, 2.2 e 2.3 são deduzidas as fdps das variáveis U = X + Y, P = XY e Q = X/(X + Y) quando X e Y seguem o modelo (2.1). Inicialmente apresentamos a fdp conjunta das variáveis U e Q (ver equação 2.5) e a fdp conjunta das variáveis X e P (ver equação 2.7), que são úteis nas demonstrações desses teoremas.
Considere (U, Q) = (X + Y, X/(X + Y)), onde X e Y são variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1). Então, o Jacobiano da transformação é dado por:
Assim, a fdp conjunta de (U, Q) = (X + Y, X/(X + Y)) é dada por
Considere agora (X, P) = (X, XY), onde X e Y são variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1). Então, o Jacobiano da transformação é dado por:
Assim, a fdp conjunta de (X, P) é dada por
Teorema 2.1. Sejam X e Y variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1) e U variável aleatória dada por U = X + Y. Se α > 2 e β > 2 são inteiros, então:
para θ > 1, em que u > 0 e θ = (α - cu)/(2cu).
Demonstração. Considere U e P variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.5). Para 0 < θ < 1 então a fdp de U é dada por:
Fazendo y = (w - θ)2 temos:
Aplicando o Lema (1.1) à integral acima, obtém-se:
O resultado para θ > 1 é obtido similarmente. □
Teorema 2.2. Sejam X e Y variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1) e Q a variável aleatória dada por Q = XI (X + Y). Se α > 2 e β > 2 são inteiros, então:
em que 0 < q < 1
Demonstração. De (2,5) tem-se que a distribuição de Q é dada por:
O resultado segue da aplicação do Lema (1.2) à integral.
Teorema 2.3. Sejam X e Y variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1) e P a variável aleatória dada por P = XY. Se α > 2 e β > 2 são inteiros, então:
em que p > 0.
Demonstração. Considere X e P variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.7). A fdp de P é dada por
2.2. Momentos
Nesta seção são deduzidos os momentos das variáveis U = X + Y e P = XY quando X e Y seguem o modelo gama beta II (ver equação 2.1). Inicialmente aprensentamos o Lema 2.1 o qual é muito útil nas demonstrações dos Teoremas 2.4 e 2.5.
Lema 2.1. Sejam X e Y variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1). Então:
para os inteiros n > 1 e 1 < m < n.
Demonstração. Sob o modelo (2.1), tem-se que:
Em particular, para n = m = 1 obtém-se:
Teorema 2.4. Sejam X e Y varíáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1). Então:
para todo inteiro n > 1.
Demonstração. Temos que:
O resultado segue da aplicação do Lema (2.1).
Teorema 2.5. Sejam X e Y variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1). Então:
para todo inteiro n > 1
Demonstração. Temos que: E [Pn] = E [(XY)n] = E [XnYn]. O resultado segue da aplicação do Lema (2.1) para m = n.
2.3. Estimação
Seja (x1;y1), (x2, y2),..., (xn, yn) uma amostra aleatória da variável aleatória (X, Y) a, c, α, β de verossimilhança é:
Aplicando a função logarítmica a ambos os lados da equação (2.9) obtém-se:
Assim,
em que ψ(·) denota a função psi dada pela equação (1.5).
Os estimadores de máima verossimilhança dos parâmetros a, c, α, são os valores na qual a função de verossimilhança é máxima, ou seja, é a solução do sistema de equações:
A solução do sistema de equações de máxima verossimilhança pode ser obtida numericamente através do software de computação algêbrica MAPLE (versão 16.02).
Como não é possível obter as propriedades exatas do estimador de máxima verossimilhança, um estudo computacional é apresentado. Para os dados utilizados na seção 3 seguinte, as estimativas de máxima verossimilhança para os parâmetros do modelo são:
(, , , ) = (0.8654, 0.1899, 3.3920, 1.2842)
Fixando-se três dessas estimativas, é possível simular o gráfico do erro quadrático médio (EQM) do estimador de máxima verossimilhança da seguinte forma: Suponha fixados os valores de
= 0.1899, = 3.3920 e = 1.2842, e permita que a varie no intervalo [0, 64905, 1.752436]. Tomam-se valores ai (i = 1, 2,...I) nesse intervalo e, para cada um desses valores, considera-se que o vetor dos parâmetros reais é (ai, , , )= (ai, 0.1899, 3.3920,1.2842). Substituindo na densidade (2.1), uma amostra de tamanho 101 é obtida. A partir desta, a solução do sistema das equações de máxima verossimilhança é obtido e o erro quadrático determinado. Esse procedimento, repetido 1000 vezes, permite a obtenção de uma estimativa para o erro quadrático médio. Com isto, é possível traçar o gráfico do erro quadrático médio como função do parâmetro a. Repetindo-se o processo para os outros parâmetros obtém-se gráficos representados pelas Figuras 1, 2, 3 e 4.Supondo os parâmetros reais dados por (, , , ) = (0.8654, 0.1899, 3.3920,1.2842) foram simuladas 100.000 amostras de tamanho 101 e, para cada amostra, calculadas as estimativas de máxima verossimilhança dos parâmetros, (, , , ). Com isso foi possível obter:
1. As esperanças de cada componente dos estimadores:
2. O erro quadrático médio:
3. A Variância das estimativas:
4. O Viés:
Observe que, como tem que ser, EQM = Var + Vies.
3. Aplicação
Nesta seção é feita uma aplicação do modelo na análise de dados de precipitações pluviométricas ocorridas na cidade de Passo Fundo, Estado do Rio Grande do Sul.
Os dados explorados correspondem a medições diárias de precipitação pluviométrica (mm) no período de Julho de 2009 a Julho de 2011, totalizando 730 observações. Os dados foram coletados pelo Laboratório de Meteorologia Aplicada à Agricultura da Embrapa Trigo, Passo Fundo - RS, (latitude: 28°15'46" S; longitude: 52°24'24" W; altitude: 684m) e encontram-se disponíveis livremente para download no endereço eletrônico http://www.cnpt.embrapa.br/pesquisa/agromet.
Utilizando as medições do índice pluviométrico, obtém-se os dados sobre período de dias com ocorrência de preciptações (X) e período contiguo de dias sem ocorrência de preciptações (Y). O objetivo é modelar as variáveis X, Y e o período climático U. O período climático indica um ciclo climático, formado pela soma dos dias sem chuva com os dias contíguos com chuva, essa quantidade também indica o retorno do período de chuva.
O ajuste das distribuições foi feito via Método da Máxima Verossimilhança. Se (xi, y1) ,..., (xn, yn) é uma amostra aleatória de (2.1), as estimativas dos parâmetros do modelo são: = 0.8654, = 0.1899, = 3.3920 e = 1.2842.
As fdps ajustadas de X, Y e U e os respectivos gráficos de probabilidades observadas versus probabilidades esperadas, são apresentadas nas Figuras de 5 a 10.
Figura 5: fdp ajustada de X
Figura 6: p-pplot para a variável X
Figura 7: fdp ajustada de Y
Figura 8: p-pplot para a variável Y
Figura 9: fdp ajustada de Y
Figura 10: p-pplot para a variável Y
Os gráficos das distribuições ajustadas e de probabilidade, Fig 10, sugerem um bom ajuste para as variáveis período de chuva (X), período sem ocorrência de chuva (Y) e período climático (U) que o modelo bivariado gama beta II apresenta-se como uma alternativa na análise de dados de precipitação pluviomêtrica.
4. Conclusões
XY deduzir as distribuições exatas e os momentos das variáveis aleatórias U = X + Y, P = XY Q = X/(X + Y) utilizando funções especiais. A estimação dos parâmetros do modelo pelo Método da Máxima Verossimilhança e suas propriedades, podem computadas utilizando métodos numéricos.
A aplicação do modelo na análise de dados de precipitações ocorridas na cidade de Passo Fundo do Estado do Rio Grande do Sul apresentou resultados satisfatórios, levando-se em consideração que os critérios gráficos de qualidade de ajuste indicaram uma boa adequação do modelo aos dados observados.
Recebido em 17 Agosto 2012
Aceito em 26 Marco 2013
- [1] T. Izawa, Two or multi-dimensional gamma-type distribution and its application to rainnfall data, Meteorological Research Institute, 15 (1965), 167-200.
- [2] N. Balakrifhnan, C.D. Lai, "Continuous bivariate distributions", Springer Vergland, 2009.
- [3] R. Beals, R. Wong, "Special functions", Cambridge University, New York, 2010.
- [4] A, K. Gupta, S. Nadarajah, Sums, products and ratios for Mckay's bivariate gamma distribution, Mathematical and Computer Modelling, 43 (2006), 185-193.
- [5] M.V. Jambunathan, Some properties of beta and gamma distributions, The Annals of Math. Stat, 25 (1954), 401-405.
- [6] S. Nadarajah, Products and ratios for a bivariate gamma distribution, Journal of the American Statistical Association Applied Mathematics and Computing, 24, No. 1 (2005), 581-595.
- [7] S. Nadarajah, Bivariate gamma exponential distribution with application to drought data, Journal Applied Mathematical and Computer Modelling, 24, No. 1 (2007), 221-130.
- [8] S. Nadarajah, Bivariate pareto model for drought, Stochastic Environmental Research and Risk Assessment, 23, No. 6 (2008), 811-822.
- [9] S. Nadarajah, A.K. Gupta, Cherian's bivariate gamma distributioins as a model for drought data, Agrociencia, 40, No. 4 (2006), 483-490.
- [10] S. Nadarajah, A.K. Gupta, Friday and Patil's bivariate exponential distribution! with application to drought data, Water Resource Management, 20, No. 5 (2006), 749-759.
- [11] S. Nadarajah, S. Kotz, Sums, products and ratios for downton's bivariate exponential distribution, Stochastic Environmental Research and Risk Assessment, 20, No. 3 (2006), 164-170.
- [12] K. Oldham, J. Myland, J. Spanier, "An atlas of functions: with equator, the atlas function calculator", Springer Vergland, Canadá, 2009.
- [13] A.P. Prudnikov, O.I. Marichev, "Integrals and series", Gordon and Breach, Amsterdam, 1998.
- [14] A.P.C.M. Silva, J.A. Rodrigues, L.M. Chaves, D.J. Souza, Sums, Products and Ratios for Crovelli's Bivariate Gamma Distribution, Water Resources Management, 27, No. 5 (2013), 1363-1376.
- [15] S. Yue, A bivariate gamma distribution for use in multivariate flood frequency-analysis, Journal of Hydrology, 15, No. 6 (2001), 1033-1045.
- [16] S. Yue, T.B.M.J. Ouarda, B. Bobee, A review of bivariate gamma distributions for hydrological application, Journal of Hydrology, 246, No.1 (2001), 1-18.
Distribuição bivariada gama beta II: soma, produto e proporção das variáveis componentes
Datas de Publicação
-
Publicação nesta coleção
28 Maio 2013 -
Data do Fascículo
Abr 2013
Histórico
-
Recebido
17 Ago 2012 -
Aceito
26 Mar 2013