Open-access Aplicação das inferências clássica e bayesiana na estimação dos parâmetros do modelo de densidade populacional de plantas daninhas

Application of classic and bayesian inferences on the estimation of weed population density model parameters

Resumos

A dinâmica da população de plantas daninhas pode ser representada por um sistema de equações que relaciona as densidades de sementes produzidas e de plântulas em áreas de cultivo. Os valores dos parâmetros dos modelos podem ser inferidos diretamente de experimentação e análise estatística ou extraídos da literatura. O presente trabalho teve por objetivo estimar os parâmetros do modelo de densidade populacional de plantas daninhas, a partir de um experimento conduzido na área experimental da Embrapa Milho e Sorgo, Sete Lagoas, MG, via os procedimentos de inferências clássica e Bayesiana.

banco de sementes; dinâmica populacional; inferência bayesiana; inferência clássica


Dynamics of weed populations can be described as a system of equations relating the produced seed and seedling densities in crop areas. The model parameter values can be either directly inferred from experimentation and statistical analysis or obtained from the literature. The objective of this work was to estimate the weed population density model parameters based on experimental field data at Embrapa Milho e Sorgo, Sete Lagoas, MG, using classic and Bayesian inferences.

seed bank; population dynamics; Bayesian inference; classic inference


ARTIGOS

Aplicação das inferências clássica e bayesiana na estimação dos parâmetros do modelo de densidade populacional de plantas daninhas

Application of classic and bayesian inferences on the estimation of weed population density model parameters

Vismara, L.S.I; Karam, D.II; Morita, L.H.M.III

ILicenciada em Matemática pela Universidade Federal de São Carlos - UFSCar e Mestre em Engenharia Elétrica pela Escola de Engenharia de São Carlos da Universidade de São Paulo - EESC/USP, <lilianvismara@gmail.com>

IIPh. D. Colorado State University, EMBRAPA - Milho e Sorgo, 35701-970 Sete Lagoas-MG

IIIMestre em Estatística pela Universidade Federal de São Carlos - UFSCar e Especialista em Bioestatística pela Universidade de São Paulo - USP/Ribeirão Preto, <liahanna@yahoo.com.br>

RESUMO

A dinâmica da população de plantas daninhas pode ser representada por um sistema de equações que relaciona as densidades de sementes produzidas e de plântulas em áreas de cultivo. Os valores dos parâmetros dos modelos podem ser inferidos diretamente de experimentação e análise estatística ou extraídos da literatura. O presente trabalho teve por objetivo estimar os parâmetros do modelo de densidade populacional de plantas daninhas, a partir de um experimento conduzido na área experimental da Embrapa Milho e Sorgo, Sete Lagoas, MG, via os procedimentos de inferências clássica e Bayesiana.

Palavras-chave: banco de sementes, dinâmica populacional, inferência bayesiana, inferência clássica.

ABSTRACT

Dynamics of weed populations can be described as a system of equations relating the produced seed and seedling densities in crop areas. The model parameter values can be either directly inferred from experimentation and statistical analysis or obtained from the literature. The objective of this work was to estimate the weed population density model parameters based on experimental field data at Embrapa Milho e Sorgo, Sete Lagoas, MG, using classic and Bayesian inferences.

Keywords: seed bank, population dynamics, Bayesian inference, classic inference.

INTRODUÇÃO

A partir de informações ambientais, pode-se inferir qual o nível de risco de infestações que interferem na produção agrícola. Estudos e levantamentos de populações de plantas daninhas em ambientes agrícolas, além de permitirem a identificação da flora infestante e sua evolução numa área, podem ter aplicação na previsão de infestantes em culturas agrícolas (Voll et al., 1997a). Taxas de emergência de espécies de um banco de sementes podem servir para adequar manejos e racionalizar o uso de herbicidas. Por exemplo, as emergências de espécies daninhas em pré-semeadura de uma cultura podem ser eliminadas pelas práticas de manejo, reduzindo as infestações e a sobrevivência da espécie (Voll et al., 1997a, b). A previsão das plantas daninhas pode ser eficientemente utilizada na prevenção de infestações com a aplicação localizada de defensivos agrícolas em regiões precisas, tornando o ambiente agrícola mais bem controlado, o que pode reduzir os custos de produção na aplicação de defensivos (Wu, 2001) e, por conseqüência, o impacto ambiental. Nesse contexto, modelos matemáticos têm se tornado ferramentas valiosas para entendimento e simulação de diferentes situações do problema, contribuindo para implementação de estratégias integradas de controle (Doyle, 1997). Há alguns exemplos de modelagem de população de plantas daninhas em termos da dinâmica, em geral, não-linear (Edelstein-Keshet, 1988; Cousens & Mortimer, 1995; Sakai, 2001). Este trabalho teve por objetivo estimar os parâmetros do modelo dinâmico de populações de plantas daninhas via os métodos estatísticos de inferência clássica e inferência bayesiana, a partir de um experimento conduzido no período de 16 a 20 de novembro de 2004, em uma cultura de milho por plantio direto, na área experimental da Embrapa Milho e Sorgo, Sete Lagoas, MG.

MATERIAL E MÉTODOS

Modelo de densidade populacional de plantas daninhas

O comportamento dinâmico de populações de plantas daninhas pode ser representado por modelos que consideram somente a densidade da população (plantas ou sementes) em intervalos de uma geração individual a cada ciclo, descrevendo simplesmente mudanças de densidade. Nesse contexto, a densidade de plântulas de daninhas pode ser descrita por:

em que Y é o número de plântulas por área; X, o número de sementes por área; t, o ciclo de vida; e g, a taxa de germinação.

Considerando a dinâmica intrínseca, a taxa de crescimento populacional será independente da densidade de plantas daninhas se os indivíduos na população estiverem amplamente espaçados, não havendo interferência intra-específica (Cousens & Mortimer, 1995; Sakai, 2001). Então, sob baixa densidade de plantas, a produção de sementes por área pode ser expressa por:

em que R é a taxa de crescimento em baixa densidade (Cousens & Mortimer, 1995). Para populações em que a produção de sementes se aproxima assintoticamente de um limite superior com o aumento de Xt, tem-se:

na qual f é a taxa de crescimento populacional, que pode ser definida como:

sendo d a taxa do declínio de f com o aumento da densidade e b a taxa que reflete a intensidade do efeito da densidade de plantas daninhas na produção de sementes. O modelo (3) com dado por (4) foi proposto por Hassell (1975). Nesse caso, a dinâmica populacional em função da densidade de plantas daninhas pode ser dada fazendo-se r = sg e d = ag, em que a é um parâmetro que relaciona a mortalidade de plantas com a dependência da densidade e s e g são as taxas de germinação e produtividade de sementes (número de sementes produzidas por planta), respectivamente (Gonzalez-Andujar, 1996).

A estatística Clássica versus a Bayesiana

Um problema importante da inferência estatística é a estimação dos parâmetros de um modelo, deduzidos de um conjunto de dados (Favoretti, 1995). Inferências sobre os parâmetros geralmente se baseiam em métodos estatísticos clássicos, os quais consistem da obtenção de estimadores de mínimos quadrados ou estimadores de máxima verossimilhança e da suposição de propriedades assintóticas para esses estimadores (Favoretti, 1995; Paulino et al., 2003). Considere uma situação em que os dados consistem de uma resposta Xi que depende de h variáveis independentes Yi, que pode ser representada pelo modelo de regressão não-linear com k parâmetros:

em que q Î Â, f(Yi, q) é uma função não-linear, Xi é a variável dependente do modelo, Yi é a variável independente e ei representa o erro descrito por um processo estocástico.

Na abordagem clássica, a regressão não-linear, os estimadores de mínimos quadrados dos parâmetros do modelo (5), apesar de não enviesado, normalmente distribuído e de variância mínima, encontram essas propriedades somente assintoticamente. Dessa forma, nem sempre é possível encontrar formas analíticas para os estimadores de mínimos quadrados; portanto, a solução das equações normais usualmente requer a utilização de métodos numéricos (Favoretti, 1995).

Na presença de pequenas amostras, faz-se uso de métodos bayesianos, os quais eliminam o uso de propriedades assintóticas (Favoretti, 1995; Ehlers, 2003; Gelman et al., 2003; Paulino et al., 2003). Nesta abordagem não há distinção entre quantidades observáveis e os parâmetros de um modelo estatístico - todos são considerados quantidades aleatórias. A informação disponível sobre q é resumida probabilisticamente através de uma função de densidade de probabilidade, denotada a priori p(q), a qual pode ser aumentada observando-se uma quantidade aleatória Y relacionada com q. A distribuição amostral p(y | q) define essa relação. Para um valor fixo de y, a função L(q ; y) fornece a plausibilidade ou verossimilhança de cada um dos possíveis valores de q. A informação a priori e a verossimilhança são combinadas, levando à densidade a posteriori de q, p(q | y). A forma usual do teorema de Bayes é:

O problema geral da inferência bayesiana consiste em calcular os valores esperados de funções particulares do parâmetro q que resumem convenientemente a densidade a posteriori. A informação a priori, a respeito da interpretação dos parâmetros, pode ser expressa utilizando-se prioris informativas ou prioris não-informativas, caso não haja opinião sólida sobre os parâmetros do modelo; a primeira idéia de "não-informação" a priori que se pode ter é pensar em todos os possíveis valores de q como igualmente prováveis, isto é, com uma distribuição a priori uniforme (Paulino et al., 2003).

Em muitos problemas pode ser bastante difícil, ou mesmo impossível, encontrar uma densidade de importância que seja simultaneamente uma boa aproximação da posteriori e fácil de ser amostrada. Os métodos de Monte Carlo via cadeias de Markov (MCMC) são técnicas de simulação iterativas para obter uma amostra da distribuição a posteriori e calcular estimativas amostrais de características dessa distribuição. Entre os métodos MCMC mais utilizados está o algoritmo de Metropolis-Hastings (Gelman et al., 2003; Paulino et al., 2003) ou casos particulares deste.

Nos algoritmos de Metropolis-Hastings um valor é gerado a partir de uma distribuição auxiliar e aceito com uma dada probabilidade; esse mecanismo de correção garante a convergência da cadeia para a distribuição de equilíbrio, que, neste caso, é a distribuição a posteriori (Ehlers, 2003; Paulino et al., 2003). Suponha que no instante t a cadeia esteja no estado q e um valor q' é gerado de uma distribuição proposta – uma função de probabilidade de transição de estado apropriada, q (· | q). O novo valor é aceito com probabilidade:

como o novo estado da cadeia no instante t + 1, ou é rejeitado com probabilidade 1 - d (q, q') e permanece no estado q. Tem-se p (q | y) como a distribuição de interesse, e q (· | q) poderia ser, por exemplo, uma distribuição Normal centrada em q. O algoritmo de Metropolis-Hastings pode ser especificado pelos seguintes passos (Ehlers, 2003) associados ao aplicativo WinBUGS (Spiegelhalter et al., 2006):

1. Inicialize o contador de iterações e especifique um valor inicial t = 0.

2. Escolha o número de iterações para as cadeias a serem geradas.

3. Gere um novo valor q' da distribuição q (· | q) proposta.

4. Calcule a probabilidade de aceitação d (q, q') e gere u ~ U(0,1).

5. Se u < d (q, q'), então aceite o novo valor e faça q t+1 = q', caso contrário, rejeite e faça q t+1 = q.

6. Incremente o contador de t para t + 1 e volte ao passo 3 até completar o número de iterações.

7. Analise se as cadeias convergiram; caso contrário, retorne ao passo 2, aumentando o número de iterações. Deve-se ressaltar que é possível interromper o processo iterativo assim que a cadeia convirja para a distribuição de equilíbrio p.

A convergência do algoritmo pode ser verificada através do teste gráfico de Gelman e Rubin (Gelman et al., 2003).

Delineamento do experimento

O milho, cultivar BRS1030, do tipo híbrido simples foi cultivado em uma área de 38 hectares, com pivô central em sistema de plantio direto, em que o solo não é revolvido após colheita nem antes do próximo plantio. A data do plantio ocorreu de 16 a 20 de novembro de 2004 e, concomitantemente, foi realizada adubação do solo com 22,56 kg ha-1 de nitrogênio (N), 78,96 kg ha-1 de fósforo (P), 45,12 kg ha-1 de potássio (K) e 0,564 kg ha-1 de zinco (Z).

A cultura foi alocada em 41 pontos de amostragem, distando 100 metros uma das outras em cada direção (leste-oeste e norte-sul). Cada parcela possui forma retangular, medindo 12 m2, sendo 4 m de comprimento e 3 m de largura, com cinco linhas de cultura espaçadas de 0,7 m, com 0,1 m nas bordas superior e inferior. Durante a aplicação de herbicidas no pivô, essas parcelas foram cobertas com lona, para que não sofressem a ação do herbicida. O tratamento com herbicidas foi realizado em aplicação pré-emergente (antes da emergência da cultura) e pós-emergente (depois da emergência da cultura). A aplicação pré-emergente ocorreu logo após o plantio, com dessecantes glifosato (2,4 kg ha-1). A aplicação pós-emergente foi realizada nos dias 13 e 14 de dezembro de 2004, com nicosulfuron (0,04 kg ha-1) e atrazine (1 kg ha 1). Foi realizada também a aplicação de inseticidas (0,6 litro por hectare de Lannat®) nos dias 20 e 21 de dezembro de 2004.

Nos dias 17, 18 e 21 de março de 2005 foram coletados os seguintes dados nas 41 parcelas experimentais: foram colhidas e contadas todas as espécies de plantas daninhas obtidas com auxílio de um quadro de madeira de 0,5 m por 0,5 m, colocado aleatoriamente quatro vezes dentro das três linhas centrais de cultura em cada parcela, fornecendo a densidade de plantas daninhas por parcela; e foi colocado um indivíduo contendo sementes de cada espécie daninha dentro de cada parcela, para medir a produtividade de sementes. A fim de uniformizar as unidades das variáveis, foi feita a seguinte transformação: multiplicou-se o número de sementes produzidas por uma única planta pela densidade de plantas daninhas, obtendo-se uma estimativa da densidade de sementes produzidas.

RESULTADOS E DISCUSSÃO

Foram encontradas 18 espécies daninhas na área experimental e escolhidas as seguintes espécies, cujo número de observações n permitia realizar algum tipo de inferência: capim-colchão (Digitaria ciliaris) e capim-guiné (Panicum maximum), espécies de folha estreita, e leiteiro (Euphorbia heterophylla), de folha larga, com n = 16, 10 e 9, respectivamente. Devido à natureza do conjunto de dados, adota-se o modelo (3) com taxa de crescimento (4), em que R = sg, d = ag e b = 1. Assim, e de acordo com a expressão (1), o modelo estatístico (5) é reescrito da seguinte maneira:

em que q = [s a b]', ei = (e1,...,en), ei ~ N(0;s 2 I), sendo I a matriz identidade de ordem n; s 2, a variância desconhecida;Yi, densidade de plantas daninhas; e Xi, a densidade de sementes. Define-se precisão, denotada t, como sendo o inverso da variância, isto é:

Para efetuar o ajuste da função não-linear (8), escolhe-se o vetor de valores iniciais para iniciar o processo iterativo de obtenção das estimativas dos parâmetros do modelo. Desse modo, a escolha desse vetor foi realizada a partir do ajuste do modelo linearizado de (3) com taxa de crescimento (4), descrito por:

em que yi = ln(Xt+1/Xt) é a variável dependente; b0 = ln(R) - ln(d), a variável independente; xi = - ln(Xt); e b1 = b. A solução do problema de regressão não-linear do modelo (8) via método dos mínimos quadrados não foi possível, devido, provavelmente, ao tamanho pequeno da amostra e/ou aos valores iniciais para os parâmetros obtidos via regressão linear. Contudo, como citado na literatura (Cousens & Mortimer, 1995; Freckleton & Watkinson, 2002), muitos dados para os quais o modelo (3) com taxa de crescimento (4) tem sido ajustado resultaram em valores de b menores que 1 ou não significativamente diferente de 1; então, adotou-se b = 1. Para aplicação da metodologia clássica foi utilizado o aplicativo estatístico R (Venables & Smith, 2006). A Tabela 1 apresenta as medidas de precisão e as estimativas clássicas do modelo (8). Em razão do pequeno tamanho amostral, os resultados obtidos na inferência clássica, tanto para a regressão não-linear de (8) como para a regressão linear de (10), não foram satisfatórios; entretanto, forneceram alguma informação com respeito aos parâmetros do modelo (8), o que garantiu a aplicação da metodologia bayesiana.

Para inferência bayesiana foi utilizada o aplicativo WinBUGS (Spiegelhalter et al., 2006). A procura de uma densidade geradora de amostras para os parâmetros se deu via método de Monte Carlo com cadeias de Markov (MCMC). No entanto, a escolha do algoritmo de simulação das amostras de interesse via WinBUGS depende das densidades a priori adotadas para esses parâmetros e, conseqüentemente, das densidades a posteriori condicionais obtidas. Como o intervalo de confiança obtido a partir do ajuste clássico de a apresentou limite inferior negativo (veja na Tabela 2), o que não faz sentido biológico, optou-se por utilizar uma priori uniforme para a: a ~ U(0,1); para o parâmetro S adotou-se uma priori informativa normal centrada na estimativa clássica de S, denotada , do ajuste de (8): s ~ N (, 1); e para a precisão uma priori Gama: t ~Ga(1,1). Essas prioris resultaram em distribuições condicionais completas a posteriori, que não possuem forma fechada, e, conseqüentemente, utilizou-se o algoritmo "Slice sampling" (Neal, 2003), que é um caso particular do algoritmo de Metropolis-Hastings.

Para cada parâmetro foram geradas três cadeias, a partir de valores iniciais distintos: as estimativas de s e a da regressão não-linear de (8); a estimativa de b0 da regressão linear de (10) para s e a = 1; e a partir de valores extremos das densidades a priori obtidos arbitrariamente pelo aplicativo WinBUGS. Foram realizadas no mínimo 100.000 iterações, descartadas pelo menos 4.000 amostras iniciais e efetuados saltos apropriados para redução da autocorrelação entre os valores gerados. A convergência do algoritmo foi realizada através do teste gráfico de Gelman e Rubin (Figuras 1 a 3) e verificou-se que houve convergência das amostras a posteriori para uma região em torno de seus possíveis valores verdadeiros. A Tabela 2 apresenta as medidas de precisão e as estimativas bayesianas, e as Figuras 4 a 6, as densidades a posteriori.



A vantagem da abordagem bayesiana, com respeito às técnicas de estimação pontual ou por intervalos, é que os intervalos de credibilidade tendem a ser mais estreitos que os de confiança obtidos na inferência clássica, o que pode ser confirmado nas Tabelas 1 e 2. Além disso, a principal restrição da estimação pontual é que quando, se estima um parâmetro através de um único valor numérico, toda a informação presente nos dados é resumida por meio deste número. Logo, a densidade a posteriori de um parâmetro contém toda a informação probabilística a respeito dele, e um gráfico de sua função de densidade é a melhor descrição do processo de inferência.

Conclui-se que o uso de métodos bayesianos é uma alternativa apropriada para analisar modelos não-lineares da densidade populacional de plantas daninhas em agrossistemas, podendo contribuir para a adequação de estratégias de manejo através da simulação da sobrevivência e produtividade de espécies daninhas em áreas cultivadas.

AGRADECIMENTOS

Ao CNPq, pela bolsa de estudo concedida, e à CAPES, pelo auxílio financeiro.

LITERATURA CITADA

Recebido para publicação em 30.3.2007 e na forma revisada em 25.10.2007.

Referências bibliográficas

  • COUSENS, R.; MORTIMER, M. Dynamics of weed populations Cambridge: Cambridge University Press, 1995. 332 p.
  • DOYLE, C. J. A review of the use of models of weed control in integrated crop protection. Agric. Ecosyst. Environ., v. 64, n. 2, p. 165-172, 1997.
  • EDELSTEIN-KESHET, L. Applications of nonlinear difference equations to population biology. In: EDELSTEIN-KESHET, L. Mathematical models in biology New York: Random House, 1988. p. 72-111.
  • FAVORETTI, A. C. Modelos não-lineares: um enfoque bayesiano. 1995. 224 f. Dissertação (Mestrado em Ciências de Computação e Matemática Computacional) Universidade de São Paulo, São Carlos, 1995.
  • FRECKLETON, R. P.; WATKINSON, A. R. Are weed population dynamics chaotic? J. Appl. Ecol., v. 39, n. 5, p. 699-707, 2002.
  • GELMAN, G. A. B. et al. Bayesian data analysis Boca Raton: Chapman & Hall/CRC, 2003. 696 p.
  • GONZALEZ-ANDUJAR, J. L. High control measures cannot produce extinction in weed populations. Ecol. Model., v. 91, n. 1-3, p. 293-294, 1996.
  • HASSELL, M. P. Density dependence in single-species populations. J. An. Ecol., v. 44, n. 1, p. 283-295, 1975.
  • MORTIMER, A. M.; SUTTON, J. J.; GOULD, P. On robust weed populations models. Weed Res., v. 29, n. 4, p. 229-238, 1989.
  • NEAL, R. M. Slice sampling. Ann. Statistics, v. 31, n. 3, p. 705-767, 2003.
  • PAULINO, C. D.; TURKMAN, M. A.; MURTEIRA B. Estatística Bayesiana Lisboa: Fundação Calouste Gulbenkiman, 2003.
  • SAKAI, K. Numerical practice on chaotic population dynamics in plant communities. In: SAKAI, K. Nonlinear dynamics and chaos in agricultural systems Amsterdam: Elsevier, 2001. p. 47-58.
  • SPIEGELHALTER, D. et al. WinBUGS Disponível em: <http://www.mrc-bsu.cam.ac.uk/bugs/winbugs/contents.html>. Acesso: 07 de abril de 2006.
  • VENABLES, W. N.; SMITH, D. M. An introduction to R Disponível em: <http://www.r-project.org>. Acesso: 07 de abril de 2006.
  • VOLL, E.; KARAM, D.; GAZZIERO, D. L. P. Dinâmica de populações de capim-colchão (Digitara horizontalis Willd.) sob manejos de solo e de herbicidas. Pesq. Agropec. Bras., v. 32, n. 4, p. 373-378, 1997a.
  • VOLL, E.; KARAM, D.; GAZZIERO, D. L. P. Dinâmica de populações de trapoeraba (Commelina benghalensis L.) sob manejos de solo e de herbicidas. Pesq. Agropec. Bras., v. 32, n. 6, p. 571-578, 1997b.
  • WU, J. J. Optimal weed control under static and dynamic decision rules. Agr. Econ., v. 25, n. 1, p. 119-130, 2001.

Datas de Publicação

  • Publicação nesta coleção
    17 Jan 2008
  • Data do Fascículo
    Dez 2007

Histórico

  • Aceito
    25 Out 2007
  • Recebido
    30 Mar 2007
location_on
Sociedade Brasileira da Ciência das Plantas Daninhas Departamento de Fitotecnia - DFT, Universidade Federal de Viçosa - UFV, 36570-000 - Viçosa-MG - Brasil, Tel./Fax::(+55 31) 3899-2611 - Viçosa - MG - Brazil
E-mail: rpdaninha@gmail.com
rss_feed Acompanhe os números deste periódico no seu leitor de RSS
Acessibilidade / Reportar erro