Acessibilidade / Reportar erro

Abordagem Bayesiana da curva de lactação de cabras Saanen de primeira e segunda ordem de parto

Bayesian approach in the lactation curve of Saanen goats from first and second calving orders

Resumos

O objetivo deste trabalho foi utilizar o método Bayesiano no ajuste do modelo de Wood a dados de produção de leite de cabras da raça Saanen. Dois grupos de animais da primeira e segunda lactação foram considerados. Amostras das distribuições marginais a posteriori dos parâmetros do modelo de Wood e das funções de produção derivadas desses parâmetros - pico de produção, tempo do pico de produção, persistência e produção total de leite - foram obtidas pelo algoritmo Gibbs Sampler. As inferências foram feitas em cada população e os resultados mostraram diferenças na taxa de decréscimo da produção após o pico e na persistência, indicando maior produção nos animais de segunda lactação. Realizou-se um estudo de simulação de dados para avaliar o método Bayesiano sob diferentes estruturas de matrizes de covariâncias dos parâmetros. Os resultados desse estudo indicam que o método é eficiente no estudo das curvas de lactação quando a matriz de covariância apresenta alta correlação dos parâmetros.

Gibbs Sampler; matriz de covariância; produção de leite


The objective of this work was to use the Bayesian method in the fitting of the Wood´s model for milk production of Saanen goats. Two groups of animals from first and second lactation were considered in the analysis. The posterior marginal distributions for each parameter and production functions, peak milk yield, time of peak yield, persistency and total milk production, were obtained via Gibbs Sampler algorithm. The inference was done for each population. The results showed differences in the slope of the curve after the peak and in persistency, indicating highest production for the second lactation. The data were simulated for evaluating Bayesian method under several covariance matrices structures. The simulation results indicate the efficiency of this method for lactation curves studies when the covariance matrices show high correlation for parameters.

Gibbs Sampler; covariance matrix; dairy production


ESTATÍSTICA

Abordagem Bayesiana da curva de lactação de cabras Saanen de primeira e segunda ordem de parto

Bayesian approach in the lactation curve of Saanen goats from first and second calving orders

Fabyano Fonseca e Silva; Joel Augusto Muniz; Luiz Henrique de Aquino; Thelma Sáfadi

Universidade Federal de Lavras, Dep. de Ciências Exatas, Caixa Postal 37, CEP 37200-000 Lavras, MG. E-mail: fabyanobr@ufla.br, jamuniz@ufla.br, lhaquino@ufla.br, safadi@ufla.br

RESUMO

O objetivo deste trabalho foi utilizar o método Bayesiano no ajuste do modelo de Wood a dados de produção de leite de cabras da raça Saanen. Dois grupos de animais da primeira e segunda lactação foram considerados. Amostras das distribuições marginais a posteriori dos parâmetros do modelo de Wood e das funções de produção derivadas desses parâmetros – pico de produção, tempo do pico de produção, persistência e produção total de leite – foram obtidas pelo algoritmo Gibbs Sampler. As inferências foram feitas em cada população e os resultados mostraram diferenças na taxa de decréscimo da produção após o pico e na persistência, indicando maior produção nos animais de segunda lactação. Realizou-se um estudo de simulação de dados para avaliar o método Bayesiano sob diferentes estruturas de matrizes de covariâncias dos parâmetros. Os resultados desse estudo indicam que o método é eficiente no estudo das curvas de lactação quando a matriz de covariância apresenta alta correlação dos parâmetros.

Termos para indexação: Gibbs Sampler, matriz de covariância, produção de leite.

ABSTRACT

The objective of this work was to use the Bayesian method in the fitting of the Wood´s model for milk production of Saanen goats. Two groups of animals from first and second lactation were considered in the analysis. The posterior marginal distributions for each parameter and production functions, peak milk yield, time of peak yield, persistency and total milk production, were obtained via Gibbs Sampler algorithm. The inference was done for each population. The results showed differences in the slope of the curve after the peak and in persistency, indicating highest production for the second lactation. The data were simulated for evaluating Bayesian method under several covariance matrices structures. The simulation results indicate the efficiency of this method for lactation curves studies when the covariance matrices show high correlation for parameters.

Index terms: Gibbs Sampler, covariance matrix, dairy production.

Introdução

O rígido controle da produção é um fator determinante para o sucesso da exploração leiteira e uma forma prática e consistente de obter este controle é pelo estudo da curva de lactação dos animais, a qual pode ser definida como a representação da produção de leite de um animal no decorrer do tempo em cada lactação (Cobuci et al., 2001).

O conhecimento das curvas de lactação de um rebanho auxilia na adequação de técnicas de alimentação e manejo, e no descarte e seleção de animais de acordo com um padrão desejável, preestabelecido de acordo com a capacidade de produção (Gonçalves, 1994). Dessa maneira, a comparação da forma da curva entre grupos distintos de animais, com diferentes composições raciais, idades ao parto, rebanhos e outros tratamentos de interesse, seria de grande importância, pois, mediante essas comparações, poderiam ser obtidas informações sobre a eficiência desses grupos, propiciando um melhor controle de produção (Groenewald & Viljoen, 2003).

Modelos estatísticos não-lineares são normalmente utilizados na descrição de curvas de lactação, quando ajustados a dados decorrentes de produção de leite em intervalos consecutivos de tempo. Estes modelos geralmente apresentam parâmetros relacionados com taxas crescentes e decrescentes, as quais lhes conferem a não linearidade paramétrica. Por meio de funções desses parâmetros, outras características da curva de lactação podem ser obtidas, como a produção de leite no pico e o tempo de permanência, a produção total de leite e a persistência da lactação (Groenewald et al., 1996).

O método freqüentista (quadrados mínimos) de ajustar modelos não-lineares é baseado em processos iterativos, ou, alternativamente, utilizam-se meios visando a linearizar o modelo mediante transformação logarítmica. Porém, em muitos casos, devido às irregularidades nos dados longitudinais e às correlações existentes entre os parâmetros do modelo (Gallant, 1987), esses métodos produzem estimativas irreais, levando à confecção de curvas de lactação atípicas (Lopes, 1994).

Em recentes estudos envolvendo curvas de lactação (Rekaya et al., 2000; Chang et al., 2001; Jamrozik et al., 2001; Groenewald & Viljoen, 2003), o método Bayesiano foi utilizado com sucesso uma vez que considera todos os parâmetros como variáveis aleatórias, o que reduz, substancialmente, o número de curvas atípicas. Além disso, esse método requer um número menor de dados de produção por animal, pois os conceitos probabilísticos envolvidos diminuem a dependência do ajuste do modelo em relação ao número de dados utilizados (Goodall & Sprevak, 1985).

O método Bayesiano também permite a obtenção imediata de intervalos de credibilidade, levando em conta a incerteza existente nos parâmetros simultaneamente, sendo, portanto, a estimação por intervalo geralmente mais precisa em relação àquela apresentada pelo método freqüentista (Gelman et al., 1997). Além disso, os resultados deste método são mais informativos quando se trata de comparações de curvas provenientes de tratamentos diferentes, pois na maioria das vezes, a distribuição dos parâmetros de modelos não-lineares, e principalmente de funções obtidas a partir desses parâmetros, não segue uma distribuição normal, o que torna complexo o processo de formulação de testes estatísticos por meio do método freqüentista (Groenewald et al., 1996).

Segundo Box & Tiao (1973), o método Bayesiano consiste em uma informação a priori, P(q), a respeito dos parâmetros, de uma função de verossimilhança dos dados, L(y1,...,yn | q), e do cálculo da distribuição de probabilidade a posteriori para os parâme- tros. Pelo Teorema de Bayes, a distribuição da densida- de a posteriori de q, P(q|Sn), é dada por:

sendo Sn = {y1, y2,..., yn}. Como o denominador não depende de q, tem-se que P(q çSn) µ L(q çSn)P(q), ou seja, Posteriori µ Verossimilhança x Priori.

Para se inferir com relação a qualquer elemento de q, a distribuição a posteriori conjunta dos parâmetros, P(q çSn), deve ser integrada em relação a todos os outros elementos que a constituem, ou seja, devem ser obtidas as distribuições marginais de cada parâmetro (Rosa, 1998). Esta integração geralmente não é analítica e necessita de algoritmos iterativos especializados, como o Gibbs Sampler (Amostrador de Gibbs), que faz uso da simulação de Monte Carlo e da teoria das Cadeias de Markov (Sorensen, 1996).

O objetivo deste trabalho foi utilizar o método Bayesiano no ajuste do modelo de Wood em dados de produção de leite de cabras da raça Saanen de primeira e segunda lactação.

Material e Métodos

A produção esperada de leite em kg dia-1, no tempo t, foi modelada pela função de Wood (Wood, 1967), cuja expressão é a seguinte:

em que Yij representa a produção de leite do animal i no tempo de lactação tij; ai corresponde à produção inicial de leite; bi é a taxa crescente de produção até o pico; e ci indica a taxa de declínio da produção após o pico.

Supondo que os resíduos do modelo descrito pela equação 1 sejam multiplicativos e independentes, e adotando a transformação logarítmica, este modelo pode ser reescrito da seguinte maneira:

sendo eij o erro experimental, normalmente e independentemente distribuído com média 0 e variância s2e.

Outras importantes características econômicas da curva de lactação foram determinadas por funções dos parâmetros a, b e c, sendo elas a produção de leite no pico (h), h = (-b/c)b exp(a – b); o tempo de ocorrência do pico a produção total de leite (f), sendo L a duração da lactação em dias e w o intervalo de tempo entre os controles leiteiros; e a persistência da lactação (j),

j = –(b + 1) ln(–c).

A função de verossimilhança obtida da expressão 2 é dada por:

As distribuições a priori utilizadas para os parâmetros mi, mi =[ai, bi,ci]; µ, µ=[a,b,g], sendo a, b e g, respectivamente, as médias dos parâmetros ai, bi e ci; S, a matriz de covariância para os parâmetros a, b e g; e s2 são representadas respectivamente pelas expressões 3 a 6:

em que a expressão 3 é uma normal multivariada; a expressão 5 é uma distribuição de Wishart invertida com matriz escala vR; e a expressão 6 é a priori não informativa de Jeffreys (Jeffreys, 1961).

De acordo com as definições apresentadas, obtém-se a seguinte distribuição conjunta a posteriori:

Descrevendo algebricamente a equação 7, tem-se:

sendo H os hiperparâmetros v e R.

As distribuições condicionais completas a posteriori, necessárias à implementação do algoritmo Gibbs Sampler, foram obtidas da equação (7) , e são apresentadas como segue:

em que N, W e IG representam respectivamente as distribuições Normal Multivariada, Wishart e Gama Inversa.

O algoritmo Gibbs Sampler foi implementado utilizando-se a linguagem IML (Interactive Matrix Language) disponível no software estatístico SAS (SAS Institute, 1990). Considerou-se, em todas as análises efetuadas, um número fixo de 10.000 iterações, com espaçamento entre os pontos amostrados (thin) de 20 observações, e no aquecimento (burn-in) desprezou-se as 4.000 primeiras iterações. As inferências foram realizadas, portanto, considerando as 6.000 iterações restantes.

Amostras das distribuições marginais a posteriori para as funções (pico de lactação, tempo de pico, produção total de leite e persistência da lactação) dos parâmetros do modelo de Wood foram obtidas pela substituição de a, b e c pelas suas respectivas estimativas (a, b e g) a cada iteração do Gibbs Sampler, obtendo-se assim, ao final do processo, um conjunto de valores representativos dessas distribuições.

Para verificar a convergência do algoritmo Gibbs Sampler, usou-se o critério informal (visualização gráfica da convergência) e o critério de Gelman & Rubin (1992), os quais foram aplicados pelo pacote computacional BOA (Bayesian Output Analysis), disponível no software R, utilizando os resultados obtidos do programa em linguagem SAS.

Os dados foram obtidos na Fazenda Nevada, no Município de Carmópolis, MG, e constaram de sete controles leiteiros mensais de 16 cabras da raça Saanen de primeira lactação e de 15 dias da segunda lactação, nascidas entre setembro e dezembro de 2001, semiconfinadas e alimentadas com ração balanceada e silagem de milho.

Um sistema de simulação de dados foi estruturado visando, primeiramente, a avaliar os recursos computacionais empregados e também abordar alguns aspectos do método Bayesiano em relação a diferentes estruturas de matrizes de covariâncias assumidas para os parâmetros.

No teste do algoritmo, elaborado em linguagem SAS, foram simulados dados de produção de leite pela opção RANNOR, utilizando-se os seguintes valores paramétricos: a = 0,5, b = 0,5 e g = -0,15. Consideraram-se dez experimentos com 32 animais, por experimento, e cada animal com dez controles leiteiros. Os resultados foram avaliados para verificar se os valores atribuídos aos parâmetros a, b e g encontravam-se dentro da amplitude do intervalo de credibilidade de 95% em cada experimento. Nesse processo de análise, o Gibbs Sampler foi implementado com 5.000 iterações e um intervalo entre os valores amostrados de 20 iterações.

Na comparação das estimativas obtidas, em diferentes estruturas de covariância para os parâmetros a, b e g, consideraram-se as matrizes auto-regressiva de primeira ordem, AR(1), e auto-regressiva heterocedástica de primeira ordem, ARH(1), cujas formas são dadas, respectivamente, por S1 e S2.

Na matriz AR(1) assumiram-se as seguintes situações: r = 0,2, 0,3, 0,5, 0,7, 0,9 e s2 = 0,05. Já na matriz ARH(1), considerou-se que r = 0,2, 0,3, 0,5, 0,7, 0,9 e

As estimativas obtidas a partir desses parâmetros foram comparadas com os valores paramétricos indicados no parágrafo anterior pelo erro quadrático médio (EQM), definido pela fórmula , em que Q é o número de experimentos simulados.

Resultados e Discussão

As curvas de lactação estimadas nas duas populações não são as curvas médias, mas meramente geradas pelas médias a posteriori das amostras das distribuições marginais dos parâmetros em ambas as populações, ou seja, elas representam as formas relativas do comportamento da produção de leite, em função do tempo, das cabras de primeira e de segunda ordens de parto (Figura 1).


A população de cabras de segunda lactação é mais produtiva, pois apresenta menor taxa de decréscimo da produção pós-pico (g) e maior persistência (j) (Tabela 1). Estes resultados concordam, em parte, com Gonçalves (1996), que aplicou testes de médias após a análise de variância nas estimativas dos parâmetros do modelo de Wood ajustado a dados de cabras Saanen, e obteve diferenças significativas em todos eles, na comparação entre cabras de primeira e segunda lactações. Por outro lado, Gipson & Grossman (1989) não encontraram efeito significativo de ordem de parto sobre nenhum dos parâmetros do modelo difásico ajustado às lactações de cabras leiteiras.

O algoritmo Gibbs Sampler convergiu, em relação a todos os parâmetros, em ambas as populações, pois os valores do coeficiente de convergência (R) estão muito próximos ao valor unitário, o que, segundo Gelman & Rubin (1992), indica que o processo convergiu (Tabela 2). Além disso, a análise informal da convergência, aspecto visual, mostrou a estabilização do processo (Figura 2) e a forma característica da distribuição marginal (Figura 3), como mostrado para a variância do erro de cabras de primeira lactação. Dessa maneira, pode-se acreditar que as estimativas dos parâmetros são, verdadeiramente, as médias das distribuições marginais a posteriori, pois a condição de estacionaridade foi atingida.



O método Bayesiano implementado em linguagem SAS mostrou-se eficiente na estimação dos parâmetros a, b e g, pois os valores paramétricos utilizados na simulação (a = 0,5, b = 0,5 e g = -0,15) encontram-se, em todos os experimentos simulados, dentro do intervalo de 95% de credibilidade (Tabela 3). Resultados semelhantes foram obtidos por Mendoza (1990), que também utilizou este sistema de simulação de dados para avaliar resultados de análises Bayesianas, recomendando sua utilização na avaliação de ensaios de caráter biológico.

À medida que o coeficiente de correlação aumenta, não se verifica uma tendência crescente no valor da raiz quadrada do EQM (Figura 4), que se caracteriza num comportamento típico dos estimadores freqüentistas. Este fato pode estar relacionado com uma menor variabilidade dos estimadores Bayesianos (média da distribuição marginal a posteriori) quando os parâmetros são altamente relacionados. Portanto, estes estimadores podem ser uma alternativa nos estudos de modelos de regressão em que os parâmetros apresentam esta característica.


Não houve grande diferença nos valores da raiz quadrada do EQM, portanto as diferentes variâncias e coeficientes de correlação assumidos em relação aos parâmetros não influenciaram, diretamente, o comportamento do estimador Bayesiano, mostrando-se robusto nas situações de heterogeneidade (Figura 5).


Conclusões

1. A população de cabras de segunda lactação é mais produtiva que a de primeira lactação.

2. O método Bayesiano é eficiente no estudo das curvas de lactação quando os parâmetros são correlacionados entre si.

Recebido em 11 de novembro de 2003 e aprovado em 8 de setembro de 2004

  • BOX, G.E.P.; TIAO, G.C. Bayesian inference in statistical analysis New York: J. Wiley, 1973. 360p.
  • CHANG, Y.M.; REKAYA, R.; GIANOLA, D.; THOMAS, D.L. Genetic variation of lactation curves in dairy sheep: a Bayesian analysis of Wood's function. Livestock Production Science, v.71, p.241-251, 2001.
  • COBUCI, J.A.; EUCLYDES, R.F.; TEODORO, R.L.; VERNEQUE, R.S.; LOPES, P.S.; SILVA, M.A. Aspectos genéticos e ambientais da curva de lactação de vacas da raça Guzerá. Revista da Sociedade Brasileira de Zootecnia, v.30, p.1204-1211, 2001.
  • GALLANT, A.R. Nonlinear statistical models New York: J. Wiley, 1987. 610p.
  • GELMAN, A.; CARLIN, J.B.; STERN, H.S.; RUBIN, D.B. Bayesian data analysis London: Chapman Hall, 1997. 526p.
  • GELMAN, A.; RUBIN, D.B. Inference from iterative simulation using multiple sequences. Statistical Science, v.7, p.457-511, 1992.
  • GIPSON, G.S.; GROSSMAN, M. Diphasic analysis of lactation curves in dairy goats. Journal of Dairy Science, v.72, p.1035-1044, 1989.
  • GONÇALVES, H.C. Fatores genéticos e de meio em algumas características produtivas e reprodutivas de caprinos 1996. 141p. Tese (Doutorado) - Universidade Federal de Viçosa, Viçosa.
  • GONÇALVES, T.M. Estudo da curva de lactação de vacas da raça Gir 1994. 66p. Dissertação (Doutorado) - Universidade Federal de Viçosa, Viçosa.
  • GOODALL, A.E.; SPREVAK, D. A Bayesian estimation of lactation curve of dairy cow. Animal Production, v.40, p.189-193, 1985.
  • GROENEWALD, P.C.N.; FERREIRA, A.V.; MERWE, H.J. van der; SLIPPERS, S.C. Application of Bayesian inference in the comparison of lactation curves of Merino ewes. Animal Science, v.62, p.63-69, 1996.
  • GROENEWALD, P.C.N.; VILJOEN, C.S. A Bayesian model for analysis of lactation curves of dairy goats. Journal of Agricultural, Biological and Environmental Statistics, v.8, p.75-83, 2003.
  • JAMROZIK, J.; GIANOLA, D.; SCHAEFFER, L.R. Bayesian estimation of genetic parameters for test day records in dairy cattle using linear hierarchical models. Livestock Production Science, v.71, p.223-240, 2001.
  • JEFFREYS, H. Theory of probability Oxford: Clarendon, 1961. 325p.
  • LOPES, M.A. Estudo da curva de lactação de um rebanho Holandês variedade preto e branco mantido em um sistema intensivo de produção 1994. 87p. Dissertação (Mestrado) - Universidade Federal de Lavras, Lavras.
  • MENDOZA, M. A Bayesian analysis of the slope ratio bioassay. Biometrics, v.46, p.1059-1069, 1990.
  • REKAYA, R.; CARABÃNO, M.J.; TORO, M.A. Bayesian analysis of lactation curves of Holstein-Friesian cattle using a nonlinear model. Journal of Dairy Science, v.83, p.2691-2701, 2000.
  • ROSA, G.J.M. Análise Bayesiana de modelos lineares mistos robustos via Amostrador de Gibbs 1998. 57p. Tese (Doutorado) - Universidade de São Paulo, Piracicaba.
  • SAS INSTITUTE (Cary, Estados Unidos). SAS/STAT SAS/IML software: usage and reference: version 6. Cary, 1990. 501p.
  • SORENSEN, D. Gibbs Sampling in quantitative genetics Copenhagen: Foulun, 1996. 186p.
  • WOOD, P.D.P. Algebraic model of the lactation curve in cattle. Nature, v.216, p.164-165, 1967.

Datas de Publicação

  • Publicação nesta coleção
    16 Mar 2005
  • Data do Fascículo
    Jan 2005

Histórico

  • Aceito
    08 Set 2004
  • Recebido
    11 Nov 2003
Embrapa Secretaria de Pesquisa e Desenvolvimento; Pesquisa Agropecuária Brasileira Caixa Postal 040315, 70770-901 Brasília DF Brazil, Tel. +55 61 3448-1813, Fax +55 61 3340-5483 - Brasília - DF - Brazil
E-mail: pab@embrapa.br