Acessibilidade / Reportar erro

Análise de agrupamento na seleção de modelos de regressão não-lineares para curvas de crescimento de ovinos cruzados

Cluster analysis applied to nonlinear regression models selection to growth curves of crossed lambs

Resumos

Este estudo teve como objetivo utilizar a análise de agrupamento para classificar modelos de regressão não-lineares usados para descrever a curva de crescimento de ovinos cruzados, tendo em vista os resultados de diferentes avaliadores de qualidade de ajuste. Para tanto, utilizaram-se dados de peso-idade dos seguintes cruzamentos entre raças de ovinos de corte: Dorper x Morada Nova, Dorper x Rabo Largo e Dorper x Santa Inês. Após a indicação do melhor modelo, objetivou-se ainda aplicar a técnica de identidade de modelos a fim de identificar o cruzamento mais produtivo. Foram ajustados doze modelos não-lineares, cuja qualidade de ajuste foi medida pelo coeficiente de determinação ajustado, critérios de informação de Akaike e Bayesiano, erro quadrático médio de predição e coeficiente de determinação de predição. A análise de agrupamento indicou o modelo Richards como o mais adequado para descrever as curvas de crescimento dos três grupos genéticos considerados, e os testes de identidade de modelos indicaram o cruzamento Dorper x Santa Inês como sendo o mais indicado para a pecuária local.

classificação multivariada; identidade de modelos; Ovis aries


This study had the objectives to use the cluster analysis in order to classify nonlinear regression models used to describe the growth curve in relation to different quality fit evaluators. Were utilized weight-age data from the following crossbred beef lambs Dorper x Morada Nova, Dorper x Rabo Largo e Dorper x Santa Inês. After the choice of the best model, we aimed also to apply the model identity in order to identify the most efficient crossbred group. Eleven nonlinear models were used, whose fit quality was measured by determination coefficient, Akaike information criterion, Bayesian information criterion, mean quadratic error of prediction and predicted determination coefficient. The cluster analysis indicated the Richards as the best model for the three data sets, and the model identity tests revealed that the Dorper x Santa Inês crossbred group was recommend for meat production.

multivariate classification; model identity; Ovis aries


ARTIGOS CIENTÍFICOS

PRODUÇÃO ANIMAL

Análise de agrupamento na seleção de modelos de regressão não-lineares para curvas de crescimento de ovinos cruzados

Cluster analysis applied to nonlinear regression models selection to growth curves of crossed lambs

Fernanda Gomes da SilveiraI,1 1 Autor para correspondência. ; Fabyano Fonseca e SilvaI; Paulo Luiz Souza CarneiroII; Carlos Henrique Mendes MalhadoII; Joel Augusto MunizIII

IDepartamento de Estatística, Universidade Federal de Viçosa (UFV), 36570-000, Viçosa, MG, Brasil. E-mail: fernandaphn@yahoo.com.br

IIDepartamento de Ciências Biológicas, Universidade Estadual do Sudoeste da Bahia (UESB), Jequié, BA, Brasil

IIIDepartamento de Ciências Exatas, Universidade Federal de Lavras (UFLA), Lavras, MG, Brasil

RESUMO

Este estudo teve como objetivo utilizar a análise de agrupamento para classificar modelos de regressão não-lineares usados para descrever a curva de crescimento de ovinos cruzados, tendo em vista os resultados de diferentes avaliadores de qualidade de ajuste. Para tanto, utilizaram-se dados de peso-idade dos seguintes cruzamentos entre raças de ovinos de corte: Dorper x Morada Nova, Dorper x Rabo Largo e Dorper x Santa Inês. Após a indicação do melhor modelo, objetivou-se ainda aplicar a técnica de identidade de modelos a fim de identificar o cruzamento mais produtivo. Foram ajustados doze modelos não-lineares, cuja qualidade de ajuste foi medida pelo coeficiente de determinação ajustado, critérios de informação de Akaike e Bayesiano, erro quadrático médio de predição e coeficiente de determinação de predição. A análise de agrupamento indicou o modelo Richards como o mais adequado para descrever as curvas de crescimento dos três grupos genéticos considerados, e os testes de identidade de modelos indicaram o cruzamento Dorper x Santa Inês como sendo o mais indicado para a pecuária local.

Palavras-chave: classificação multivariada, identidade de modelos, Ovis aries.

ABSTRACT

This study had the objectives to use the cluster analysis in order to classify nonlinear regression models used to describe the growth curve in relation to different quality fit evaluators. Were utilized weight-age data from the following crossbred beef lambs Dorper x Morada Nova, Dorper x Rabo Largo e Dorper x Santa Inês. After the choice of the best model, we aimed also to apply the model identity in order to identify the most efficient crossbred group. Eleven nonlinear models were used, whose fit quality was measured by determination coefficient, Akaike information criterion, Bayesian information criterion, mean quadratic error of prediction and predicted determination coefficient. The cluster analysis indicated the Richards as the best model for the three data sets, and the model identity tests revealed that the Dorper x Santa Inês crossbred group was recommend for meat production.

Key words: multivariate classification, model identity, Ovis aries.

INTRODUÇÃO

Em geral, raças naturalizadas ou locais de ovinos de corte do Nordeste brasileiro são adaptadas às condições de solo e clima dessa região, conseguindo assim um bom desempenho de crescimento em condições quase sempre limitantes à criação de outras raças. Segundo MALHADO et al. (2009), uma das formas de aumentar a produção de carne nessa região é a utilização de cruzamentos de raças locais com raças exóticas especializadas para a produção de carne, como, por exemplo, a raça Dorper. De acordo com CARNEIRO et al. (2007), o sucesso de tais cruzamentos pode ser avaliado de forma efetiva por meio da análise das curvas de crescimento dos animais, as quais relacionam o peso com intervalos pré-definidos de tempo.

Modelos de regressão não-linear têm se mostrado adequados para descrever estas curvas, pois apresentam parâmetros que podem ser interpretados biologicamente, como o peso adulto e a taxa de maturidade (MAZZINI et al., 2005). Porém, a escolha dos melhores modelos não tem sido tarefa fácil, uma vez que diferentes avaliadores de qualidade de ajuste são propostos na literatura, e cada um preconiza determinada característica, como, por exemplo, a minimização dos erros de ajustes, a habilidade de predição e a simplicidade do modelo (SILVEIRA, 2010). Tal escolha é ainda mais difícil quando se tem diferentes populações, ou cruzamentos, pois muitas vezes o modelo que melhor representou o crescimento dos animais de uma população pode não ser o melhor para as demais.

Além da escolha do melhor modelo, ao se considerar várias populações, o pesquisador também tem interesse em comparar os parâmetros das curvas a fim de indicar para qual das populações o processo de crescimento foi mais eficiente. Segundo REGAZZI (2003), a técnica de identidade de modelos é a mais indicada para tal finalidade, porém, para aplicá-la, um mesmo modelo de regressão deve ser ajustado para todas as populações, o que implica a necessidade de utilização de métodos que permitam indicar quais modelos são plausíveis para todas elas.

A análise de agrupamento, a qual possibilita a formação de grupos homogêneos de acordo com a avaliação simultânea de várias características de interesse, pode ser útil para agrupar modelos cujos resultados dos avaliadores de qualidade de ajuste sejam similares dentro de cada população. Assim, os modelos comuns aos grupos representativos dos melhores ajustes em cada população podem ser identificados por meio de medidas de interseção (SILVEIRA, 2010).

De acordo com os aspectos apresentados, o objetivo principal do presente trabalho foi utilizar a análise de agrupamento para classificar modelos de regressão não-lineares, usados para descrever a curva de crescimento, tendo em vista os resultados de diferentes avaliadores de qualidade de ajuste ao se considerar dados de peso-idade de três diferentes cruzamentos de ovinos de corte. Após a escolha do modelo mais adequado, objetivou-se também aplicar a técnica de identidade de modelos para de identificar o cruzamento mais produtivo.

MATERIAL E MÉTODOS

Os dados utilizados neste estudo são oriundos de um experimento que foi conduzido na Estação Experimental de Jaguaquara, pertencente à Empresa Baiana de Desenvolvimento Agrícola S.A., localizada no Município de Jaguaquara, BA, microrregião administrativa de Jequié, BA, de 2003 a 2005.

Foram avaliados os produtos F1, compreendendo 156 borregos, dos cruzamentos Dorper x Morada Nova (DMN); Dorper x Rabo Largo (DRL) e Dorper x Santa Inês (DSI). Destes, 36 DMN (26 machos e 10 fêmeas), 61 DRL (36 machos e 25 fêmeas) e 59 DSI (31 machos e 28 fêmeas) são provenientes do cruzamento de 69 matrizes pluríparas (23 Santa Inês, 23 Morada Nova e 23 Rabo Largo) com 2 reprodutores da raça Dorper. Os animais foram pesados a partir dos 20 dias de idade até os 300 dias de idade em intervalos de aproximadamente 15 dias.

Após o desmame, que ocorreu aos 84 dias, os produtos F1 foram mantidos em sistema de produção semi-intensivo, com pastejo durante o dia em áreas cultivadas com capim Panicum maximum e Brachiaria decumbens com sal mineral à disposição, e recolhidos no final da tarde para o aprisco. Durante o inverno, período mais seco do ano (junho a outubro), os animais receberam suplementação com mistura múltipla comercial.

Os modelos de regressão não-linear apresentados na tabela 1 foram ajustados aos dados médios de peso-idade de ovinos por meio do PROC MODEL do SAS® (SAS INSTITUTE, 2002) via método dos quadrados mínimos ordinários com algoritmo de Gauss-Newton. Para todos os modelos apresentados na tabela 1 (SILVEIRA, 2010), o parâmetro β1 representa o peso adulto do animal; o β2 não apresenta interpretação prática; e o parâmetro β3 a taxa de maturidade. Os modelos que apresentam o parâmetro β4 possuem ponto de inflexão variável, e os demais modelos ou apresentam o ponto de inflexão fixo, ou não o possuem, como é o caso dos modelos Brody e Michaelis-Menten. Para todos os modelos, assumiu-se que εi ~ N(0,σ2).

Foram utilizados cinco avaliadores da qualidade de ajuste: coeficiente de determinação ajustado (R2aj), critério de informação de Akaike (AIC), critério de informação bayesiano (BIC), erro quadrático médio de predição (MEP) e coeficiente de determinação de predição (R2p). As expressões desses avaliadores também são apresentadas de forma detalhada em SILVEIRA (2010).

Após a obtenção dos avaliadores de qualidade para cada modelo, confeccionaram-se então conjuntos de dados multivariados, nos quais os modelos correspondem às unidades, ou aos indivíduos, e os avaliadores às variáveis. Estes foram submetidos à análise de agrupamento no PROC CLUSTER (SAS INSTITUTE, 2002), considerando o método centróide. Nessa análise, obtiveram-se os valores do índice RMSSTD (Root Mean Square Standard Deviation, ou, raiz quadrada do desvio padrão médio), o qual possibilita identificar o número ótimo de cluster de acordo com CECON et al. (2008). Como complemento dessa última análise, utilizou-se o PROC TREE (SAS INSTITUTE, 2002), que fornece o dendrograma e permite verificar quais modelos pertenciam aos diferentes grupos obtidos pela discriminação estatística em relação aos avaliadores de qualidade.

Após a escolha de um modelo que se ajustou bem aos três grupos genéticos, aplicou-se o teste de identidade de modelos proposto por REGAZZI (2003) com o intuito de verificar diferenças nas estimativas dos parâmetros entre os três cruzamentos avaliados. Para tanto, utilizou-se o PROC MODEL (SAS INSTITUTE, 2002) com auxílio de variáveis dummy.

RESULTADOS E DISCUSSÃO

Nas tabelas 2, 3, e 4 , são apresentados, respectivamente para os cruzamentos DMN, DRL e DSI, os resultados dos avaliadores da qualidade de ajuste para cada modelo. Nota-se, nas tabelas 2, 3, e 4 , que, em média, os ajustes dos modelos para o grupo DSI (Tabela 4 ) apresentaram maior qualidade que os demais grupos, uma vez que foram observados os maiores valores para o R2aj e R2p e os menores para AIC, BIC e MEP. Essas informações indicam que os dados médios do grupo DSI apresentam um comportamento mais característico de curva de crescimento (Figura 1), uma vez que os modelos específicos para descrever este fenômeno se ajustaram melhor.


Em relação à variabilidade relativa dos avaliadores, nota-se que o MEP é o que apresenta maior CV, talvez porque esse avaliador, calculado com base na remoção sucessiva de observações dos conjuntos de dados originais, represente a capacidade dos modelos em se ajustarem bem na presença de dados faltantes e, como já demonstrado por NOBRE et al. (1987), a qualidade desses modelos varia significativamente com a perda de observações. Quanto às medidas baseadas no conceito de coeficiente de determinação (R2aj e R2p), foram aquelas que apresentaram menores CV's, indicando que este avaliador realmente apresenta baixa variabilidade. Quanto a essa informação, OLIVEIRA et al. (2000) relatam que as diferenças entre os R2aj de diferentes modelos usados no estudo de curvas de crescimento geralmente são irrisórias, e recomendam outros avaliadores.

Para todos os grupos genéticos avaliados, o número ótimo de cluster encontrado foi três, ou seja, os onze modelos considerados foram condensados em apenas três grupos distintos. Na tabela 5, são apresentados os clusters, ordenados pelos valores mais plausíveis para os avaliadores da qualidade de ajuste, com os seus respectivos modelos e médias de tais avaliadores. Ao verificar quais modelos são pertencentes aos clusters 1, os quais contêm os melhores modelos, nota-se que o modelo C (Richards) encontra-se entre os melhores para descrever o crescimento dos grupos DRL e DSI, enquanto que o modelo Q (Michaelis-Menten Modificado) encontra-se entre os melhores para descrever o crescimento dos grupos DMN e DSI. Entretanto, optou-se pelo modelo C, devido à maior facilidade de interpretação de seus parâmetros, e também pelo fato de tal modelo ser mais utilizado para descrição de curvas de crescimento de ovinos (LOBO et al., 2006) em relação ao modelo Q.

De acordo com esses testes de identidade de modelos (Tabela 6), nota-se que houve diferenças entre as estimativas do peso adulto (β1) para o cruzamento DRL (12 = 27,4394) em relação aos cruzamentos DSI (13 = 33,1862) e DMN (11 = 33,4791). Quanto à taxa de maturidade (β3), observa-se que houve diferença significativa para todas as comparações efetuadas, e as estimativas deste parâmetro para os cruzamentos DMN, DRL e DSI foram, respectivamente, 0,0085, 0,0275 e 0,0123.

De acordo com resultados da tabela 6, pode-se inferir que os cruzamentos DMN e DSI apresentam pesos adultos maiores que o do grupo DRL, e que a maior velocidade de crescimento foi constatada para o cruzamento DRL, seguido pelo DSI e DMN. De forma geral, o antagonismo relacionado ao fato de cruzamentos com maiores valores para o peso adulto apresentarem menores valores para a taxa de maturidade pode ser explicado pela correlação negativa entre tais parâmetros, a qual já foi relatada em vários trabalhos (MALHADO et al., 2008; MALHADO et al., 2009). Sob o ponto de vista zootécnico, o cruzamento DSI é o mais indicado para se explorar a produção de carne, pois, se comparado ao DMN, apresentou peso adulto estatisticamente igual e maior taxa de maturidade.

CONCLUSÃO

A metodologia proposta no presente trabalho mostrou-se adequada para classificar modelos não-lineares tendo em vista a escolha de um único e melhor modelo para descrever o crescimento dos três grupos genéticos estudados. O modelo Richards foi o que apresentou os melhores ajustes e, de acordo com testes de identidade de modelos, o grupo genético DSI foi o mais recomendado para exploração de carne, uma vez que conciliou valores desejados para peso adulto e taxa de maturidade.

Recebido para publicação 10.08.10

Aprovado em 10.02.11

Devolvido pelo autor 21.03.11

CR-3957

  • CARNEIRO, P.L.S. et al. Desenvolvimento ponderal e diversidade fenotípica entre cruzamentos de ovinos Dorper com raças locais. Pesquisa Agropecuária Brasileira, v.42, n.7, p.991-998, 2007. Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0100-204X2007000700011&lang=pt>. Acesso em: 13 jul. 2009. doi: 10.1590/S0100-204X2007000700011.
  • CECON, P.R. et al. Análise de medidas repetidas na avaliação de clones de café 'Conilon'. Pesquisa Agropecuária Brasileira, v.43, n.9, p.1171-1176, 2008. Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0100204X2008000900011& lang=pt>. Acesso em: 17 jul. 2009. doi: 10.1590/S0100-204X2008000900011.
  • LOBO, R.N.B. et al. Parâmetros genéticos de características estimadas da curva de crescimento de ovinos da raça Santa Inês. Revista Brasileira de Zootecnia, v.35, n.3, p.1012-1019, 2006. Disponível em: <http://www.scielo.br/scielo.php?script=sciarttext&pid=_S1516-5982006000400011&lang=pt>. Acesso em: 23 maio, 2009. doi: 10.1590/S1516-35982006000400011.
  • MALHADO, C.H.M. et al. Growth curves in Dorper sheep crossed with the local Brazilian breeds, Morada Nova, Rabo Largo, and Santa Inês. Small Ruminant Research, v.84, p.16-21, 2009. Disponível em: <http://www.journals.elsevierhealth.com/periodicals/rumin/article/PIIS0921448809000807/abstract?showOmimLinks=true>. Acesso em: 18 out. 2009. doi: 10.1016/j.smallrumres.2009.04.006.
  • MALHADO, C.H.M. et al. Curva de crescimento em ovinos mestiços Santa Inês x Texel criados no Sudoeste do Estado da Bahia. Revista Brasileira de Saúde e Produção Animal, v.9, n.2, p.210-218, 2008. Disponível em: <http://revistas.ufba.br/index.php/rbspa/article/view/1059/595>. Acesso em: 21 fev. 2009.
  • MAZZINI, A.R. et al. Curva de crescimento de novilhos Hereford: heterocedasticidade e resíduos Autorregressivos. Ciência Rural, v35, n.2, p.422-427, 2005. Disponível em: <http://www.scielo.br/scielo.php?pid=S0103-84782005000200028&script=sciarttext>. Acesso em: 15 jan. 2009. doi: 10.1590/S0103-84782005000200028.
  • NOBRE, P.R.C. et al. Curvas de crescimento de gado Nelore ajustadas para diferentes freqüências de pesagens. Pesquisa Agropecuária Brasileira, v.22, n 9/10, p.1027-1037, 1987.
  • OLIVEIRA, H.N. de et al. Comparação de modelos não-lineares para descrever o crescimento de fêmeas da raça Guzerá. Pesquisa Agropecuária Brasileira, v.35, n.9, p.1843-1851, 2000. Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext &pid=S0100204X2000000900017&lang=pt Acesso em: 11 fev. 2009. doi: 10.1590/S0100-204X2000000900017>
  • REGAZZI, A.J. Teste para verificar a igualdade de parâmetros e a identidade de modelos de regressão não-linear. Revista Ceres, v.50, n.287, p.9-26, 2003. Disponível em: <http://www.ceres.ufv.br/CERES/revistas/V50N287P19303.pdf>. Acesso em: 05 out. 2009.
  • SAS Institute Inc. Statistical Analysis System user's guide Version 9.0 ed. Cary, 2002. 513p.
  • SILVEIRA, F.G. da. Classificação multivariada de modelos de crescimento para grupos genéticos de ovinos de corte 2010. 61f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, MG.
  • 1
    Autor para correspondência.
  • Datas de Publicação

    • Publicação nesta coleção
      13 Out 2011
    • Data do Fascículo
      Abr 2011

    Histórico

    • Recebido
      10 Ago 2010
    • Aceito
      10 Fev 2011
    Universidade Federal de Santa Maria Universidade Federal de Santa Maria, Centro de Ciências Rurais , 97105-900 Santa Maria RS Brazil , Tel.: +55 55 3220-8698 , Fax: +55 55 3220-8695 - Santa Maria - RS - Brazil
    E-mail: cienciarural@mail.ufsm.br