Resumos
RESUMO - Estimativas de variâncias, covariâncias e herdabilidades (h²) de dados de pesos ao nascimento (y1), à desmama (y2), aos 12 (y3), 18 (y4) e 24 meses (y5) e circunferência escrotal aos 12 (y6) meses de idade foram obtidas de três amostras de dados de animais Canchim, machos e fêmeas, nascidos de 1961 a 1991, em São Carlos, SP. Foram utilizadas análises univariada, por meio do Método 3 de Henderson, Máxima Verossimilhança (ML), ML Restrita (REML), Método Iterativo Simples de Henderson (IHSM), Método da Estimação Quadrática Não-viesada de Variância Mínima (MIVQUEo) e procedimento GLM do SAS, e multivariada por IHSM, ML e REML, com e sem a inclusão da matriz de parentesco entre os animais. As estimativas de h² variaram de 0,33 a 0,34 (y1), 0,30 a 0,81 (y2), 0,28 a 0,68 (y3), 0,27 a 0,27 (y4), 0,40 a 0,40 (y5) e 0,40 a 0,40 (y6). Detectou-se afastamento da normalidade para quase todas as características e heterogeneidade de variâncias para os efeitos fixos de sexo, ano e época de nascimento, idade da vaca ao parto, geração do animal e efeito aleatório de touros. A transformação dos dados fornecendo escores normais como resposta foi a mais eficiente em aproximar os dados a uma distribuição normal. Métodos de estimação, análise univariada ou multivariada, amostragem e tipo de transformação de dados, nesta ordem, foram os que mais influenciaram as estimativas de h².
bovinos de corte; componentes de variância; métodos de estimação
ABSTRACT - Estimates of variance, covariance and heritabilities (h²) for body weights at birth (y1), weaning (y2), 12 (y3), 18 (y4) and 24 (y5) months of age, and scrotal circumference at 12 months of age (y6) were obtained from three data sets of purebreed Canchim males and females, born from 1961 to 1969 in São Carlos, São Paulo State. The genetic parameters were obtained by means of univariate analysis by Henderson Method 3, Maximum Likelihood (ML), Restricted ML (REML), Iterative Henderson Simple Method, Minimum Variance Quadratic Unbiased Estimation (MIVQUEo) and GLM procedure of SAS, and multivariate analysis by IHSM, ML and REML, with and without the relation matrix of animals. The heritability estimates ranged from 0.33 to 0.34 (y1), 0.30 to 0.81 (y2), 0.28 to 0.68 (y3) 0.27 to 0.27 (y4), 0.40 to 0.40 (y5) and 0.40 to 0.40 (y6). No normality of data for almost all traits and heterogeneity of variance for fixed effects of gender, year and season of birth, age of dam at calving, animal generation and random effect of sire was detected. Data transformation into normal scores provided the most efficient way to bring data near to a normal distribution. Estimation methods, type of analysis (univariate or multivariate analysis), sampling and type of transformation procedure, in this order, were the factors that influenced the most the heritability estimates.
beef cattle; estimation methods; variance components
Avaliação de Procedimentos na Estimação de Parâmetros Genéticos em Bovinos de Corte
Alfredo Ribeiro de Freitas1 1 Pesquisador da Embrapa Pecuária Sudeste, Caixa Postal 339, 13560-970 - São Carlos, SP. Bolsista do CNPq. E.mail: ribeiro@cppse.embrapa.br
RESUMO - Estimativas de variâncias, covariâncias e herdabilidades (h2) de dados de pesos ao nascimento (y1), à desmama (y2), aos 12 (y3), 18 (y4) e 24 meses (y5) e circunferência escrotal aos 12 (y6) meses de idade foram obtidas de três amostras de dados de animais Canchim, machos e fêmeas, nascidos de 1961 a 1991, em São Carlos, SP. Foram utilizadas análises univariada, por meio do Método 3 de Henderson, Máxima Verossimilhança (ML), ML Restrita (REML), Método Iterativo Simples de Henderson (IHSM), Método da Estimação Quadrática Não-viesada de Variância Mínima (MIVQUEo) e procedimento GLM do SAS, e multivariada por IHSM, ML e REML, com e sem a inclusão da matriz de parentesco entre os animais. As estimativas de h2 variaram de 0,33 a 0,34 (y1), 0,30 a 0,81 (y2), 0,28 a 0,68 (y3), 0,27 a 0,27 (y4), 0,40 a 0,40 (y5) e 0,40 a 0,40 (y6). Detectou-se afastamento da normalidade para quase todas as características e heterogeneidade de variâncias para os efeitos fixos de sexo, ano e época de nascimento, idade da vaca ao parto, geração do animal e efeito aleatório de touros. A transformação dos dados fornecendo escores normais como resposta foi a mais eficiente em aproximar os dados a uma distribuição normal. Métodos de estimação, análise univariada ou multivariada, amostragem e tipo de transformação de dados, nesta ordem, foram os que mais influenciaram as estimativas de h2.
Palavras-chave: bovinos de corte, componentes de variância, métodos de estimação
Procedures Evaluation in the Estimates of Genetic Parameters of Cattle
ABSTRACT - Estimates of variance, covariance and heritabilities (h2) for body weights at birth (y1), weaning (y2), 12 (y3), 18 (y4) and 24 (y5) months of age, and scrotal circumference at 12 months of age (y6) were obtained from three data sets of purebreed Canchim males and females, born from 1961 to 1969 in São Carlos, São Paulo State. The genetic parameters were obtained by means of univariate analysis by Henderson Method 3, Maximum Likelihood (ML), Restricted ML (REML), Iterative Henderson Simple Method, Minimum Variance Quadratic Unbiased Estimation (MIVQUEo) and GLM procedure of SAS, and multivariate analysis by IHSM, ML and REML, with and without the relation matrix of animals. The heritability estimates ranged from 0.33 to 0.34 (y1), 0.30 to 0.81 (y2), 0.28 to 0.68 (y3) 0.27 to 0.27 (y4), 0.40 to 0.40 (y5) and 0.40 to 0.40 (y6). No normality of data for almost all traits and heterogeneity of variance for fixed effects of gender, year and season of birth, age of dam at calving, animal generation and random effect of sire was detected. Data transformation into normal scores provided the most efficient way to bring data near to a normal distribution. Estimation methods, type of analysis (univariate or multivariate analysis), sampling and type of transformation procedure, in this order, were the factors that influenced the most the heritability estimates.
Key Words: beef cattle, estimation methods, variance components
Introdução
Para planejar e orientar um programa de melhoramento genético de bovinos, é necessário estimar parâmetros genéticos, utilizando-se dados desbalanceados, sujeitos a grandes influências ambientais e de manejo.
A precisão desses estimadores é dependente de um conjunto de fatores, destacando-se o método de estimação, pois, embora o estado da arte seja estimar componentes de variâncias por Máxima Verossimilhança Restrita (REML) em um modelo animal e predizer valores genéticos por meio do BLUP, isto nem sempre é possivel e existem pelo menos outros 10 métodos de estimação em uso.
A não-normalidade dos dados, a assimetria e a curtose associadas aos dados também influenciam as inferências obtidas, sendo mais problemáticas em análises multivariadas (COCHRAN e COX, 1978; Brownie et al., 1990; e AZZALINI e DALLA VALLE, 1996). A heterogeneidade de variâncias, como problema correlato, quando não é devidamente estudada, pode implicar em predição viciada do valor genético, redução do progresso genético e seleção desproporcional de animais oriundos de ambientes com variâncias diferentes (RODRÍGUEZ-ALMEIDA et al., 1995a, b; MEUWISSEN et al., 1996).
Fatores como os algoritmos de estimação usando o REML, diferentes amostras de dados de um rebanho, tipo de transformação dos dados e de análise - univariada ou multivariada, idade do animal, sexo e raça, também, acarretam variações consideráveis nas estimativas de h2 e de correlações genéticas (RODRÍGUEZ-ALMEIDA et al., 1995a, b; MEYER e SMITH, 1996; e ROBERT e DUCROCQ, 1996).
O objetivo deste trabalho foi avaliar a magnitude da influência de tipo de análise (univariada versus multivariada), métodos e algoritmos de estimação, tipo de transformação de dados e diferentes amostragem de dados no rebanho sobre estimativas de variâncias, covariâncias e herdabilidades de características relacionadas ao desenvolvimento ponderal de animais da raça Canchim.
Material e Métodos
Obtenção dos dados
Foram utilizadas três amostras de dados de animais da raça Canchim, nascidos na Embrapa/Centro de Pesquisa de Pecuária do Sudeste, município de São Carlos, SP: 2511 animais nascidos de 1969 a 1991 (amostra A); 1125 animais nascidos de 1982 a 1988 (amostra B); e 890 animais nascidos de 1982 a 1990 (amostra C). Foram analisados os dados de pesos ao nascimento (y1), à desmama (y2), aos 12 (y3),18 (y4) e 24 meses (y5) e a circunferência escrotal aos doze meses de idade (y6). Foram considerados os efeitos de sexo (S), ano e época de nascimento (época 1, de maio a julho, e época 2, de agosto a dezembro), idade da vaca ao parto (IV: sendo < 4 e > 11 anos, as extremas), geração do animal e efeito aleatório de touros.
Metodologia de análise
Estatísticas descritivas
Foram utilizados a estatística W de Shapiro-Wilks (SAS, 1993), para verificar se os valores observados para cada característica seguiam distribuição normal, e o teste qui-quadrado de Bartlett, para testar a hipótese de homogeneidade de variâncias dentro dos níveis dos efeitos fixos e aleatórios. Os dados de cada característica foram analisados em quatro escalas: original (yobs), logarítmica (ylog), padronizada yzi=(yi-)/s (yz) e a de escores normais de BLOM (yblom) do procedimento RANK do SAS (SAS, 1996). Essa transformação é adequada a uma variável aleatória yi de distribuição não normal e assimétrica com média e variância s2, fornecendo como resposta escores normais esperados para uma distribuição normal.
Estimativas dos parâmetros genéticos
As estimativas dos parâmetros genéticos foram obtidas de análises uni e multivariada por meio dos métodos da Máxima Verossimilhança - ML (HARTLEY e RAO, 1967), ML Restrita - REML (PATTERSON e THOMPSON, 1971), Método 3 (3H) e Método Iterativo Simples de Henderson (IHSM), ambos descritos em HENDERSON (1984) e Método da Estimação Quadrática Não-viesada de Variância Mínima (MIVQUEo), "default" do procedimento VARCOMP do SAS (SAS, 1993). Para a convergência das variâncias e covariâncias por ML e REML, foram usados o algoritmo de Newton-Raphson-NR (JENRICH e SAMPSON, 1976 ) e o EM ("Expectation-Maximization") de DEMPSTER et al., (1977), para análises univariada e multivariada, respectivamente. Esses algoritmos são iterativos e requerem derivadas, esperanças e inversas da função de verossimilhança. Os valores iniciais das variâncias e covariâncias genéticas e residuais foram obtidos por meio do procedimento GLM do SAS, que utiliza o método dos quadrados mínimos (SAS, 1993).
Nas análises univariadas, foram utilizados os métodos 3H, IHSM, ML, REML (HENDERSON, 1984; FREITAS e VENCOVSKY 1993b) e MIVQUE(o). Para as análises multivariada com duas características e inclusão da matriz de parentesco entre os animais, foram utilizados IHSM, ML e REML (FREITAS e VENCOVSKY, 1993a); com três características, foram utilizados o REML em transformação canônica (JENSEN e MAO, 1988; FREITAS et al., 1994) e o IHSM conforme FREITAS et al. (1995).
O modelo linear misto para cada situação foi formulado considerando os efeitos fixos de sexo, ano e época de nascimento, idade da vaca ao parto, geração e época de nascimento e aleatório de touros.
Resultados e Discussão
A amplitude dos valores das estimativas de assimetria e curtose dos pesos ao nascimento (y1), à desmama (y2), aos 12 (y3), 18 (y4) e 24 (y5) meses de idade e circunferência escrotal (y6) aos 12 meses de idade estão na Tabela 1. Rejeitou-se (P<0,01), para quase todas as características e amostra, a hipótese de que os dados são provenientes de uma população com distribuição normal, com a assimetria variando de -0,16 (y3) a 0,96 (y5), e a curtose de -0,66 (y2) a 1,98 (y4). Apesar de a pressuposição de normalidade dos dados ser crucial para o procedimento de estimação por ML e REML, a literatura não é informativa sobre como o não atendimento desta exigência influencia as estimativas de parâmetros genéticos no melhoramento animal. Na análise de variância, entretanto, há evidências de que os valores da curtose e, em menor extensão, da assimetria dos dados (SCHEFFÉ, 1959) são os indicadores mais importantes de como os desvios de normalidade dos dados influenciam as inferências obtidas. Segundo COCHRAN e COX (1978), a não-normalidade dos dados pode influir negativamente na estimação dos efeitos fixos, no uso dos testes t e F e na heterogeneidade da variância do erro. Entretanto, como a estimação dos componentes de variâncias e covariâncias geralmente é feita por REML, cuja função de verossimilhança é construída com base em contrastes de resíduos, após o ajuste dos efeitos fixos do modelo misto (DAVIDIAN e GILTINAN, 1996), quaisquer deficiências desses ajustes irão interferir nas estimativas por REML.
Observando-se ainda a Tabela 1, pode-se inferir que a qualidade dos dados decresce (maiores coeficientes de assimetria e de curtose) com a idade. Segundo BROWNIE et al. (1990) e DAVIDIAN e GILTINAN (1996), em estudos de crescimento, é comum observar variabilidade crescente na resposta dos indivíduos em função do tempo, denominada de "fenômeno da inflação de variância". Para dados de desenvolvimento ponderal de bovinos, o aumento da variância entre indivíduos, com a idade, pode ser explicado também pela maior dificuldade de se pesar o animal adulto e pelo acúmulo de influências ambientais. Esses resultados sugerem maior rigor dos métodos de análise de dados de desenvolvimento ponderal de bovinos à idade adulta.
Com exceção de algumas características e amostra, houve heterogeneidade de variâncias (P<0,05), pelo teste Bartlett, para os efeitos estudados (Tabela 2). Observou-se heterogeneidade de variâncias crescente na resposta dos animais com a idade, fato associado ao fenômeno da "inflação de variância" e também quando se aumenta o número de níveis de um efeito (Tabela 1). Esse último pode ser explicado pelo maior desbalanceamento no número de repetições e nos efeitos ambientais associados a este.
Os problemas decorrentes da heterogeneidade de variâncias sobre as propriedades dos testes t e F da ANOVA são enormes e têm sido discutidos em vários trabalhos. Uma abordagem interessante sobre o assunto pode ser vista em BROWNIE et al. (1990). No melhoramento animal, quando a heterogeneidade de variância dos efeitos do modelo não é devidamente estudada, pode ocorrer predição viciada do valor genético e, conseqüentemente, das DEPs dos animais (RODRIGUEZ-ALMEIDA et al., 1995a, 1995b). Segundo MEUWISSEN et al. (1996), apenas com a correção da heterogeneidade de variâncias dentro de rebanhos em dados de produção de leite o viés dos valores genéticos reduziu em cerca de 19%. Redução do progresso genético e ainda seleção desproporcional de animais oriundos de ambientes com variâncias diferentes foram encontradas por vários autores (BROTHERSTONE e HILL, 1986; DE VEER e VAN VLECK, 1987; BOLDMAN e FREEMAN, 1990; GIANOLA et al., 1992; WEIGEL e GIANOLA, 1992; COOK e WEISBERG, 1994; BAXTER, 1995; e RAMOS et al., 1996). Este fato comprova a hipótese de homogeneidade de variância por meio dos efeitos fixos, assumida na REML, em que o método mais utilizado para estimação de variâncias e covariâncias, nem sempre é atendida. Assumir esta hipótese na estrutura de dispersão dos dados, quando a mesma não é atendida, implica em prejuízos na resposta à seleção dos animais (GIANOLA et al., 1992). A situação é mais complicada, quando se trata de análise multivariada (WEIGEL e GIANOLA, 1992), pois, não raro, heterogeneidade de variâncias também significa heterogeneidade da matriz de covariâncias, e o impacto deste fato sobre o progresso genético esperado e realizado é mais importante que no caso univariado. Dos procedimentos utilizados para minimizar os efeitos da heterogeneidade de variâncias nas estimativas de parâmetros genéticos, pode-se destacar o de VISSCHER (1992), que estuda esse efeito dentro de correlações intraclasse, e o de MEUWISSEN et al. (1996), que estimam valores genéticos e corrigem heterogeneidade de variância fenotípica dentro de rebanho-ano.
Para a estimação dos componentes de variâncias e covariâncias, usando-se os métodos ML e REML e a amostra de dados B (Tabela 3), foram necessárias oito iterações para y1 e y2, nas análises univariadas por meio do algoritmo de NR e 40 iterações nas análises multivariada, por meio do EM.
A velocidade de convergência utilizando-se o NR foi similar à encontrado na literatura para ML e REML em análises univariadas e tamanhos de arquivos semelhantes (HEMMERLE e HARTLEY, 1973; TAYLOR e EVERETT, 1985). Embora esse algoritmo seja sensível a valores iniciais pobres, permite localizar o valor máximo da função de verossimilhança com poucas iterações, quando o mesmo está próximo ao valor verdadeiro (HARVILLE, 1977).
O aumento no número de iterações nas análises multivariada justifica-se pelo fato de que a verossimilhança pelo EM incrementa monotomicamente em progressão geométrica, exigindo, porém, número grande de iterações (JENSEN e MAO, 1988; MEYER e SMITH, 1996; ROBERT e DUCROCQ, 1996; e GEOFFREY e KRISHNAN, 1997).
Para estimar os componentes de variâncias e covariâncias, usando-se o método IHSM e a amostra de dados B (Tabela 3), foram necessárias 6 e 13 iterações, respectivamente, para y1 e y2, nas análises univariadas; com três características (Tabela 4), convergiram com 20 iterações. Devido à escassez de informações na literatura sobre o IHSM, não se pode compará-lo com o ML e o REML. Entretanto, segundo OUWELTJES et al., (1988), o mesmo parece convergir mais rapidamente entre os métodos que utilizam pseudoesperanças.
Segundo MEYER (1989, 1991), MEYER e SMITH (1996), o NR e o EM convergem mais rapidamente que os procedimentos livres de derivadas (DF) que usam aproximação numérica das derivadas e exploram a técnica da matriz esparsa. Segundo MISZTAL (1994), os métodos DF são fáceis de se usar, adequados para manejar grandes volumes de dados, como no caso do modelo animal. Entretanto, esses métodos são dependentes do número de características e dos valores iniciais das variâncias e covariâncias, além de apresentarem convergência lenta e manuseio difícil em análises multivariada.
MISZTAL (1994) mostrou que a técnica da matriz esparsa pode reduzir o tempo e requerimento de memória para o REML com o EM, tornando-o mais vantajoso que o DF, pois sempre converge para máximo global. Entretanto, quando se usa o REML em um modelo animal, o DF pode ser vantajoso, pois elimina o trabalho complexo das derivadas. GEOFFREY e KRISHNAN (1997) fazem duas críticas ao EM: a lentidão na convergência e o não-fornecimento da matriz de covariâncias no caso univariado.
Independentemente do algoritmo usado, mesmo que ML e REML proporcionem estimativas de parâmetros genéticos dentro do espaço de parâmetros, deve-se verificar se estas representam solução máxima local ou global (MISZTAL, 1994; BOLDMAN et al., 1995). No caso de dados desbalanceados, tem-se certa garantia de solução máxima global, quando os critérios abaixo forem utilizados, proporcionando a mesma solução: usar diferentes valores iniciais; utilizar valores abaixo e acima dos obtidos na primeira convergência; e usar dois ou três dígitos significativos para a h2 (TAYLOR e EVERETT, 1985). Além desses, BOLDMAN et al. (1995) recomendam ainda: não utilizar covariâncias entre característica cuja correlação seja próxima de 1; dividir o valor da característica pelo respectivo desvio-padrão para dados que diferem grandemente em escala; no caso de variâncias próximas de zero, multiplicar os dados por um fator a ser escolhido de modo a obter convergência e, em seguida, retransformar as estimativas para as escalas originais.
As estimativas de variâncias e covariâncias genéticas (gij), residuais (rij) entre as características i e j, e de herdabilidades (hi2), associadas aos pesos ao nascimento (y1), desmama (y2), 12 (y3), 18 (y4) e 24 meses (y5) e circunferência escrotal aos 12 (y6) meses de idade estão nas Tabela 3 e 4.
Na análise univariada (Tabela 3), observa-se variabilidade nas estimativas de variâncias e covariâncias e de h2 entre método de estimação e amostra de dados. Nas amostras A e B, valores crescentes de gij são obtidos por MIVQUE(o), ML e REML, nessa ordem, refletindo diferenças entre os métodos para estimar gij. Comparado ao REML, que possui propriedades mais desejáveis para estimar parâmetros genéticos, as estimativas obtidas por 3H são subestimadas. Este método somente é adequado quando se considera uma população base, pois não corrige para vícios devidos à seleção, e somente produz estimativas não-viciadas de variâncias entre touros, quando há independência entre si (HENDERSON, 1953). Quanto aos métodos MIVQUE(o) e IHSM, por usarem pseudoesperanças nas suas construções, fornecem soluções apenas aproximadas das estimativas de variâncias e covariâncias. Uma vez que são fáceis de se usar, mesmo em situações de análise multivariadas e grandes conjunto de dados (HENDERSON, 1984; FREITAS et al.,1995), são recomendados métodos mais elaborados, como o ML e REML, para estimar valores iniciais de variâncias e covariâncias.
O ML, por não considerar os efeitos fixos associados ao modelo, é recomendável somente quando o número de observações for muito grande em relação ao número de elementos do vetor b (efeitos fixos). Sua distribuição teórica baseia-se em resultados assintóticos (HARVILLE, 1977). Em adição a estes métodos, o REML elimina vícios decorrentes da seleção e as estimativas de variâncias e covariâncias são obtidas pela maximização da função de verossimilhança construída com base nos resíduos, após ajustar os dados para os efeitos fixos (HARVILLE, 1977).
As estimativas de h2 (Tabela 3) variaram de 0,30 a 0,78 para pesos à desmama e de 0,28 a 0,68 para pesos aos doze meses, com comportamento similar ao das variâncias e covariâncias genéticas. Isto pode ser explicado pelo fato de que, no cálculo de h2, os valores de gijsão dominantes em relação aos de rij, e esses tiveram magnitude irregular nos diferentes métodos de estimação. Outros fatores podem interferir nas estimativas de h2 para determinada característica, raça, rebanho ou cruzamento: a seleção, o grau de parentesco entre os reprodutores, o tamanho amostral e ainda o modelo adotado, quando se usa um método específico. Quando se usam vários métodos para estimar covariâncias, a estrutura de distribuição dos dados merece atenção especial. As duas análises realizadas por REML na amostra A e por 3H no C tem o propósito de ilustrar variações nos estimadores de parâmetros genéticos, quando se varia a amostra de dados.
Na análise multivariada (Tabela 3), ML e REML, por serem métodos correlatos, proporcionaram gij concordantes, ao contrário dos resultados obtidos das análises univariada, confirmando as observações de POLLAK (1985) e MEYER (1991), ou seja, na análise multivariada e ainda com a inclusão da matriz de parentesco entre os animais, são estimadas variâncias e covariâncias genéticas mais apropriadas. Quanto ao IHSM, apesar de os resultados satisfatórios terem sidos obtidos (KRIESE et al.,1991a; KRIESE et al., 1991b; e FREITAS et al., 1995), o mesmo pareceu superestimar os parâmetros genéticos.
As estimativas de herdabilidade (Tabela 3) obtidas por ML e REML foram similares entre si e inferiores às do IHSM, porém foram superiores às obtidas com o método 3 de Henderson (3H).
Além dos fatores acima, o efeito da seleção praticada dentro do rebanho Canchim pode ter interferido nesses estimadores. Na presença desse efeito, há tendência de obter valores menores para gii (HENDERSON, 1984; CARRABAÑO et al., 1989). Entretanto, o fato de ML e REML controlar e/ou minimizar vícios decorrentes da seleção sobre as estimativas (HENDERSON, 1984; OUTWELTJES et al., 1988) explica, em parte, os valores maiores de gij e de h2 obtidos por esses métodos.
Refinamentos para facilitar a manipulação dos dados também podem influenciar as estimativas de h2.Utilizando-se análise univariada por REML na amostra B, FREITAS et al. (1994) estimaram h2 de 0,33; 0,77; 0,44; e 0,10, para pesos ao nascimento, pesos observados à desmama, pesos ajustados linearmente para 205 dias à desmama e ganho de peso da desmama aos 12 meses, respectivamente. Numa análise multivariada por REML e transformação canônica (REMLc), utilizando-se os mesmos dados, apenas a primeira variável canônica explicou 86,0% da variação detectada, proporcionando h2 conjunta de 0,83, consideravelmente maior que as obtidas individualmente, favorecendo, portanto, a seleção dos animais.
Uma vez que nessas análises foi assumida a hipótese de homogeneidade de variâncias dentro dos efeitos, a qual foi rejeitada, admite-se, em conseqüência desse fato, prejuízos nas estimativas de parâmetros genéticos. Segundo GIANOLA et al. (1992) e WEIGEL e GIANOLA (1992), esses efeitos são maiores em análises multivariadas, pois não raro, heterogeneidade de variâncias geralmente implica em heterogeneidade de covariâncias, e o impacto deste fato sobre o progresso genético esperado é mais importante que no caso univariado.
Os valores dos coeficientes de assimetria, curtose e h2 obtidos com os dados da amostra A, analisados em quatro escalas, estão na Tabela 5. Embora tenha havido similaridade nas estimativas de herdabilidade e respectivos erros-padrão para todas as características, a transformação pelo método dos escores normais comportou-se como a mais adequada, pois os coeficientes de assimetria e de curtose foram praticamente nulos. Segundo BAXTER (1995), transformações que usam escores ou postos, além de serem úteis, quando os dados têm assimetria alta, como no presente estudo, eliminam as diferenças de grupos, quando aplicadas a dados bimodais ou multimodais, sendo mais robustas à presença de "outliers" que as outras. O mesmo autor ressalta, no entanto, que o uso dessas transformações, uma vez que não utiliza toda a informação dos dados originais, proporciona estimativas não-suficientes. A transformação logarítmica, apesar de aproximar os dados a uma normal, estabilizar as variâncias e induzir um modelo linear para a resposta transformada (BAXTER, 1995; AZZALINI e VALLE, 1996; e DAVIDIAN e GILTINAN, 1996), quando o desvio-padrão dos dados, na escala original, varia linearmente com a média (BOLDMAN e FREEMAN,1990), mostrou-se ineficaz para essa amostra de dados. FREITAS e GRAÇA (1996), analisando a amostra de dados A, observaram relação não-linear entre a média e o desvio-padrão para os efeitos de sexo, ordem de parto, ano de nascimento e touro, em que os coeficientes de variação variam de 2 a 33%, com oscilação crescente nesta ordem, o que pode ser justificado pelo fato de que, à medida que se aumenta o número de níveis de um efeito, há maior desbalanceamento no número de repetições e nos efeitos ambientais associados a este.
Conclusões
Dados do desenvolvimento ponderal e da circunferência escrotal de animais Canchim não seguem distribuição normal, com a qualidade dos dados decrescendo com a idade adulta do animal.
Houve heterogeneidade de variâncias para os efeitos fixos de sexo, ano e época de nascimento, idade da vaca ao parto, geração do animal e efeito aleatório de touros, o que inviabiliza o uso de métodos de análise de variância tradicionais para estimar parâmetros genéticos.
A transformação que fornece escores normais como resposta foi eficiente para ajustar os dados a uma distribuição normal; contudo, as transformações usadas não influenciaram as estimativas de herdabilidade.
O método IHSM mostrou-se de fácil uso e adequado para manejar grandes conjunto de dados mesmo em situações de análise multivariadas, podendo ser recomendado para estimar valores iniciais de variâncias e covariâncias de métodos mais elaborados, como o ML e REML.
Na análise multivariada, ML e REML proporcionaram variâncias e covariâncias genéticas mais concordantes que as obtidas das análises univariada.
Métodos de estimação, análise univariada ou multivariada, diferentes amostras e tipo de transformação de dados, nesta ordem, foram os que mais influenciaram as estimativas de h2.
Referências Bibliográficas
Recebido em: 19/11/98
Aceito em: 13/08/99
- AZZALINI, A., VALLE, A.D. 1996. The multivariate skew-normal distribution. Biometrika, 83(4):715-726.
- BAXTER, M.J. 1995. Standardization and transformation in principal component analysis, with applications to archaeoometry. J. R. Statist. Soc. C, 44(4):513-527.
- BOLDMAN, K.G., FREEMAN, A.E. 1990. Adjustment for heterogeneity of variance by herd production level in dairy cow and sire evaluation. J. Dairy Sci., 73(2):503-512.
- BOLDMAN, K.G., KRIESE, L.A., VAN VLECK, L.D. et al. 1995. A manual for use of MTDFREML. A set of programs to obtain estimates of variances and covariances. Washington, DC: USDA-ARS. 120p.
- BROTHERSTONE, S., HILL, W.G. 1986. Heterogeneity of variance amongst herds for milk production. Animal Production, 42(3):297-303.
- BROWNIE, C., BOOS, D.D., OLIVER, J.H. 1990. Modifying the t and ANOVA F tests when treatment is expected to increase variability relative to controls. Biometrics, 46(1):259-266.
- CARABAñO, M.J., VAN VLECK, L.D., WIGGANS, G.R. et al. 1989. Estimation of genetic parameters for milk and fat yields od dairy cattle in Spain and the United States. J. Dairy Sci., 22(11):3013-3022.
- CHAPUIS, H., TIXIER-BOICAHRD, M., DELABROSSE, Y. et al. 1996. Multivariate restricted maximum likelihood estimation of genetic parameters for production traits in three selected turkey strains. Genet. Sel. Evol, 28(2):197-215.
- COCHRAN, W.G., COX, D.F. 1978. Deseno experimentales. Mexico: Trillas. 661p.
- COOK, R.D., WEISBERG, S. 1994. Transforming a response variable for linearity. Biometrika, 81(4):731-737.
- DAVIDIAN, M., GILTINAN. D.M. 1996. Nonlinear models for repeated easurement data. 2.ed. London: Chapman Hall. 359p.
- DEMPSTER, A.P., LAIRD, N.M., RUBIN, D.B. 1977. maximum likelihood from incomplete data via the EM algorithm. J. R. Statist. Soc. B, 39:1-38.
- DE VEER, J.C., VAN VLECK, L. D. 1987. Genetic parameters for first lactation milk yields at three levels of herd production. J. Dairy Sci, 70(7):1434-41.
- FREITAS, A.R. de, FAVORETTI, A.C., ALENCAR, M.M. et al. 1994. Uso da máxima verossimilhança restrita e transformação canônica para estimação de parâmetros genéticos de características de crescimento em bovinos. R. Soc. Bras. Zootec, 23(3):394-401.
- FREITAS, A.R., GRAÇA, F.X.J. 1996. A qualidade dos dados de pesos de bovinos e o melhoramento genético. Multiciência, 1(1):93-102.
- FREITAS, A.R., PEGORIN, M.J., ALENCAR, M.M. et al. 1995. Estimativas de parâmetros genéticos de múltiplas características através do método simples de Henderson. Pesq. Agropec. Bras., 30(5):711-722.
- FREITAS, A.R., VENCOVSKY, R. 1993a. Comparação de métodos para estimação de componentes de variâncias e parâmetros afins de múltiplos característica em bovinos. Pesq. Agropec Bras, 28(4):453-463.
- FREITAS, A.R., VENCOVSKY, R. 1993b. Métodos de estimação de variâncias e parâmetros afins de características de crescimento em bovinos. Pesq. Agropec Bras, 28(7):855-861.
- GEOFFREY, J.M., KRISHNAN, K. 1997. The EM algorithm and extensions. New York: Wiley. 274p.
- GIANOLA, D., FOULLEY, J.L., FERNANDO, R.L. et al. 1992. Estimation of heterogeneous variances using empirical bayes methods: Theoretical considerations. J. Dairy Sci, 75(10):2805-2823.
- HARTLEY, H.O., RAO, J.N.K. 1967. Maximum likelihood estimation for the mixed analysis of variane model. Biometrika, 54(1/2): 93-108.
- HARVILLE, D.A. 1977. Maximum likelihood approaches to variance component estimation and to related problems. J. American Statist. Association, 72(358):320-339.
- HEMMERLE, W.J., HARTLEY, H.O. 1973. computing maximum likelihood estimates for the mixed model AOV model using the W transfornations. Technometrics, 15(4):819-831.
- HENDERSON, C.R. 1984. Applications of linear models in animal breeding Ontario: University of Guelph. 426p.
- HENDERSON, C.R. 1953. Estimation of variance and covariance components. Biometrics, 4(2):226-252.
- JENRICH, R.I., SAMPSON, P.F. 1976. Newton-Raphson and related algorithms for maximum likelihood variance component estimation. Tecnometrics, 18(1):11-17.
- JENSEN, J., MAO, I.L 1988. Transformation algorithms in analysis of single trait and of multitrait models with equal design matrices and one random factor per trait: a review. J. Anim. Sci., 66(11):2750-2761.
- KRIESE, L.A., BERTRAND, J.K., BENYSHEK, L.L. 1991a. Age adjustment factors, heritabilities and genetic correlations for scrotal circumference and related growth traits in hereford and brangus bulls. J. Anim. Sci, 69(2):478-489.
- KRIESE, L.A., BERTRAND, J.K., BENYSHEK, L.L. 1991b. Genetic and environmental growth trait parameter estimates for Brahman and Brahman-derivative cattle. J. Anim. Sci., 69(6):2362-2370.
- MEUWISSEN, T.H.E., JONG, G., ENGEL, B. 1996. Joint estimation of breeding values and heterogeneous variances of large data sets. J. Dairy Sci., 79(2):310-316.
- MEYER, K. 1991. Estimating variances and covariances for multivariate animal models by restricted maximum likelihood. Genet. Sel. Evol, 23(1):67-83.
- MEYER, K. 1989. Restricted maximum likelihood to estimate variance components for animal models with several random effects using a derivative-free algorithm. Genet. Sel. Evol, 21(3):247-398.
- MEYER, K., SMITH, S.P. 1996. Restricted maximum likehood estimation for animal models using derivatives of the likelihood. Genet. Sel. Evol., 28(1):23-49.
- MISZTAL, I. 1994. Comparison of computing properties of derivative and derivative-free algorithms in variance-component estimation by REML. J. Anim. Breed. Gen, 111(5-6):346-355.
- OUWELTJES, W., SCHAEFFER, L.R., KENNEDY, B.W. 1988. Sensitivity of methods of variance component estimation to culling type of selection. J. Dairy Sci, 71(3):723-729.
- PATTERSON, H.D., THOMPSON, R. 1971. Recovery of interblock information when block sizes are unequal. Biometrika, 58:545-554.
- POLLAK, E.J. 1985. Genetic evaluation of beef cattle from performance. In: SIMPÓSIO INTERNACIONAL DE PRODUÇÃO ANIMAL, 1, 1983, Ribeirão Preto. Anais.. Ribeirão Preto: Sociedade Brasileira de Genética, p.73-82.
- RAMOS, A.A., VALÊNCIA, E.F.T., WEICHSLER, F.S. et al. Heterogeneidade de variâncias das características de produção de bovinos da raça holandesa no trópico II. Estratificação por nível de produção de vacas. In: REUNIÃO ANUAL DA SOCIEDADE BRASILEIRA DE ZOOTECNIA, 33, 1996, Fortaleza. Anais... Fortaleza: SBZ, 1996, p.61-73.
- ROBERT, C., DUCROCQ, V. 1996. Computation of all eigenvalues of matrices used in restricted maximum likelihood estimation of variance components using sparse matrix techniques. Genet. Sel. Evol., 28(1):51-65.
- RODRÍGUEZ-ALMEIDA, F.A., VAN VLECK, L.D., CUNDIFF, L.V. 1995a. Effect of accounting for different phenotypic variances by sire breed, and sex on selection of sires based on expected progeny differences for 200- and 365-day weights. J. Anim. Sci., 73(9):2589-2599.
- RODRÍGUEZ-ALMEIDA, F.A., VAN VLECK, L.D., CUNDIFF, L.V. et al. 1995b. Heterogeneity of variance by sire breed, sex, and dam breed in 200- and 365-day weights of beef cattle from a top cross experiment. J. Anim. Sci., 73(9):2579-2588.
- SAS INSTITUTE. 1993. In: SAS/STAT User's guide: statistics versão 6, v.2. 4.ed. Cary.
- SAS INSTITUTE. 1996. In: Procedures versão 6, v.1. 3.ed. Cary.
- SCHEFFÉ, A. 1959. The analysis of variances [S.l.]: John Wiley. 477p.
- TAYLOR, J.F., EVERET, R.W. 1985. Estimation of variance components by the expectation-maximization algorithm for restricted maximum likelihood in a repeatability model for semen production. J. Dairy Sci., 68(11):48-53.
- VISSCHER, P.M. 1992. Power of likelihood ratio tests for heterogeneity of intraclass correlation and variance in balanced half-sib design. J. Dairy Sci, 75(5):1320-1330.
- WEIGEL, K.A., GIANOLA, D. 1992. Estimation of heterogeneous within-herd variance components using empirical bayes methods: a simulation study. J. Dairy Sci., 75(10):2824-2833.
Datas de Publicação
-
Publicação nesta coleção
02 Fev 2004 -
Data do Fascículo
Fev 2000
Histórico
-
Recebido
19 Nov 1998 -
Aceito
13 Ago 1999