Acessibilidade / Reportar erro

Agrupamento de modelos de regressão da análise de adaptabilidade e estabilidade de genótipos

Regression models grouping for genotype adaptability and stability analysis

Resumos

O objetivo deste trabalho foi evidenciar diferenças entre modelos de regressão, obtidos pelo método de Eberhart & Russell, na análise de adaptabilidade e estabilidade de comportamento de genótipos, e propor uma metodologia de agrupamento dos modelos similares. O teste para verificar a identidade de modelos foi empregado em dados de avaliação de 14 genótipos de milho em oito ambientes. Uma vez rejeitada a hipótese de igualdade dos modelos de regressão, realizou-se o agrupamento desses modelos com base no cálculo do quadrado médio da redução (QMRed) entre pares dos modelos de regressão. Após a obtenção desses valores, foi selecionado o de menor magnitude e verificada sua significância pelo teste F. NA hipótese de esse QMRed não ser significativo, o par de modelos relacionado a ele forma o grupo inicial. O método para verificar a identidade de modelos pode ser usado com sucesso no agrupamento de equações de regressão linear obtidas pelo método de Eberhart & Russell com o objetivo de estudar a adaptabilidade e a estabilidade de genótipos. O método de agrupamento de modelos similares permite formar grupos de genótipos com o mesmo comportamento estatístico

Zea mays; Eberhart & Russell; avaliação de genótipos; identidade de modelos


The objective of this work was to provide evidences of differences among regression models, obtained by the Eberhart & Russell method, for the genotype adaptability and stability analysis, and to propose a methodology for grouping similar models. The test to verify the identity of models was used in the evaluation data of 14 corn genotypes in eight environments. Once the hypothesis of equality of regression models was discarded, model grouping was performed through estimating the mean square of the reduction (MSQRed) between pairs of regression models. After obtaining these values, the smallest one was selected and its significance was verified by the F-test. If this MSQRed is not significant, the model pair related to it comprises the initial group. The models identity verification method can be successfully used for grouping linear regression equations, obtained by the Eberhart & Russell method, in order to study genotype adaptability and stability. The similar models grouping allow the formation of genotype groups with the same statistical behavior

Zea mays; Eberhart & Russell; genotype evaluation; identity of models


ESTATÍSTICA

Agrupamento de modelos de regressão da análise de adaptabilidade e estabilidade de genótipos

Regression models grouping for genotype adaptability and stability analysis

Edmar Soares de VasconcelosI; Cosme Damião CruzII; Adair José RegazziII; Leonardo Lopes BheringIII; Tatiana Barbosa RosadoII; Fernando Soares de VasconcelosIV

IUniversidade Estadual do Oeste do Paraná, Departamento de Agronomia, CEP-85960-000 Marechal Cândido Rondon, PR. E-mail: vasconceloses@yahoo.com.br

IIUniversidade Federal de Viçosa, Departamento de Biologia Geral, CEP-36571-000 Viçosa, MG. E-mail: cdcruz@ufv.br, adairreg@ufv.br, tatianarosado@yahoo.com.br

IIIEmbrapa Agroenergia, Av. W3 Norte (final), PqEb s/nº, Edifício Sede, CEP-70770-901 Brasília, DF. E-mail: leobhering@yahoo.com.br

IVFaculdade Integrado de Campo Mourão, Departamento de Agronomia, CEP-87300-970-Campo Mourão, PR. E-mail: fernando.vasconcelos@grupointegrado.br

RESUMO

O objetivo deste trabalho foi evidenciar diferenças entre modelos de regressão, obtidos pelo método de Eberhart & Russell, na análise de adaptabilidade e estabilidade de comportamento de genótipos, e propor uma metodologia de agrupamento dos modelos similares. O teste para verificar a identidade de modelos foi empregado em dados de avaliação de 14 genótipos de milho em oito ambientes. Uma vez rejeitada a hipótese de igualdade dos modelos de regressão, realizou-se o agrupamento desses modelos com base no cálculo do quadrado médio da redução (QMRed) entre pares dos modelos de regressão. Após a obtenção desses valores, foi selecionado o de menor magnitude e verificada sua significância pelo teste F. NA hipótese de esse QMRed não ser significativo, o par de modelos relacionado a ele forma o grupo inicial. O método para verificar a identidade de modelos pode ser usado com sucesso no agrupamento de equações de regressão linear obtidas pelo método de Eberhart & Russell com o objetivo de estudar a adaptabilidade e a estabilidade de genótipos. O método de agrupamento de modelos similares permite formar grupos de genótipos com o mesmo comportamento estatístico.

Termos para indexação:Zea mays, Eberhart & Russell, avaliação de genótipos, identidade de modelos.

ABSTRACT

The objective of this work was to provide evidences of differences among regression models, obtained by the Eberhart & Russell method, for the genotype adaptability and stability analysis, and to propose a methodology for grouping similar models. The test to verify the identity of models was used in the evaluation data of 14 corn genotypes in eight environments. Once the hypothesis of equality of regression models was discarded, model grouping was performed through estimating the mean square of the reduction (MSQRed) between pairs of regression models. After obtaining these values, the smallest one was selected and its significance was verified by the F-test. If this MSQRed is not significant, the model pair related to it comprises the initial group. The models identity verification method can be successfully used for grouping linear regression equations, obtained by the Eberhart & Russell method, in order to study genotype adaptability and stability. The similar models grouping allow the formation of genotype groups with the same statistical behavior.

Index terms:Zea mays, Eberhart & Russell, genotype evaluation, identity of models.

Introdução

A avaliação do desempenho de genótipos em diferentes ambientes é comum em programas de melhoramento, pois permite estabelecer o comportamento dos genótipos em relação às variações ambientais (Carvalho et-al., 2002).

Para a avaliação do comportamento dos genótipos, diferentes métodos de análise de adaptabilidade são utilizados, entre os quais destacA se o método de Eberhart & Russell (1966), que baseiA se em análise de regressão linear simples de uma variável dependente em relação a um índice ambiental (Cruz et-al., 2004).

Graybill (1976) apresentou um método para verificar a identidade de H modelos de regressão linear simples, empregando o teste F. Regazzi (1993) utilizou essa metodologia, tendo considerado o ajustamento de dados de observação relativos a H equações de regressão polinomial do segundo grau, com auxílio da técnica dos polinômios ortogonais. No decorrer desse processo, esse mesmo autor concluiu que a identidade de modelos de regressão linear simples, ou múltipla, e a igualdade de qualquer subconjunto de parâmetros podem ser verificadas por meio do teste F. Essa metodologia foi apresentada por Regazzi (1996) que, nesse trabalho, avaliou o ajustamento de H equações de regressão no caso de justaposição de submodelos polinomiais.

Regazzi (1999) também descreveu em detalhes o teste para verificar as hipóteses avaliadas por Regazzi (1993), e dessa vez considerou delineamentos experimentais, configurados em dados com repetições. Trabalhos de avaliação do ganho de peso em bovinos (Véras et-al., 2001), do conteúdo corporal em novilhos (Zervoudakis et-al., 2002) e das exigências nutricionais de macronutrientes para novilhos (Leonel et-al., 2006) usaram o método de identidade de modelos para comparação das equações obtidas em cada caso.

As equações de regressão podem ser comparadas por outros métodos, além do apresentado por Regazzi, tais como: os métodos das variáveis Dummy (binárias), da análise de variância, bem como o método das comparações múltiplas. Magalhães et-al. (2004) verificaram que os métodos de identidade de modelos das variáveis Dummy e da análise de variância proporcionam resultados similares na comparação de equações de regressões.

Os modelos de regressão ajustados para o estudo de adaptabilidade e estabilidade, no entanto, não são submetidos a testes estatísticos para diferenciá-los.

O objetivo deste trabalho foi evidenciar a existência de diferença entre modelos de regressão na análise de adaptabilidade e estabilidade do comportamento de genótipos, obtidos pelo método proposto por Eberhart & Russell (1966), e apresentar uma metodologia de agrupamento dos modelos de regressão similares.

Material e Métodos

O teste para verificar a identidade de modelos, descrito por Regazzi (1993, 1996), foi empregado sobre as equações de regressão obtidas com base na metodologia de Eberhart & Russell (1966). Os-H modelos de regressão são dados por:

em que, Yhj é a j-ésima observação do h-ésimo modelo, sendo j = 1, 2, ... , m, em que m o é número de ambientes, e h = 1, 2, ... , H, em que H é o número de modelos; β0h é o valor da média do genótipo do h-ésimo modelo; β1h é o valor do coeficiente de regressão do h-ésimo modelo; Ij é o valor do índice ambiental,

em que g é o número de genótipos (g = H), Yhj o valor relativo à observação do h-ésimo genótipo no j-ésimo ambiente, e

εhj é o erro aleatório do h-ésimo modelo e j-ésimo ambiente, supostamente independente e normalmente distribuído, com média zero e variância constante, σ2, εhj ~ NID (0, σ2).

A hipótese nula testada foi: H0: β1 = β2 = ... = βH (os H modelos são idênticos) vs. Ha: βhβh' para pelo menos um h h' (pelo menos um modelo difere dos demais). Neste caso de regressão linear simples, tem-se que βh = [βohβ1h]', com h = 1, 2, ... , H, de maneira que o h-ésimo modelo pode ser escrito por: Yh = Xhβh + εh, em que, Yh é um vetor-m x 1 de observações, sendo-m o número de ambientes; Xh é uma matriz-m x p de constantes conhecidas, sendo p o número de parâmetros, com valor igual a 2, uma vez que tem-se apenas β0h e β1h; βh, é um vetor de p x 1 (p = 2) de parâmetros obtidos na análise de Eberhart & Russell (1966); εh é um vetor-m x 1 de erros aleatórios, NID (Φ,σ2). Esses H modelos podem ser escritos na forma do modelo linear geral Y = Xβ + ε, conforme apresentado por Regazzi (1993, 1996). O modelo estatístico adotado pressupõe homogeneidade das H variâncias residuais, tendo-se obtido, assim, um estimador comum de variância residual, cuja estimativa é utilizada como denominador da estatística F de Snedecor. A violação dessa pressuposição, em casos extremos, pode levar a erros nas conclusões. Sua verificação pode ser feita com o auxílio de um dos testes de homogeneidade de variâncias ou seguindo-se um critério prático. De acordo com Gomes (1990), quando a relação entre a maior e a menor variância é inferior a sete, é quase sempre possível combinar as variâncias residuais e obter uma estimativa comum. Quando esse quociente for além de sete, é conveniente que se considere, separadamente, subgrupos de modelos nos quais se tenha dentro de cada subgrupo, uma razoável homogeneidade de variâncias. Neste estudo, o valor da relação entre o maior e o menor quadrado médio residual foi inferior a sete, tendo-se admitido a homogeneidade das variâncias residuais.

A soma de quadrados de parâmetros, relativa ao modelo completo (SQPc), é dada por: SQPc = β' X' Y, com 2H graus de liberdade. A soma de quadrados total não corrigida (SQTot) é dada por: SQTot = Y' Y, com Hm graus de liberdade. A soma de quadrados do resíduo (SQRes) é obtida por:

com Hm - 2H graus de liberdade.

Sob a hipótese de nulidade, tem-se que β1 = β2 = ... = βH, o que gera o modelo reduzido, ou seja, H modelos idênticos. Dessa forma, pode-se escrever Yij = θ0 + θ1Ij + εij, em que, θ0 e θ1 são os dois parâmetros comuns, que nessa hipótese representaria todos os modelos. Em-notação matricial tem-se Y = Z θ + ε, em que, Y é o vetor dos valores observados da variável dependente, de dimensão Hm x 1; Z é uma matriz Hm x 2 de constantes conhecidas; θ é um vetor 2 x 1 de parâmetros (θ0 e θ1); ε é um vetor de erros aleatórios de dimensão Hm x 1.

O sistema de equações normais relativo ao modelo reduzido, obtido pelo método dos mínimos quadrados ordinários, propicia uma estimativa para os valores do vetor θ (estimativas de θ0 e θ1), dada por: = (Z' Z) - 1Z' Y. A soma de quadrados de parâmetros relativo ao modelo reduzido (SQPr) é dada por: SQPr = θ'Z'Y, com dois graus de liberdade.

A diferença entre a SQPc e a SQPr gera a soma de quadrados da redução (SQRed), ou seja, a redução que H0 provoca na soma de quadrados de parâmetros do modelo completo, a qual propicia o teste estatístico que tem como denominador o quadrado médio do resíduo do modelo completo, de modo que: SQRed = SQPc - SQPr, com 2(H - 1) graus de liberdade.

O valor da estatística F (Fcalc), é obtido por: Fcalc = [(SQPc - SQPr)/2(H - 1)]/[SQRes/(Hm - 2H)]. Após, o Fcalc é comparado com o FTab [α; 2(H - 1) e (Hm - 2H)]. RejeitA se a hipótese nula H0 se Fcalc>FTab. A não rejeição de H0 implica que os H modelos não diferem estatisticamente. Assim a equação ajustada com as estimativas dos parâmetros comuns pode ser usada como uma estimativa das H equações envolvidas. Contudo, a rejeição de H0 implica na existência de pelo menos um dos genótipos com comportamento diferente dos demais, o que exige o agrupamento dos genótipos que apresentam comportamentos similares. Para facilitar o entendimento, o esquema da análise de variância é apresentado na Tabela 1.

Para agrupar os modelos, realiza-se o cálculo da SQRed entre todos os pares de modelos de regressão. O procedimento é semelhante ao apresentado para a análise que envolve todos os modelos, descrita anteriormente, porém agora serão envolvidos apenas dois modelos em cada análise. Esse procedimento originará (H (H - 1))/2 resultados de SQRed, um valor para cada par de modelos distinto.

A hipótese nula a ser testada foi: H0: βi = βi' (os modelos são idênticos) vs. Ha: βiβi' (o modelo i difere do modelo i'). Calcula-se SQRed para todos os possíveis pares de modelos, seleciona-se o de menor magnitude e verifica-se sua significância pelo teste F, sendo: Fcalc = [(SQRed)/2]/[SQRes/(Hm - 2H)] e comparado com FTab [α; 2 e (Hm - 2H)]. Caso o valor de Fcalc seja estatisticamente significativo, tem-se que os modelos apresentam comportamentos distintos entre si, contudo se o valor de Fcalc for não significativo, o par de genótipos que proporcionou esse Fcalc originará o primeiro grupo, no qual as equações de regressão são estatisticamente idênticas.

A partir do estabelecimento do grupo inicial, testA se a inclusão de um novo modelo ao grupo preestabelecido. Para tanto é necessário uma nova análise envolvendo os dois modelos agrupados com um terceiro modelo, ainda não agrupado, o que proporciona um novo sistema, agora com três equações de regressão. O procedimento é semelhante ao apresentado para a análise que envolve todos os modelos, descrita anteriormente, porém agora serão envolvidos os dois modelos agrupados inicialmente, com cada um dos modelos ainda não agrupados. Esse procedimento irá originar H - 2 resultados de SQRed.

A hipótese nula a ser testada é: H0βi = βi' = βi,, (os modelos são idênticos) vs. Ha: βi = βi'βi,, (o modelo i" não é idêntico aos modelos i e i').

Calcula-se SQRed nos casos possíveis e novamente verifica-se a significância do menor valor, pelo teste F, sendo: Fcalcii'i" = [(SQRed/4)]/[SQRes/(Hm - 2H)], e comparado com FTab [α; 4 e (Hm - 2H)].

Se o teste F for não significativo, então o genótipo i" será integrado ao grupo inicial, e fará parte dos genótipos com padrão de respostas similares. Após a inclusão de um novo genótipo no grupo, deverá se tentar incluir outro, e esse ciclo será repetido até que o menor valor da SQRed resulte em um Fcalc estatisticamente significativo, que indicaria que os grupos de genótipos e os genótipos não agrupados possuem modelos de regressão diferentes entre si.

Depois de estabelecido o primeiro grupo com genótipos cujas equações de regressão não diferem estatisticamente, pode-se iniciar uma nova tentativa de agrupamento com os modelos ainda não agrupados (Figura 1). Para exemplificar o uso desse método, foi avaliado o comportamento de 14-genótipos de milho em oito ambientes, cujos resultados foram retirados de Costa (1995) (Tabela 2).


As análises de adaptabilidade e estabilidade e também de identidade de modelos de regressão foram realizadas com o auxílio do aplicativo computacional Genes (Cruz, 2006).

Resultados e Discussão

Na verificação da relação entre o maior e o menor quadrado médio do resíduo de cada regressão (Tabela 2), obteve-se o valor 6,9607, inferior a sete, conforme sugerido por Gomes (1990), o que permitiu a análise de todos os modelos, simultaneamente. Vale ainda ressaltar que os erros experimentais apresentaram normalidade, o que possibilitou a inferência estatística utilizando-se a distribuição F.

Na Tabela 3 estão descritos os resultados da análise de variância que testam a hipótese de todos os modelos de regressão serem idênticos. Como o valor de Fcalc foi maior que o de FTab, pode-se afirmar que pelo menos um modelo difere estatisticamente dos demais, pelo teste F.

Com a finalidade de discriminar os genótipos com diferentes comportamentos, foram obtidos os valores do QMRed para cada par de regressão (Tabela 4). Os-genótipos 8 e 9 apresentaram o menor valor de QMRed (0,0223), que resultou no Fcalc = 0,05, com 2 e 84-graus de liberdade, não significativo a 1% pelo teste F. Esse resultado evidencia que esses genótipos apresentam comportamento idêntico e, portanto, passam a constituir o grupo inicial (Figura 1).

Na tentativa de inclusão de um novo genótipo ao grupo inicial, obtiveram-se os valores da QMRed relativos aos genótipos do grupo inicial, com cada um dos genótipos ainda não agrupados (Tabela 4). O menor valor da QMRed (0,0652) foi obtido entre os genótipos 8, 9 e 11, que não foi significativo a 1% de probabilidade pelo teste F, de maneira que o genótipo 11 passa também a integrar o grupo inicial.

Repetiram-se as análises descritas anteriormente, até que os modelos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 e 13 fossem agrupados. NA tentativa de inclusão de outro modelo ao grupo, obtiveram-se os quadrados médios da redução descrito na Tabela 4. Como o menor quadrado médio da redução foi significativo a 5% pelo teste F, considerou-se que o grupo 1 estava completo com os genótipos já agrupados, e realizou-se nova análise para possível agrupamento dos modelos ainda não agrupados. A partir dessa análise, um novo grupo foi obtido com as regressões dos genótipos 12 e 14.

Os genótipos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 e 13 podem ser representados por um valor comum de beta zero e de beta um (4,63 e 1,0006, respectivamente), e apresentam um coeficiente de determinação (R2) igual a 98,46%.

Os genótipos 12 e 14 também puderam ser representados por um valor comum de beta zero e de beta um (5,72 e 0,9967, respectivamente), e apresentaram um R2 igual a 98,51%. Portanto, apenas duas equações comuns explicaram as quatorze equações de regressão inicialmente estabelecidas.

Os valores de beta zero da regressão originada a partir da produção dos genótipos 12 e 14 possuem maior magnitude que dos demais genótipos. Esses valores estão associados à condição de estabilidade de produção, que, neste caso, foi detectada pelo método de agrupamento de modelos. Como os genótipos 12 e 14 alcançaram valores de beta um próximo ao dos demais genótipos, acreditA se que, nesse caso, os valores de beta zero (estabilidade de produção) foram determinantes na diferenciação dos modelos de regressão.

Conclusões

1. O método de identidade de modelos pode ser usado com sucesso no agrupamento de equações de regressão linear simples, obtidas pelo método de Eberhart & Russell (1966), para estudo de adaptabilidade e estabilidade de genótipos.

2. O método de agrupamento de modelos similares permite formar grupos de genótipos com comportamento estatisticamente semelhante.

Recebido em 20 de agosto de 2010 e aprovado em 11 de novembro de 2010

  • CARVALHO, C.G.P. de; ARIAS, C.A.A.; TOLEDO, J.F.F. de; ALMEIDA,-L.A. de; KIIHL, R.A. de S.; OLIVEIRA, M.F. de. Interação genótipo x ambiente no desempenho produtivo de soja no Paraná. Pesquisa Agropecuária Brasileira, v.37, p.989-1000, 2002.
  • COSTA, J.G. da. Avaliação de compostos de milho (Zea mays L.) "dentado" provenientes de seleção recorrente recíproca 1995. 102p. Dissertação (Mestrado) - Universidade Federal de Viçosa, Viçosa.
  • CRUZ, C.D. Programa GENES: biometria. Viçosa: UFV, 2006. 452p.
  • CRUZ, C.D.; REGAZZI, A.J.; CARNEIRO, P.C.S. Modelos biométricos aplicados ao melhoramento genético 2.ed. Viçosa: UFV, 2004. 480p.
  • EBERHART, S.A.; RUSSELL, W.A. Stability parameters for comparing varieties. Crop Science, v.6, p.36-40, 1966.
  • GOMES, F.P. Curso de estatística experimental 13.ed. Piracicaba: Nobel, 1990. 468p.
  • GRAYBILL, F.A. Theory and application of the linear model Belmont: Duxbury, 1976. 704p.
  • LEONEL, F. de P.; PEREIRA, J.C.; VIEIRA, R.A.M; FREITAS, J.A. de; DUTRA, A.R.; LIMA, A.V. de; RIBEIRO, M.D.; COSTA, M.G. Exigências nutricionais em macronutrientes minerais (Ca, P, Mg, Na e K) para novilhos de diferentes grupos genéticos. Revista Brasileira de Zootecnia, v.35, p.584-590, 2006.
  • MAGALHÃES, S.R.S.; VEIGA, R.D.; SÁFADI, T.; CIRILLO, M.Â.; MAGINI, M. Avaliação de métodos para a comparação de modelos de regressão por simulação de dados. Semina: Ciências Exatas e Tecnológicas, v.25, p.117-122, 2004.
  • REGAZZI, A.J. Teste para verificar a identidade de modelos de regressão. Pesquisa Agropecuária Brasileira, v.31, p.1-17, 1996.
  • REGAZZI, A.J. Teste para verificar a identidade de modelos de regressão e a igualdade de alguns parâmetros num modelo polinomial ortogonal. Revista Ceres, v.40, p.176-195, 1993.
  • REGAZZI, A.J. Teste para verificar a identidade de modelos de regressão e a igualdade de parâmetros no caso de dados de delineamentos experimentais. Revista Ceres, v.46, p.383-409, 1999.
  • VÉRAS, A.S.C.; VALADARES FILHO, S. de C.; SILVA, J.F.C. da, PAULINO, M.F.; CECON, P.R., FERREIRA, M. de A.; LEÃO, M.I.; VALADARES, R.F.D.; MORAES, E.H.B.K. de. Predição da composição corporal e dos requisitos de energia e proteína para ganho de peso de bovinos, não cadastrados, alimentados com rações contendo diferentes níveis de concentrado. Revista Brasileira de Zootecnia, v.30, p.1127-1134, 2001.
  • ZERVOUDAKIS, J.T.; PAULINO, M.F.; DETMANN, E.; VALADARES FILHO, S. de C.; LANA, R. de P.; CECON, P.R.; QUEIROZ, D.S. de; MOREIRA, A.L. Conteúdo corporal e exigências líquidas de proteína e energia de novilhos suplementados no período das águas. Revista Brasileira de Zootecnia, v.31, p.530-537, 2002.

Datas de Publicação

  • Publicação nesta coleção
    21 Fev 2011
  • Data do Fascículo
    Dez 2010

Histórico

  • Recebido
    20 Ago 2010
  • Aceito
    11 Nov 2010
Embrapa Secretaria de Pesquisa e Desenvolvimento; Pesquisa Agropecuária Brasileira Caixa Postal 040315, 70770-901 Brasília DF Brazil, Tel. +55 61 3448-1813, Fax +55 61 3340-5483 - Brasília - DF - Brazil
E-mail: pab@embrapa.br