Acessibilidade / Reportar erro

Seleção de descritores na caracterização de germoplasma de Paspalum sp. por meio de componentes principais

Selection of descriptors for Paspalum sp. germplasm characterization by means of principal components

Resumos

Foram avaliados 15 descritores reprodutivos, 22 vegetativos e 21 agronômicos, em que os agronômicos compreenderam sete descritores para a avaliação anual, sete descritores para a avaliação de inverno e sete descritores para a avaliação de verão, com o objetivo de selecionar os melhores descritores botânico-agronômicos para caracterizar acessos das espécies Paspalum guenoarum e Paspalum plicatulum. Utilizou-se a análise de componentes principais para descartar os descritores considerados redundantes ou não-discriminantes. Este método permitiu redução de 53, 68 e 43% dos descritores reprodutivos, vegetativos e agronômicos, respectivamente, do conjunto inicialmente considerado. Foi possível selecionar, por intermédio desta técnica, oito descritores, considerados mais importantes na descrição da variabilidade presente na coleção de acessos do germoplasma estudado.

acessos; análise de componentes principais; germoplasma; seleção de descritores


Fifteen reproductive, 22 vegetative and 21 agronomic descriptors were evaluated, the agronomic ones comprised seven descriptors for annual, winter and summer evaluations, respectively, with the objective to select the most appropriate descriptors for characterization of Paspalum guenoarum and Paspalum plicatulum. Principal components analysis was used to discard redundante or non-discriminative descriptors. The principal component analysis allowed a reduction of 53, 68 and 43%, respectively, in the number of initial descriptors considered. By means of this technique, it was possible to select eight descriptors, considered the most important descriptors to identify the genetic variability in this germplasm collection.

accessions; germplasm; principal components analysis; selection descriptors


Seleção de Descritores na Caracterização de Germoplasma de Paspalum sp. por meio de Componentes Principais1 1 Parte da Dissertação apresentada pelo primeiro autor ao Departamento de Matemática e Estatística, ESALQ-USP, para obtenção do grau de Mestre.

Elizabeth Strapasson2 1 Parte da Dissertação apresentada pelo primeiro autor ao Departamento de Matemática e Estatística, ESALQ-USP, para obtenção do grau de Mestre. , Roland Vencovsky3 1 Parte da Dissertação apresentada pelo primeiro autor ao Departamento de Matemática e Estatística, ESALQ-USP, para obtenção do grau de Mestre. , Luiz Alberto Rocha Batista4 1 Parte da Dissertação apresentada pelo primeiro autor ao Departamento de Matemática e Estatística, ESALQ-USP, para obtenção do grau de Mestre.

RESUMO - Foram avaliados 15 descritores reprodutivos, 22 vegetativos e 21 agronômicos, em que os agronômicos compreenderam sete descritores para a avaliação anual, sete descritores para a avaliação de inverno e sete descritores para a avaliação de verão, com o objetivo de selecionar os melhores descritores botânico-agronômicos para caracterizar acessos das espécies Paspalum guenoarum e Paspalum plicatulum. Utilizou-se a análise de componentes principais para descartar os descritores considerados redundantes ou não-discriminantes. Este método permitiu redução de 53, 68 e 43% dos descritores reprodutivos, vegetativos e agronômicos, respectivamente, do conjunto inicialmente considerado. Foi possível selecionar, por intermédio desta técnica, oito descritores, considerados mais importantes na descrição da variabilidade presente na coleção de acessos do germoplasma estudado.

Palavras-chave: acessos, análise de componentes principais, germoplasma, seleção de descritores

Selection of Descriptors for

Paspalum sp. Germplasm Characterization by Means of Principal Components

ABSTRACT - Fifteen reproductive, 22 vegetative and 21 agronomic descriptors were evaluated, the agronomic ones comprised seven descriptors for annual, winter and summer evaluations, respectively, with the objective to select the most appropriate descriptors for characterization of Paspalum guenoarum and Paspalum plicatulum. Principal components analysis was used to discard redundante or non-discriminative descriptors. The principal component analysis allowed a reduction of 53, 68 and 43%, respectively, in the number of initial descriptors considered. By means of this technique, it was possible to select eight descriptors, considered the most important descriptors to identify the genetic variability in this germplasm collection.

Key Words: accessions, germplasm, principal components analysis, selection descriptors

Introdução

Atualmente, a pecuária brasileira é sustentada por um número muito restrito de espécies forrageiras. Esta estreita base genética limita a capacidade de se elevarem os patamares de produtividade da pecuária brasileira, o que a torna vulnerável aos ataques de pragas e/ou doenças às quais estas espécies possam ser susceptíveis.

O gênero Paspalum compreende mais de 400 espécies tropicais e subtropicais, cuja importância é evidenciada por sua adaptabilidade a diferentes ecossistemas, o que representa menor risco de causar desequilíbrio biológico devido à grande diversidade genética existente.

Esta diversidade apresentada pelas espécies do gênero Paspalum levou CHASE (1929) a propor sua divisão em grupos taxonômicos. Dentre estes grupos, o de maior importância no Brasil Central é o Plicatula, podendo-se destacar, pelo seu potencial forrageiro, as espécies Paspalum guenoarum e Paspalum plicatulum.

O Centro de Pesquisa de Pecuária do Sudeste, CPPSE/EMBRAPA - São Carlos - São Paulo, vem realizando estudos de caracterização e avaliação agronômica no germoplasma dessas espécies, com o objetivo de obter novas variedades de forragem.

Dessa forma, buscou-se neste trabalho selecionar os descritores que melhor se prestam para caracterizar acessos das espécies Paspalum guenoarum e Paspalum plicatulum, eliminando aqueles considerados redundantes.

Material e Métodos

O estudo envolveu 27 acessos do gênero Paspalum, pertencentes ao grupo Plicatula, sendo cinco da espécie Paspalum guenoarum e 22 da espécie Paspalum plicatulum.

As caracterizações botânico-agronômicas foram realizadas em três ensaios no delineamento experimental em blocos ao acaso, com três repetições. A primeira repetição de cada ensaio foi utilizada para avaliação dos caracteres reprodutivos e vegetativos, e as outras duas foram utilizadas para avaliação agronômica. O número total de parcelas foi 81, com dimensões de 5 m x 2 m e as mudas espaçadas entre si de 0,5 m x 0,5 m, com área útil de 4 m x 1 m, constituída pelas duas fileiras centrais.

Os ensaios 1 e 2 contaram com 20 acessos. A avaliação agronômica foi realizada por intermédio de quatro cortes sucessivos, sendo que da soma dos quatro cortes foi obtida a avaliação anual dos dois primeiros cortes a avaliação de inverno e dos dois últimos, a avaliação de verão.

O ensaio 3 contou com sete acessos, e sua avaliação agronômica anual procedeu-se como citado acima. A avaliação de inverno foi a soma dos cortes um e quatro e a avaliação de verão, a soma dos cortes dois e três.

Os seguintes descritores botânico-agronômicos foram avaliados:

A) parte reprodutiva: pilosidade do escapo (PE), pilosidade do eixo floral (PEF), pilosidade do rácemo (PR), pilosidade da espigueta (PES), disposição do rácemo no eixo floral (DREF), época de florescimento (EFL), época de maturação (EM), comprimento do escapo (CE), comprimento do eixo floral (CEF), número médio de rácemo por inflorescência (NMRI), número médio de pedicelos por rácemo (NMPR), comprimento médio do rácemo mais longo (CMRML), comprimento médio da semente (CMS), largura média da semente (LMS) e número médio de sementes em 1 grama (NMS).

B) parte vegetativa: número médio de entrenós (NMEN), comprimento médio dos entrenós (CMEN), altura média das plantas (AMP), distribuição dos pêlos no limbo foliar (DIPLF), densidade dos pêlos no limbo foliar (DEPLF), comprimento dos pêlos no limbo foliar (COPLF), distribuição dos pêlos nas bainhas (DIPB), densidade dos pêlos nas bainhas (DEPB), comprimento dos pêlos nas bainhas (COPB), densidade dos pêlos nos nós (DEPN), comprimento dos pêlos nos nós (COPN), distribuição dos pêlos nos entrenós (DIPEN), densidade dos pêlos nos entrenós (DEPEN), comprimento dos pêlos nos entrenós (COPEN), comprimento médio da lâmina foliar da base (CMLF), largura média da lâmina foliar da base (LMLFBASE), largura média da lâmina foliar do meio (LMLFMEIO), comprimento médio da bainha (CMB), largura média da base da bainha (LMBBASE), largura média do meio da bainha (LMBMEIO), largura média do ápice da bainha (LMBAPICE) e comprimento da haste reprodutiva (CHR).

C) parte agronômica:

avaliação anual: porcentagem média de matéria seca (PORMSANO), produção total de matéria seca (kg/ha) (PRMSANO), porcentagem média de proteína bruta na matéria seca (PPMSANO), porcentagem média de fibra em detergente neutro (FDNANO), porcentagem média de digestibilidade in vitro (DIVANO), nota média de desenvolvimento vegetativo (NOTANO) e rebrota média (REBROAN).

avaliação de inverno: porcentagem média de matéria seca (PORMSINV), produção total de matéria seca (kg/ha) (PRMSINV), porcentagem média de proteína bruta na matéria seca (PPMSINVE), porcentagem média de fibra em detergente neutro (FDNINVER), porcentagem média de digestibilidade in vitro (DIVINVER), nota média de desenvolvimento vegetativo (NOTAINV) e rebrota média (REBROIN).

avaliação de verão: porcentagem média de matéria seca (PORMSVER), produção total de matéria seca (kg/ha) (PRMSVER), porcentagem média de proteína bruta na matéria seca (PPMSVER), porcentagem média de fibra em detergente neutro (FDNVERAO), porcentagem média de digestibilidade in vitro (DIVERAO), nota média de desenvolvimento vegetativo (NOTAVER) e rebrota média (REBROVER).

Todas as características reprodutivas, vegetativas e agronômicas foram avaliadas de acordo com padrões estabelecidos pelo CPPSE/EMBRAPA.

Utilizou-se a técnica de componentes principais para verificar a possibilidade de descartar os descritores não-discriminantes.

A metodologia da análise de componentes principais trata-se de uma técnica puramente matemática e encontra-se melhor descrita em MORRISON (1976), MARDIA et al. (1979) e JOHNSON e WICHERN (1982). A análise de componentes principais é um método multivariado que consiste em transformar um conjunto de p variáveis originais X1, X2, ..., Xp, pertencentes a n indivíduos ou populações, em um novo conjunto de variáveis, Y1, Y2, ..., Yp de dimensão equivalente, chamados componentes principais.

Cada componente principal é uma combinação linear das variáveis originais, construído de maneira a explicar o máximo da variabilidade total dessas variáveis originais e não-correlacionado entre si.

MORRISON (1976) define o primeiro componente principal (Y1) de um conjunto de p variáveis, X1, X2, ..., Xp, contidas no vetor X' =( X1, X2, ..., Xp) como a combinação linear:

Y1= b11X1+b21X2 +...+bp1Xp= b'1X

cujos coeficientes bi1 são elementos do vetor característico b1, associado à maior raiz característica (l1) da matriz de covariância amostral, S, das variáveis Xi's. O segundo componente principal (Y2) estará associado à segunda maior raiz característica (l2) e, assim sucessivamente, até que toda a variância tenha sido explicada. Os autovalores (ou raízes características) ordenados, ou seja, l1 ³ l2 ³ L ³ lp ³ 0, são as variâncias amostrais dos componentes principais. O primeiro componente também é definido como o de maior importância, uma vez que retém a maior parte da variação total encontrada nos dados originais.

A técnica envolve a matriz de covariância amostral S ou a matriz de correlação R, sendo que a maioria das aplicações tem envolvido esta última (MORRISON, 1976), pois, freqüentemente, as variáveis têm escalas diferentes (idade em anos, peso em quilos, altura em metros, entre outros), devendo ser padronizadas. Após essa transformação, todas as variáveis originais têm a mesma variância unitária e, dessa maneira, a base para extração dos componentes principais é a matriz de correlação R. Segundo esse autor, a padronização dos dados é obtida por:

sendo que

zij é o valor observado padronizado da j-ésima variável no i-ésimo indivíduo, com i=1,2,...,n e j=1,2,...,p; xij, o valor observado da j-ésima variável no i-ésimo indivíduo, com i=1,2,...,n e j=1,2,...,p; ,a estimativa da média da j-ésima variável; , o desvio-padrão da j-ésima variável; n, número de observações; e p, número de variáveis.

Assim, tem-se: R=Z'Z, sendo Z a matriz dos dados padronizados.

Segundo JOLLIFFE (1972 e 1973), quando se dispõe de grande número de descritores, é possível que muitos deles sejam redundantes, tornando-se útil a sua eliminação, porque, além de pouco informativos, ocorre acréscimo no trabalho de avaliação e não apresentam informação adicional.

Com base no princípio de que a importância ou variância dos componentes principais decresce do primeiro para o último, tem-se que os últimos componentes explicam uma fração muito pequena da variância total. Então, a variável de maior coeficiente no componente de menor autovalor dever ser a menos importante para explicar a variância total e, portanto, passível de descarte (PEREIRA, 1989).

A técnica dos componentes principais tem a vantagem adicional de avaliar a importância de cada caractere estudado sobre a variação total disponível entre os acessos avaliados, possibilitando o descarte dos caracteres menos discriminantes, por já estarem correlacionados com outras variáveis ou pela sua invariância (DAHER et al., 1997).

CURY (1993) realizou o descarte das variáveis através da técnica dos componentes principais, descartando a variável com maior coeficiente do componente com menor autovalor em sucessivas análises, isto é, a cada descarte repetiu a análise considerando o novo subconjunto de variáveis.

DIAS (1994) descartou as variáveis que apresentaram os maiores elementos dos autovetores nos últimos componentes, utilizando o critério de JOLLIFFE (1972, 1973), complementado pelo procedimento usado por CURY (1993).

O critério adotado foi descartar a variável de maior coeficiente em cada componente com autovalor menor que 0,70, de acordo com as pressuposições de JOLLIFFE (1972, 1973) e MARDIA et al. (1979).

Devido ao número pequeno de acessos disponíveis para este estudo (n=27) e à grande quantidade de variáveis, optou-se por realizar uma análise de componentes principais para cada conjunto de variáveis; em seguida, procedeu-se à eliminação dos descritores redundantes.

Foi efetuada uma análise de componentes principais considerando os caracteres anteriormente selecionados, para se proceder a um novo descarte, totalizando, portanto, seis análises de componentes principais.

As estimativas das correlações entre os descritores selecionados e descartados foram obtidas como medida da eficiência da análise de componentes principais, para descartar os descritores redundantes.

De acordo com JOLLIFFE (1973), pode-se fazer uma comparação dos componentes principais para os conjuntos de dados completo e reduzido. O coeficiente de correlação, r1, foi usado como medida de similaridade entre um par particular dos componentes.

Do conjunto de dados completo, algum componente principal pode ser escrito como uma combinação linear das p variáveis; assim, tem-se:

De maneira análoga, para o conjunto de dados reduzido, algum componente principal pode ser escrito como:

em que os coeficientes a e b são constantes, sendo nulos os valores de b correspondentes às variáveis descartadas.

Assim, o coeficiente de correlação entre Yi e Wj, denotado r1, é dado por:

Como medida de similaridade entre dois conjuntos de componentes, ou seja, Q1, deve ser usada uma média ponderada dos r1's para os vários pares de componentes, obtido por:

em que r1(j) é o valor máximo de r1, definido acima, entre o i-ésimo componente para o conjunto de dados completo e algum componente para o conjunto de dados reduzido e qi, a proporção da variação total explicada pelo i-ésimo componente no conjunto de dados completo.

Resultados e Discussão

A Tabela 1 apresenta as estimativas dos coeficientes de correlação entre os descritores selecionados e descartados, para os descritores reprodutivos.

Os descritores selecionados que apresentaram o maior número de coeficiente de correlação significativos com os descritores descartados foram: CE (três combinações), CEF (seis combinações) e LMS (três combinações).

Estes resultados estão de acordo com a idéia apresentada anteriormente, de que os descritores descartados, por explicarem o mesmo tipo de informação que os selecionados, são redundantes, sendo, portanto, de interesse a sua eliminação.

Observa-se, na Tabela 2, que esse germoplasma foi caracterizado pelos descritores PORMS e FDN em todas as avaliações, o que não ocorreu com o descritor NOTA. Na avaliação anual e de inverno, foram descartados os mesmos descritores.

As medidas de similaridade, r1(j) e Q1, entre os componentes para os conjuntos completo e reduzido dos descritores reprodutivos e agronômicos encontram-se nas Tabelas 3 e 4, respectivamente.

Observa-se, na Tabela 1, que o descritor PR não está correlacionado com nenhum dos demais, sendo o último a ser descartado, de acordo com o critério proposto. Adotando-se um valor 0,60 para os autovalores, este descritor também poderia ser selecionado.

Dessa forma, verificou-se pela Tabela 3 que a adição da variável PR provoca melhora nos valores dos coeficientes de correlação r1 e a mesma ordenação até o terceiro componente. Para o conjunto de seis descritores selecionados, o quarto componente reduzido é uma mescla do terceiro e sexto componentes originais, e para o conjunto de sete descritores, o quinto componente reduzido é uma mescla do quarto e sexto componentes originais. Portanto, os descritores selecionados foram: PEF, DREF, EFL, CE, CEF, LMS e PR.

Observando os coeficientes de correlação r1, da Tabela 4, verificou-se que os seus valores são altos para as três avaliações. A avaliação de verão reproduziu os componentes originais, o mesmo ocorrendo para a de inverno, apenas trocando a ordem dos componentes 1 e 2. Na avaliação anual, o primeiro componente reduzido foi uma mescla dos componentes completos 1 e 2, sendo que esta avaliação foi a que apresentou os menores valores para os coeficientes de correlação r1 e Q1. Os seguintes descritores foram considerados como selecionados: PORMSANO, PPMSANO, FDNANO, REBROAN, PRMSVER e DIVERAO.

De modo análogo, estas observações foram analisadas com as variáveis vegetativas, sendo selecionados os seguintes descritores: COPLF, DIPB, CMLF, LMLFMEIO, CMB, LMBBASE e CMEN.

Após a seleção de descritores reprodutivos, vegetativos e agronômicos, separadamente, foi realizada uma análise de componentes principais considerando estes 20 descritores conjuntamente (Tabela 5), a fim de se proceder à nova seleção; posteriormente, foram obtidas as medidas de similaridade r1 e Q1.

Conclusões

Houve descarte de 86% do total de descritores utilizados na caracterização dos acessos, evidenciando a necessidade de não se trabalhar com número excessivo de descritores com este tipo de material. Foram considerados como prioritários, para compor a relação de descritores, os seguintes caracteres: PR (pilosidade do rácemo), CE (comprimento do escapo), EFL (época de florescimento) (reprodutivos), DIPB (distribuição dos pêlos nas bainhas), CMB (comprimento médio da bainha), LMBBASE (largura média da base da bainha) (vegetativos), PORMSANO (porcentagem média de matéria seca - anual), e DIVERAO (porcentagem média de digestibilidade in vitro - verão) (agronômicos).

Os descritores agronômicos, por serem mais influenciados por fatores ambientais, tiveram menor participação na caracterização dos acessos, uma vez que, dos oito descritores selecionados, três foram reprodutivos e três vegetativos.

Agradecimento

Ao Centro de Pesquisa de Pecuária do Sudeste - CPPSE/EMBRAPA, pela cessão dos dados usados neste trabalho.

Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico-CNPq, pela concessão da bolsa de estudos.

Referências Bibliográficas

Recebido em: 11/03/99

Aceito em: 26/08/99

2 Professor do Departamento de Matemática Aplicada da Universidade Estadual de Londrina, Caixa Postal 6001 Campus Universitário, CEP 86051-990 - Londrina-PR - FAX (043) 371-4216. E-mail: estrapas@uel.br

3 ESALQ-USP, Departamento de Genética, Caixa Postal 83, CEP: 13400-970, Piracicaba-SP. E-mail: vencovsky@zaz.com.br

4 Pesquisador do Centro de Pesquisa de Pecuária do Sudeste - CPPSE/EMBRAPA, Rodovia Washington Luiz km 234, Caixa Postal 339, CEP 13560-970, São Carlos-SP. E-mail: lbatista@cppse.embrapa.br

  • CHASE, A. 1929. The north American species of Paspalum Contributions from the United States National Herbarium, 28(1):1-30.
  • CURY, R. Dinâmica evolutiva e caracterização de germoplasma de mandioca (Manihot esculenta Crantz) na agricultura autóctone do sul do Estado de São Paulo Piracicaba, SP: ESALQ, 1993. 103p. Dissertação (Mestrado) - Escola Superior de Agricultura "Luiz de Queiroz"/Universidade de São Paulo, 1993.
  • DAHER, R.F., MORAES, C.F., CRUZ, C.D. et al. 1997. Seleção de caracteres morfológicos em capim-elefante (Pennisetum purpureum Schum.). R. Bras. Zootec, 26(2):247-259.
  • DIAS, L.A.S. Divergência genética e fenética multivariada na predição de híbrido e preservação de germoplasma de cacau (Theobroma cacao L.) Piracicaba, SP:ESALQ, 1994. 94p. Tese (Doutorado) - Escola Superior de Agricultura "Luiz de Queiroz"/Universidade de São Paulo, 1994.
  • JOHNSON, R.A., WICHERN, D.W. 1982. Apllied multivariate statistical analysis. Englewood Cliffs: Prentice Hall. 593p.
  • JOLLIFFE, I.T. 1972. Discarding variables in a principal component analysis. I. Artificial data. Appl Stat, 21(2):160-173.
  • JOLLIFFE, I.T. 1973. Discarding variables in a principal component analysis. II. Real data. App Stat, 21(1):21-31.
  • MARDIA, K.V., KENT, J.T., BIBBY, J.M. 1979. Multivariate analysis London: Academic Press. 520p.
  • MORRISON, D.F. 1976. Multivariate statistical methods 2.ed. Singapore: McGraw Hill. 415p.
  • PEREIRA, A.V. Utilização de análise multivariada na caracterização de germoplasma de mandioca (Manihot esculenta Crantz). Piracicaba, SP: ESALQ, 1989. 180p. Tese (Doutorado em Melhoramento e Genética) - Escola Superior de Agricultura "Luiz de Queiroz"/Universidade de São Paulo, 1989.
  • 1
    Parte da Dissertação apresentada pelo primeiro autor ao Departamento de Matemática e Estatística, ESALQ-USP, para obtenção do grau de Mestre.
  • Datas de Publicação

    • Publicação nesta coleção
      12 Jan 2004
    • Data do Fascículo
      Abr 2000

    Histórico

    • Aceito
      26 Ago 1999
    • Recebido
      11 Mar 1999
    Sociedade Brasileira de Zootecnia Universidade Federal de Viçosa / Departamento de Zootecnia, 36570-900 Viçosa MG Brazil, Tel.: +55 31 3612-4602, +55 31 3612-4612 - Viçosa - MG - Brazil
    E-mail: rbz@sbz.org.br