Resumos
Comparou-se diferentes métodos de análise estatística utilizando-se os dados do efeito de diferentes doses do Diflubenzurom no consumo alimentar da lagarta-da-soja Anticarsia gemmatalis (Hübner). As estatísticas descritivas que melhor detectaram a ausência de normalidade foram a assimetria e curtose indicando necessidade da transformação. Com a análise dos dados originais não se observaram respostas significativas para os efeitos das doses de Diflubenzurom em relação ao consumo foliar pela lagarta-da-soja e, com transformação detectou-se que houve decréscimo nesse consumo na maior dose (15 g i.a.) diferindo estatisticamente da dose 7,5g i.a. Observou-se que para um dia após a aplicação do Diflubenzurom, a análise com os dados originais para o consumo foliar apresentou um coeficiente de variação de 47,8 % e, com os dados transformados este coeficiente foi de 2,7 %.
Insecta; Lepidoptera; assimetria; curtose; máxima verossimelhança
Different statistical methods of data analysis were performed on the effect of different dosages of Diflubenzurom in the consumption of velvetbean caterpillar, Anticarsia gemmatalis (Hübner). The best descriptives statistics to visualize the lack of normality were skewness and kurtosis suggesting the necessity of data transformation. When data without transformation were analyzed no statistical differences were observed among consumption of larvae maintained on leaves treated with Diflubenzurom. However, analysis of transformed data showed that larval feeding was lower on leaves treated with 15 g a.i. of Diflubenzurom, differing from 7.5 g a.i. treatment. It was observed a reduction coefficient of variation from 47.8 % to 2.7 % of foliar consumption one day after treatment, reducing the experimental variability.
Insecta; Lepidoptera; skewness; kurtosis; maximum likelihood
PROTEÇÃO DE PLANTAS
Diagnóstico exploratório na análise de dados entomológicos: efeito do diflubenzurom no consumo alimentar de Anticarsia gemmatalis (Hübner)
Exploratory diagnosis in entomological data: effect of diflubenzurom on the food consumption of Anticarsia gemmatalis (Hübner)
Maria C. N. Oliveira; Beatriz S. Corrêa-Ferreira
Embrapa Soja, Caixa postal 231, 86001-970, Londrina, PR
RESUMO
Comparou-se diferentes métodos de análise estatística utilizando-se os dados do efeito de diferentes doses do Diflubenzurom no consumo alimentar da lagarta-da-soja Anticarsia gemmatalis (Hübner). As estatísticas descritivas que melhor detectaram a ausência de normalidade foram a assimetria e curtose indicando necessidade da transformação. Com a análise dos dados originais não se observaram respostas significativas para os efeitos das doses de Diflubenzurom em relação ao consumo foliar pela lagarta-da-soja e, com transformação detectou-se que houve decréscimo nesse consumo na maior dose (15 g i.a.) diferindo estatisticamente da dose 7,5g i.a. Observou-se que para um dia após a aplicação do Diflubenzurom, a análise com os dados originais para o consumo foliar apresentou um coeficiente de variação de 47,8 % e, com os dados transformados este coeficiente foi de 2,7 %.
Palavras-chave: Insecta, Lepidoptera, assimetria, curtose, máxima verossimelhança.
ABSTRACT
Different statistical methods of data analysis were performed on the effect of different dosages of Diflubenzurom in the consumption of velvetbean caterpillar, Anticarsia gemmatalis (Hübner). The best descriptives statistics to visualize the lack of normality were skewness and kurtosis suggesting the necessity of data transformation. When data without transformation were analyzed no statistical differences were observed among consumption of larvae maintained on leaves treated with Diflubenzurom. However, analysis of transformed data showed that larval feeding was lower on leaves treated with 15 g a.i. of Diflubenzurom, differing from 7.5 g a.i. treatment. It was observed a reduction coefficient of variation from 47.8 % to 2.7 % of foliar consumption one day after treatment, reducing the experimental variability.
Key words: Insecta, Lepidoptera, skewness, kurtosis, maximum likelihood.
Um fator importante que antecede a análise de dados é a seleção de um método estatístico adequado que permita avaliar corretamente o comportamento dos efeitos dos tratamentos estudados e sua magnitude. Estas análises só devem ser realizadas após verificar se o modelo do delineamento experimental está correto e, se atende as pressuposições da análise de variância. Dentre estas são consideradas a distribuição dos erros dos resultados experimentais e a sua avaliação quando se afastam do conjunto de resposta. Num conjunto de dados se os erros têm distribuição assimétrica a variância residual é função da média (Cochran & Cox 1957). Outro fator a considerar são as observações discrepantes, as quais levam a perda na sensibilidade nos testes de significância e, deve haver critério para rejeitá-las (Bustos 1980, 1988, Hoaglin et al. 1992). Na ausência de um teste estatístico clássico para avaliar a dispersão das variâncias dos tratamentos, da aditividade do modelo e da normalidade dos erros, os dados devem ser avaliados através de gráficos, estatísticas descritivas e clássicas para melhor identificar os pontos discrepantes que comprometem a significância do teste F (Zar 1996).
Caso as observações discrepantes sejam detectadas através da análise exploratória recomenda-se a retirada deste valor, com critério, ou o uso da transformação que permita validar os testes de significância e as estimativas dos limites de confiança (Finney 1960, Box & Cox 1964, Bustos 1988). Para tanto, utilizou-se dados da avaliação do inseticida fisiológico Diflubenzurom no consumo alimentar da lagarta-da-soja Anticarsia gemmatalis (Hübner).
Material e Métodos
O produto fisiológico Diflubenzurom foi aplicado em lavoura de soja, nas doses de zero; 3,75; 7,5 e 15 g i.a./ha. Folíolos de soja coletados no campo aos um, cinco e 10 dias após a aplicação foram oferecidos às lagartas pequenas (3º instar) de A. gemmatalis, no laboratório. Estes folíolos foram distribuídos em caixas plásticas (10 x 10 cm) conforme o delineamento experimental completamente casualizado e, nestas colocadas cinco lagartas com cinco repetições por tratamento. A variável medida foi o consumo foliar pelas lagartas, nos períodos de um, cinco e 10 dias após a aplicação de Diflubenzuron avaliado através da medição da área foliar antes e após serem oferecidas como alimento às lagartas. O modelo matemático para este delineamento foi: Yij = m +Dosei +eij. onde, Yij é o consumo foliar, m é o efeito da média geral, Dosei é o efeito fixo da dose do produto aplicado nos folíolos de soja e eij é o efeito do erro aleatório com distribuição normal N~ (0, s2). O efeito da média geral e da dose do produto é a parte sistemática do modelo do delineamento inteiramente casualizado e o erro eij é a parte aleatória.
Na análise exploratória dos dados utilizaram-se os gráficos de "Box-plot" e o da probabilidade normal com os resíduos obtidos através do modelo do delineamento experimental e as estatísticas como: a assimetria, a curtose e os intervalos de confiança para as duas últimas estatísticas. Este método empírico foi comparado aos métodos clássicos que permitem avaliar as pressuposições da análise de variância tais como: a normalidade dos resíduos pelas estatísticas W e D (Shapiro & Wilk 1965, Lilliefors 1967), a estatística F para a não-aditividade do modelo (Tukey 1949), a estatística Q para a homocedasticidade de variâncias dos tratamentos (Burr & Foster 1972), e a avaliação dos resíduos (Parente 1984). Na ausência destes pressupostos aplicou-se a transformação da família potência (Box & Cox 1964, Abbiati & Recchioni 1990) pelo método de máxima verossimilhança, para atender os requisitos para a realização da análise de variância. A família de transformação potência utilizada neste estudo
foi: Y(l) = (Yl- 1) / l se l 0 e Y(l) = Ln Y se l = 0.
A estimativa da potência λ foi obtida pelo método da máxima verossimilhança (Box & Cox 1964) e segue abaixo o logarítmo da função de verossimilhança :
L( µ,s2,l) = Ln [Sni=1 e-(Yi (l) - µ)2 / (2s2) * 1/(SQRT(2ps2)) * J1]
J1 = é o jacobiano da transformação.
O método estatístico apropriado para estes dados é o da análise de regressão mas, para melhor servir os objetivos biológicos, após as análises exploratórias foram realizadas as análises de variância e o teste de comparações múltiplas para os efeitos médios dos tratamentos através do teste de Tukey (P < 0,05) com e sem transformação dos dados.
As análises estatísticas clássicas e descritivas foram realizadas pelos programas estatísticos SANEST- Sistema de Análise Estatística (Zonta et al.1984) e SAS - Statistical Analysis System (SAS Institute 1990) e os gráficos pelo programa Statistix (Analytical Software 1996).
Resultados e Discussão
Efeitos da Assimetria e Curtose na Normalidade de Dados Experimentais. Os escores residuais do consumo foliar, um dia após a aplicação do Diflubenzurom desviaram-se da reta de probabilidade, apresentando altos coeficientes de assimetria e de curtose e ausência de normalidade dos dados (Fig. 1A). Essas situações ocorrem, com freqüência, nos casos onde o modelo estatístico do delineamento experimental não é apropriado ou existe alta variabilidade entre os dados, como nos casos de insetos, face às condições ambientais e a sua distribuição espacial (Elliot 1979). Pelos resultados, a assimetria e curtose (Tabela 1) não estão incluídos nos seus intervalos de confiança indicando dados com alta variabilidade e sem distribuição normal, devido ao afastamento dos valores da média, mediana e moda de zero, conforme os trabalhos de Rohlf & Sokal (1969) e Zar (1996).
Existe controvérsia sobre a interferência da assimetria e curtose na significância das estatísticas F, t e intervalo de confiança. A exigência da normalidade na experimentação está vinculada a validação dos testes de significância, pois através dos experimentos são comparados a magnitude de respostas para estimar doses de produtos, insumos, entre outros tratamentos (Finney 1960). A assimetria e curtose terão efeito sobre a estatística F nos casos onde o número de observações é pequeno, inviabilizando a garantia da normalidade dos dados e a rejeição da hipótese de igualdade de efeitos de tratamentos (Lindman 1974). Observou-se que existe assimetria negativa (Fig. 1A) e, no "Box-plot" (Fig. 2A) avaliou-se a posição da mediana em relação aos quartis inferiores e superiores e quanto os dados distanciam-se da média e mediana. A estatística W (Shapiro & Wilk 1965) e D (Lilliefors 1967) apresentaram resposta significativa, indicando ausência de normalidade. Através da estatística F (Tukey 1949), e Q (Burr & Foster 1972) foi indicado que o modelo não é aditivo e as variâncias são heterogêneas confirmando-se os resultados dos métodos anteriores (Tabela 2).
Para o consumo foliar por A. gemmatalis aos cinco dias após a aplicação do inseticida (V5-O) (Fig. 3A), a distribuição dos resíduos foi aproximada e com variabilidade nos dados. Os resíduos foram mais uniformes,devido aos menores valores dos coeficientes de curtose (g2= 3,80) e de assimetria (g1= 1,28), mas ainda não é a situação ideal. O efeito de valores discrepantes sobre os valores da média, mediana e moda faz com que estas se distanciem de zero (Fig. 4A). A estatística clássica para V5-O indicou a existência de distribuição normal pelos testes W e D não significativos mas, ainda assim o modelo foi não aditivo e as variâncias dos tratamentos heterogêneas (Tabela 2).
Avaliando o consumo foliar pela lagarta-da-soja aos 10 dias após a aplicação do Diflubenzurom os gráficos e as estatísticas descritivas e clássicas apresentaram resultados satisfatórios em relação aos pressupostos da análise de variância (Figs. 5, 6, Tabelas 1, 2).
Na literatura encontram-se pontos discordantes em relação a validade dos métodos exploratórios e a presença de pontos discrepantes. Alguns autores sugerem que estes pontos sejam retirados com critério, outros enfatizam o uso de estatísticas resistentes para as estimativas dos parâmetros, alertando que o método exploratório deve ser usado quando existem muitas observações (Bustos 1980, 1988 e 1990) e um terceiro grupo usam a transformação dos dados para a obtenção dos pressupostos da análise de variância (Lindman 1974, Hinkley 1977, Bustos 1990, Hoaglin et al. 1992 ). Em experimentos entomológicos onde os dados apresentam valores altos de assimetria e curtose, estes estão sempre associados aos pontos discrepantes e, podem ser detectados através de métodos gráficos, exploratórios e estatísticas descritivas na validação das pressuposições da análise de variância. Às vezes, mesmo após a retirada dos pontos discrepantes ou "outliers" não são atendidas todas as exigências da análise de variância e a próxima etapa será a transformação dos dados. Se estes cuidados não são tomados pode-se detectar falsos valores de F. Sugere-se o bom senso em verificar a coerência de se optar por um método estatístico clássico ou o robusto.
Outros testes como o teste dos sinais dos resíduos, a razão entre a amplitude versus a média, a amplitude versus a raiz quadrada da média e o gráfico dos resíduos podem ser utilizados para avaliar a variabilidade dos dados (Mead et al. 1993). Os dados assimétricos e alta curtose, encontrados neste trabalho, interferiram na normalidade dos dados e na precisão das estimativas dos efeitos dos tratamentos. Segundo Silveira Jr. et al. (1989) quanto mais assimétrica é a distribuição dos dados em relação a média, menor será a representatividade dessa medida de posição. Discordando de Zimmermann (1987) que afirmou que somente a heterogeneidade de variâncias afeta o poder do teste F. Na prática, os resultados da ausência de normalidade nos dados de experimentos de campo, casa-de-vegetação e laboratório interferem nos valores do teste F.
Apesar dos coeficientes de assimetria (g1) e curtose (g2) serem questionados, têm sido um fator importante na avaliação das pressuposições para realizar a análise de variância, principalmente nos ensaios para medir a incidência de insetos e doenças. Dependendo do sinal e dos valores destas estatísticas, os gráficos da distribuição normal podem se apressentar muito ponteagudos ou achatados, indicando que os dados podem estar localizados próximas das médias e nas caudas ou entre as médias e as caudas (Rohlf & Sokal 1969, Zar 1996, Gomez & Gomez 1984, Mead et al. 1993).
Segundo Conagin et al (1993) em todos os testes de variâncias constantes, à medida que aumentaram os valores de assimetria e curtose da distribuição aumentou a rejeição da hipótese de uniformidade de variâncias e, nessas condições, foram obtidos coeficientes superiores a 1,1 e 4,04 respectivamente. Na prática, valores inferiores a 1,1 tanto para assimetria como para curtose também levam a ausência de pelo menos um dos pressupostos exigidos para a realização da análise de variância, discordando parcialmente da simulação obtida por Conagin et al. (1993).
Efeitos da Transformação Potência (l) sobre os Coeficientes de Assimetria, Curtose e a Normalidade dos dados. Com base nos resultados de análises das variáveis para um e cinco dias (Tabela 1), foi aplicada a transformação potência no intervalo de -2 até +2, pelo método da máxima verossimilhança (Box & Cox 1964), que permitiu obter uma potência que reduzisse o quadrado médio do resíduo e a assimetria e curtose. A transformação potência usada para a primeira variável foi l = -0,125, obtendo-se desta forma a linearidade nos resultados confirmada pelo "Box-plot". Observou-se leve assimetria, aproximação da mediana ao valor médio e o decréscimo do coeficiente de curtose de 8,1 para -0,95 após a transformação potência, os quais estão dentro do intervalo de confiança da distribuição normal com P<0,05 (Tabela 1, Figs. 1-B, 2-B ). A transformação que eliminou o efeito do ponto discrepante na variável V5-O foi a potência l= 0,625 confirmado também através das estatísticas descritivas e clássicas (Tabelas 1, 2 e Figs. 3-B, 4-B). Observou-se que os coeficientes de assimetria (g1= 0,19) e curtose (g2= -0,38) estão incluídos nos intervalos de confiança para a distribuição normal com P<0.05 e, são similares às estatísticas clássicas W, D, F e Q onde todos os resultados são inferiores aos valores críticos permitindo assim utilizar a análise de variância (Tabelas 1, 2).
A vantagem do uso dos métodos exploratórios é importante, pois permite detectar características sobre os dados experimentais, antes da análise de variâncias, que às vezes passam despercebidas pelo pesquisador e, ao mesmo tempo verificar a necessidade de uma transformação que permite obter inferências estatísticas com confiabilidade e precisão.
Efeitos da Transformação Potência (l) sobre a Análise de Variância e Testes de Comparações Múltiplas de Médias. Os efeitos antes e após a transformação nessas análises (Tabela 3) confirmaram a hipótese de que a ausência de normalidade é causada pela assimetria e curtose extremas, com a redução da precisão das estimativas dos testes de significância e a magnitude dos valores médios dos tratamentos (Rivest 1986). Observou-se que antes da transformação, para V1-O o teste de Tukey (P<0,05) indicou que somente a testemunha diferiu estatisticamente das demais doses, contrariando os resultados obtidos após a transformação (V1-T), onde houve diferenças entre as doses 7,5 e 15 g i.a. (Tabela 3).
A transformação de dados é usada nos casos onde não atende as exigências do modelo do delineamento. Se após a transformação, a ordem das médias estiver alterada, os valores mais elevados e mais próximos da escala original forem menores e distantes na escala transformada sugere-se buscar uma transformação mais apropriada, a qual nunca deve ter o objetivo de reduzir o coeficiente de variação. O método correto quando este coeficiente é alto é detectar que fator pode estar causando a variabilidade experimental (Demétrio 1978). Observou-se que a assimetria e curtose influenciaram mais os resultados do teste F para a variável V1-T cujo valor aumentou de 65,1 para 227 (349 % de aumento). O valor dessa estatística já indicava resposta significativa para os efeitos de tratamentos mas, na prática, nos casos onde os valores estão próximos de não ser significativo, altos valores da assimetria e curtose prejudicariam os resultados. Para o consumo aos cinco dias após o tratamento os resultados da análise de variância antes e após a transformação dos dados (V5-T ), se mantiveram constantes e o teste de comparações múltiplas de médias de Tukey (P<0,05) não se alterou, exceto os valores de F e do coeficiente de variação (Tabela 3). O teste de médias foi realizado antes e após a transformação para elucidar os erros que podem ocorrer quando os dados não são bem examinados. Às vezes quando se estabiliza as variâncias de um conjunto de dados, ocorre a ausência de normalidade e de estrutura aditiva do modelo e, conseqüentemente, redução no valor de F e aumento no coeficiente de variação (Hoaglin et al. 1992).
O consumo foliar por lagartas aos 10 dias atendeu a todos os pressupostos exigidos para a realização da análise de variância e, os resultados do teste de Tukey (P<0,05) foram significativos somente em relação à testemunha.
Os métodos propostos permitem visualizar rapidamente a ocorrência de valores altos para a assimetria, curtose e valores discrepantes. Esses fatores interferem na eficiência dos testes estatísticos, exceto nos casos onde é usada a transformação potência pelo método de máxima verossimilhança.
Agradecimentos
Agradecemos ao comitê de publicações da Embrapa Soja e a Dra. Lenita J. Oliveira pela revisão deste trabalho. Este trabalho de pesquisa foi aprovado pelo Chefe Adjunto Técnico da Embrapa Soja como manuscrito número 016/97.
Literatura Citada
Recebido em 10/10/97. Aceito em 28/09/98.
- Abbiati, N. N. & L. L. Recchioni, 1990. Transformación de potencias em modelos lineales. Comunicaciones en estadística aplicada a ciencias agropecuarias, INTA. Serie Divulgación 16. 16p.
- Box, G. E. P. & D. R. Cox, 1964 An analysis of transformations. J. Roy. Stat. Soc. B-26: 211-243, discussion 244-252.
- Burr, I.W. & L. A. Foster. 1972. A test for equality of variances. Mimeo series n0. 282. University of Purdue, West Lafayette, 26p.
- Bustos, O. 1980 Procedimentos robustos. 4º Simpósio Nacional de Probabilidade e Estatística. 163p.
- Bustos, O. 1988 Outliers e robustez. Rev. Bras. Estat. 49:7-30.
- Bustos, O. 1990 Estimadores robustos com regras de detecção de dados surpreendentes no modelo de regressão linear. Rev. Bras. Estat. 51: 61-79.
- Cochran, W. G. & G. M. Cox. 1957 Experimental designs. 2nd ed. London, John Wiley. 611p.
- Conagin, A., V. Nagai, T. Igue, & L. A. Ambrósio. 1993 Efeito da falta de normalidade em testes de homogeneidade das variâncias. Bragantia 52:173-180.
- Demétrio, C. G. B. 1978. Transformação de dados. Efeitos sobre a análise de variância. Piracicaba, Tese de mestrado. ESALQ/USP, 113p.
- Elliott, J. M. 1979 Some methods for the statistical analysis of samples of benthic invertebrates. Freshwater Biological Association. 25, 156p.
- Finney, D.J. 1960. An introduction to the theory of experimental design. Univ. Chicago, 222p.
- Gomez K. A. & A. A. Gomez.1984. Statistical procedures for agricultural research. 2nd ed. John Wiley, 680p.
- Hinkley D. 1977 On quick choice of power transformation. Appl. Stat. 26:67-69
- Hoaglin, D. C. F. Mosteller & J. W. Tukey. 1992 Análise exploratória de dados. Técnicas robustas. Edições Salamandra. Lisboa. 446p
- Lilliefors, H.W. 1967 On the Kolmogorov-Smirnov test for normality with mean and variance unknown. JASA. 62: 399-402.
- Lindman, H. R. 1974. Analysis of variance in complex experimental designs. S. Francisco. ed. Whfreeman & C.O. 324p.
- Mead, R., R. N. Curnov & A. M. Hasted. 1993 Statistical methods in agriculture and experimental biology. 2nd ed, Chapman & Hall, London, 415p.
- Nagai, V., A. Conagin & T. Igue. 1991 Sensibilidade de diferentes testes de homogeneidade das variâncias. Rev. Agric. 66: 65-76.
- Parente, R.C.P. 1984 Aspectos da análise de resíduos. Piracicaba. Tese de mestrado. ESALQ/USP. 118p.
- Rivest, L.P. 1986 Bartlett's, Cochran's, and Hartley's tests on variances are liberal when the underlying distribution is long-tailed. JASA. 81:393, 124-128.
- Rohlf, F. J. & R. R. Sokal. 1969 Biometry. The principles and practice of statistics in biological research. Editora W.H. Freeman & Co., S. Francisco, 776 p.
- Shapiro, S.S. & M.B. Wilk 1965. "An analysis of variance teste for normality". Biometrika 52:591-611.
- Silveira Júnior, P., A. A. Machado, E. P. Zonta & J. B. da Silva. 1989 Curso de estatística. 1. UFPel. 135p.
- Tukey, J. W. 1949. One degree of freedon for non-additivity. Biometrics 5:232-242.
- Zar, J. H. 1996 Biostatistical analysis. Prentice Hall, Upper Saddle River, NJ, 3rd ed, 718p.
- Zimmermann, F. J. P. 1987 Efeito de heterogeneidade de variância e distribuição de probabilidade dos dados sobre o poder e tamanho do teste F. Pesq. Agropec. Bras. 22:1209-1213.
Datas de Publicação
-
Publicação nesta coleção
05 Jun 2006 -
Data do Fascículo
Dez 1998
Histórico
-
Aceito
28 Set 1998 -
Recebido
10 Out 1997