Resumos
Este trabalho objetivou avaliar um método de amostragem por segmentos regulares na estimativa da área plantada com soja no Estado do Rio Grande do Sul. Um mapa temático das áreas com soja, oriundo da classificação multitemporal de imagens do satélite Landsat, ano-safra 2000/01, foi utilizado como dado de referência para comparação dos resultados. A área de estudo foi dividida em segmentos regulares de 1 x 1km e estratificada em relação ao percentual de soja cultivado no município, em três extratos: a) 0-20; b) 20-40 e c) 40-67%. Um método probabilístico foi utilizado para definir quatro números amostrais, representando 0,06, 0,12, 0,24 e 0,48% da área de estudo, sendo cada um sorteado aleatoriamente cem vezes. A estimativa da área de soja para cada sorteio foi calculada analisando-se a área de cada segmento sorteado sobre o mapa temático e então comparada ao dado de referência. Os melhores resultados foram obtidos para o maior número amostral, o qual teve baixo Coeficiente de Variação (5,2%), indicando que o método, além de fornecer a área plantada com soja, em nível estadual, pode ser usado para prever a área plantada no início da safra ou nos anos em que não se dispõe de imagens de satélite livres de nuvens. Os três melhores sorteios para o maior número amostral tiveram sua área de soja também quantificada através do mapeamento de imagens adquiridas no ano-safra subseqüente (2001/02). Neste caso, foi observado um incremento entre 11,4 e 12,5% em relação ao ano-safra 2000/01, indicando que o incremento informado pelo IBGE (8,8%) está subestimado.
sensoriamento remoto; estatísticas agrícolas; sistemas de informação geográfica
This paper evaluates a sampling square method to estimate soybean crop area in Rio Grande do Sul State, Brazil. A soybean thematic map obtained from multitemporal Landsat images classification for the crop year of 2000/01 was used as reference data. The State area was divided into cells of 1 x 1km and stratified into three soybean area densities (0-20, 20-40 and 40-67%) at municipality level. A probabilistic technique was used to determine four sample rates representing 0.06, 0.12, 0.24 and 0.48% of the study area, being each one randomly sampled one hundred times. The soybean area for each sample was evaluated based on the reference data map. The one hundred estimates for each sample rate were then compared with the reference data for the entire study area. Best results were obtained for the highest sample rate with low Coefficient of Variation (5.2%), indicating that this method is not only suitable to accurate estimate soybean crop area, at State level, but it is also an appropriate alternative for early forecast or when cloud free satellite images are not available. The best three samples for the highest sample rate were selected to estimate soybean area over images acquired in the following crop year (2001/02). In this case, an increment between 11.4 and 12.5% in relation to 2000/01 was observed, indicating that the IBGE estimate (8.8%) is underestimated.
remote sensing; agricultural statistics; geographic information system
ARTIGOS CIENTÍFICOS
FITOTECNIA
Estimativa da área de soja no Estado do Rio Grande do Sul por um método de amostragem
Soybean crop area estimate in Rio Grande do Sul State through a sampling method
Rodrigo RizziI,1 1 Autor para correspondência. ; Bernardo Friedrich Theodor RudorffI; Marcos AdamiII
IInstituto Nacional de Pesquisas Espaciais (INPE) Divisão de Sensoriamento Remoto (DSR) Av. dos Astronautas, 1758, 12201-970, Caixa Postal 515, São José dos Campos, SP, Brasil. E-mail: rizzi@dsr.inpe.br
IISecretaria de Estado da Agricultura e Abastecimento do Paraná (SEAB) Av. Minas Gerais, 1351, 86300-000, Cornélio Procópio, PR, Brasil
RESUMO
Este trabalho objetivou avaliar um método de amostragem por segmentos regulares na estimativa da área plantada com soja no Estado do Rio Grande do Sul. Um mapa temático das áreas com soja, oriundo da classificação multitemporal de imagens do satélite Landsat, ano-safra 2000/01, foi utilizado como dado de referência para comparação dos resultados. A área de estudo foi dividida em segmentos regulares de 1 x 1km e estratificada em relação ao percentual de soja cultivado no município, em três extratos: a) 0-20; b) 20-40 e c) 40-67%. Um método probabilístico foi utilizado para definir quatro números amostrais, representando 0,06, 0,12, 0,24 e 0,48% da área de estudo, sendo cada um sorteado aleatoriamente cem vezes. A estimativa da área de soja para cada sorteio foi calculada analisando-se a área de cada segmento sorteado sobre o mapa temático e então comparada ao dado de referência. Os melhores resultados foram obtidos para o maior número amostral, o qual teve baixo Coeficiente de Variação (5,2%), indicando que o método, além de fornecer a área plantada com soja, em nível estadual, pode ser usado para prever a área plantada no início da safra ou nos anos em que não se dispõe de imagens de satélite livres de nuvens. Os três melhores sorteios para o maior número amostral tiveram sua área de soja também quantificada através do mapeamento de imagens adquiridas no ano-safra subseqüente (2001/02). Neste caso, foi observado um incremento entre 11,4 e 12,5% em relação ao ano-safra 2000/01, indicando que o incremento informado pelo IBGE (8,8%) está subestimado.
Palavras-chave: sensoriamento remoto, estatísticas agrícolas, sistemas de informação geográfica.
ABSTRACT
This paper evaluates a sampling square method to estimate soybean crop area in Rio Grande do Sul State, Brazil. A soybean thematic map obtained from multitemporal Landsat images classification for the crop year of 2000/01 was used as reference data. The State area was divided into cells of 1 x 1km and stratified into three soybean area densities (0-20, 20-40 and 40-67%) at municipality level. A probabilistic technique was used to determine four sample rates representing 0.06, 0.12, 0.24 and 0.48% of the study area, being each one randomly sampled one hundred times. The soybean area for each sample was evaluated based on the reference data map. The one hundred estimates for each sample rate were then compared with the reference data for the entire study area. Best results were obtained for the highest sample rate with low Coefficient of Variation (5.2%), indicating that this method is not only suitable to accurate estimate soybean crop area, at State level, but it is also an appropriate alternative for early forecast or when cloud free satellite images are not available. The best three samples for the highest sample rate were selected to estimate soybean area over images acquired in the following crop year (2001/02). In this case, an increment between 11.4 and 12.5% in relation to 2000/01 was observed, indicating that the IBGE estimate (8.8%) is underestimated.
Key words: remote sensing, agricultural statistics, geographic information system.
INTRODUÇÃO
Ações governamentais para o controle eficiente das importações e exportações dos produtos agrícolas, tanto em respeito à balança comercial, quanto ao adequado abastecimento do mercado interno, requerem informações confiáveis e atualizadas sobre área plantada, produtividade e, conseqüentemente, produção final desses produtos. No Brasil, as previsões de safras oficiais são realizadas pelo Instituto Brasileiro de Geografia e Estatística (IBGE), utilizando informações municipais subjetivas, baseadas em opiniões de agentes técnicos e econômicos relacionados ao setor (SANO et al., 1998). Entretanto, em função do seu caráter subjetivo, tais informações não permitem uma análise quantitativa dos erros envolvidos, além de serem passíveis de manipulação (PINO, 2001).
Dada a grande extensão territorial brasileira, aliada à dinâmica espaço-temporal da atividade agrícola, a maneira mais fácil de minimizar a subjetividade inerente às estatísticas oficiais é a introdução das imagens de Sensoriamento Remoto (SR) e dos Sistemas de Informações Geográficas (SIGs) às técnicas tradicionais. A possibilidade da estimativa de área plantada de grandes culturas por meio da classificação de imagens de SR já é pauta em pesquisas relacionadas ao tema (FONTANA et al., 2001; BERKA & RUDORFF, 2003; IPPOLITI-RAMILO et al., 2003; RIZZI & RUDORFF, 2003). Entretanto, além do problema relacionado à obtenção de imagens livres de nuvens, tal método não possui caráter prognóstico, visto que as imagens a serem adquiridas, visando à identificação das culturas, na maioria dos casos, somente serão analisadas próximo à colheita, o que retarda a disponibilidade da informação e reduz, consideravelmente, o seu valor estratégico para fins de negociação no mercado globalizado. Por conseguinte, faz-se necessária a utilização de uma abordagem que forneça informações prognósticas a respeito da área plantada.
Neste sentido, um método para estimativa de área plantada baseado na técnica de amostragem por segmentos regulares foi sugerido por ADAMI (2003). Neste método, a área em estudo é dividida em segmentos regulares de 1 x 1km. Alguns destes segmentos são aleatoriamente escolhidos, e neles as culturas de interesse podem ter sua área quantificada por meio de visitas a campo por ocasião da implantação da cultura, dando à estimativa um caráter prognóstico. Através da técnica denominada expansão direta, essa informação é utilizada para se inferir a respeito da área plantada em toda a região considerada.
Este método foi utilizado por ADAMI (2003) para a estimativa da área plantada com soja em uma região do norte do Paraná. Os resultados mostraram que tal método subestimou a área plantada em apenas 5,9% em relação ao Departamento de Economia Rural do Estado (DERAL), com um coeficiente de variação de 6,6%. Apesar disso, é difícil inferir sobre a exatidão do método de amostragem proposto, pois não se pode assegurar que a estimativa subjetiva do DERAL corresponda à realidade, em virtude da ausência de um dado de referência confiável.
Desta forma, este trabalho objetivou avaliar o método de amostragem por segmentos regulares proposto por ADAMI (2003), para a estimativa de área plantada com soja no Estado do Rio Grande do Sul, utilizando como dado de referência um mapa temático produzido por meio da classificação multitemporal de imagens adquiridas pelo satélite Landsat (RIZZI, 2004).
MATERIAL E MÉTODOS
A área de estudo está localizada entre as latitudes S 27° 03' e S 30° 13' e as longitudes W 50° 40' e W 56° 20', abrangendo 322 municípios (111.628km2), os quais corresponderam a aproximadamente 90% da área plantada com soja no Estado do Rio Grande do Sul no ano-safra 2000/01. O dado de referência utilizado neste trabalho foi um mapa temático produzido por RIZZI (2004), no qual áreas de soja foram mapeadas por meio da classificação automática e visual de imagens adquiridas no ano-safra 2000/01 pelos sensores Thematic Mapper (TM) e Enhanced TM plus (ETM+), a bordo dos satélites Landsat -5 e -7, respectivamente.
Como o método proposto sugere uma estratificação visando minimizar o número de segmentos a serem amostrados para otimizar o trabalho em campo, o mapa temático foi associado à divisão política municipal e estratificado considerando-se a porcentagem de área plantada com soja em cada município, em relação à sua área total (estratificação em nível municipal). Os limiares estabelecidos para a definição dos estratos foram: 0-20% (estrato 1), 20-40% (estrato 2) e 40-67% (sendo 67% o limite superior; estrato 3). Posteriormente, a área de estudo foi dividida em segmentos regulares de 1 x 1km (unidades amostrais), respeitando os limites geodésicos dos estratos. Sendo assim, obtiveram-se 111.628 segmentos, distribuídos em: a) 60.917 no estrato 1; b) 22.542 no estrato 2; e c) 28.169 no estrato 3.
Determinou-se o tamanho amostral necessário para gerar uma estimativa com intervalo de confiança de 95% e um erro amostral de 5%, de acordo com COCHRAN (1977):
em que, n = número total de segmentos a serem amostrados; z = distribuição normal padrão; a = nível de significância; p = percentual da área cultivada com soja; q = percentual da área utilizada para outros fins; E = erro esperado para a estimativa. O número amostral em cada estrato (subamostras), determinado em COCHRAN (1977), é dado por:
em que, nh = número amostral, em cada estrato; Nh = número total de segmentos no estrato; Ph = percentual da área do estrato cultivado com soja; qh = percentual da área do estrato utilizado para outros fins; L = número de estratos; n = número total de segmentos a serem amostrados.
Determinaram-se 26 amostras para o estrato 1, 74 amostras para o estrato 2 e 165 amostras para o estrato 3, totalizando 265 amostras (segmentos). Optou-se, ainda, por testar um número menor de subamostras em cada estrato, o qual foi reduzido em 50 e 75%. Decidiu-se, também, duplicar o número amostral, obtendo-se, assim, quatro conjuntos amostrais, contendo 67, 133, 265 e 530 amostras de acordo com a tabela 1. Este procedimento permitirá escolher o conjunto amostral capaz de fornecer estimativas compatíveis com a exatidão requerida, utilizando o menor número de amostras possível. Isso porque se busca uma metodologia operacional na qual se deve, primordialmente, minimizar o custo do trabalho a campo, fornecendo, entretanto, estimativas com uma exatidão aceitável.
Para efeito de verificação da exatidão do método, realizaram-se 100 sorteios aleatórios para cada conjunto amostral, visando obter a estimativa da área plantada com soja em cada sorteio. Por exemplo, para o conjunto amostral 1 foram escolhidos, aleatoriamente, 7 segmentos no estrato 1, 18 segmentos no estrato 2 e 42 segmentos no estrato 3, perfazendo 67 segmentos de um total de 111.628 (procedimento efetuado 100 vezes). A área estimada de soja () pelo do método de expansão direta é obtida por:
(COCHRAN, 1977), em que:
i = índice para representar o estrato; i = 1, ...,m; k = índice para representar o segmento escolhido; k = 1,..., nii; m = número de estratos; ni = número de segmentos escolhidos no i-ésimo estrato; Ni = número total de segmentos no i-ésimo estrato; ei = (ni/Ni)-1, fator de expansão ou inverso da probabilidade de que um segmento tem de estar na amostra escolhida no i-ésimo estrato; zi,k = valor da característica desejada, no k-ésimo segmento, no i-ésimo estrato.
Variância estimada:
em que, si2 variância estimada no estrato i; i = índice para representar o estrato; i = 1, ...,m; k = índice para representar o segmento escolhido; k = 1,..., ni; m = número de estratos; ni = número de segmentos escolhidos no i-ésimo estrato; Ni = número total de segmentos no i-ésimo estrato; ei = (ni/Ni)-1, fator de expansão ou inverso da probabilidade de que um segmento tem de estar na amostra escolhida no i-ésimo estrato; zi,k = valor da característica desejada, no k-ésimo segmento, no i-ésimo estrato.
Assim, o coeficiente de variação (CV) estimado é obtido por:
em que, v()= variância estimada; = área total estimada.
Para o conjunto amostral de melhor desempenho, ou seja, aquele cujas diferenças relativas das estimativas dos 100 sorteios frente ao dado de referencia estiveram dentro de um intervalo aceitável para uma estimativa desta natureza, foram escolhidos os três sorteios que proporcionaram as estimativas mais próximas ao dado de referência (círculos na figura 1d). Posteriormente, os segmentos referentes aos três sorteios escolhidos tiveram sua área de soja quantificada por meio do mapeamento visual de imagens Landsat durante o ano-safra 2001/02 (ano-safra subseqüente).
Neste caso, foram utilizadas imagens adquiridas em duas datas distintas dentro do período mais favorável à identificação das áreas com soja, de tal modo que até mesmo talhões plantados precoce ou tardiamente, pudessem ser identificados, fazendo com que a área de soja quantificada em cada segmento seja muito próxima à realidade no campo. De posse desta informação, e utilizando-se o método de expansão direta citado anteriormente, foi estimada a área plantada com soja para toda a área de estudo, bem como o incremento ocorrido em relação ao ano-safra anterior (2000/01), para cada um dos três sorteios escolhidos.
Este procedimento foi adotado partindo-se do princípio de que os segmentos contidos nos três melhores sorteios de um conjunto amostral em 2000/01, sejam também os que melhor representem a população no ano-safra 2001/02. Soma-se a isto, o fato de que a área em estudo consiste de uma região particular, na qual se adota a soja praticamente sob um sistema de monocultura, cuja área e disposição das lavouras pouco se alteram de um ano-safra para outro. Portanto, espera-se que os segmentos que melhor representaram a população em determinada safra proporcionem as estimativas mais exatas também na safra seguinte. Novamente cabe ressaltar que, muito embora as imagens de satélite utilizadas na estimativa da área plantada no ano safra 2001/02 possam fornecer resultados muito próximos à realidade, tal informação só estará disponível muito próximo da colheita da cultura em questão. Em função disso, para obterem-se informações prognósticas a respeito da área plantada é imprescindível o trabalho de campo nos segmentos amostrados.
RESULTADOS E DISCUSSÃO
A figura 1 (entre a e d) apresenta as diferenças relativas das estimativas de área plantada pelo método de amostragem em relação ao dado de referência (mapa temático), em ordem crescente de CV, para cada um dos quatro conjuntos amostrais (67, 133, 265 e 530 amostras) nos 100 sorteios realizados, para o ano-safra 2000/01.
Percebe-se que à medida que aumenta o número amostral, diminui a amplitude de variação e a magnitude das diferenças das estimativas em relação ao dado de referência, o mesmo ocorrendo em relação aos valores dos CVs. Observa-se ainda, que para todos os conjuntos amostrais, houve expressiva variação entre as estimativas dos diferentes sorteios. Ainda assim, não se constatou efeito do CV sobre a exatidão das estimativas para um mesmo conjunto amostral, já que as maiores diferenças (em módulo) estiveram associadas tanto a altos, quanto a baixos valores de CV, o mesmo ocorrendo com as menores diferenças. Houve uma tendência dos menores valores de CV corresponderem às diferenças negativas (subestimativas), enquanto que os maiores CVs estiveram relacionados às diferenças positivas (superestimativas). Sendo assim, é fácil compreender porque as estimativas mais próximas ao dado de referência estão associadas aos valores intermediários de CV. Quando se ajusta o CV em função ao sorteio, observa-se que o ângulo de inclinação da sua reta de distribuição diminui do conjunto amostral 1 para o conjunto amostral 4. Ou seja, o coeficiente de correlação entre a diferença e o CV diminui com o aumento do número amostral. Isto significa que a relação entre o valor maior e o menor diminui consideravelmente, o que provoca certa estabilização dos valores à medida que se aumenta o número amostral (Tabela 2), convergindo para o fato de que o número amostral ideal para a estimativa em questão pode estar em torno de 530.
A despeito das assertivas anteriores, ao se adotar um sistema de amostragem desta natureza visando à estimativa da área plantada com determinada cultura em uma região, a principal referência disponível para se inferir sobre a exatidão da estimativa é o CV, o qual está intimamente relacionado ao número amostral. Contudo, a escolha do número amostral deve considerar, primordialmente, a viabilidade da execução do método, ou seja, da avaliação da área plantada nos segmentos escolhidos de uma forma economicamente viável e em tempo oportuno, o qual, na maioria dos casos, será realizado através de visitas a campo, auxiliadas ou não, por imagens de SR.
No presente estudo, para o conjunto amostral contendo 530 amostras, as diferenças relativas da estimativa via amostragem frente ao dado de referência variaram entre -10,53 e 10,28% (64% variaram entre -5 e 5%), sendo que os CVs oscilaram entre 3,63 e 6,88% (Tabela 2). Além disso, os 530 segmentos representam tão somente 0,48% da área estudada, abrangida por 322 municípios, totalizando menos de dois segmentos por município (Tabela 1), o que deve tornar viável a execução prática do método através de visitas a campo.
Neste procedimento, os técnicos responsáveis podem ainda ser auxiliados por imagens de SR adquiridas e classificadas no ano-safra anterior, em que a delimitação e identificação dos talhões apenas necessitarão ser atualizadas para o ano-safra em questão. Neste caso, uma vez que as amostras são fixas para certo intervalo de tempo, o processo de avaliação da área plantada nas mesmas torna-se gradualmente facilitado a partir do segundo ano, devido ao responsável pela avaliação ir se familiarizando à localização da amostra e à distribuição e formato das diferentes classes de uso do solo.
Para os demais conjuntos amostrais, a magnitude das incertezas encontradas, tanto em termos de diferença relativa, quanto no que se refere ao CV (principalmente para 67 e 133 amostras), torna sua aplicação pouco recomendada.
Por fim, o que fica evidenciado no sistema proposto ante os resultados encontrados, particularmente no que se refere ao conjunto amostral 4, é que o mesmo, além de proporcionar uma idéia da real área plantada, fornece o erro associado à estimativa, o que não ocorre em se tratando das estimativas subjetivas.
A tabela 3 apresenta a estimativa da área plantada com soja e o respectivo CV para o ano-safra 2001/02, além do incremento em relação ao dado de referência (2000/01), para cada sorteio do conjunto amostral 4 (530 amostras). Neste caso, além do reduzido valor dos CVs (entre 4,8 e 5,6%), houve pouca variação entre as estimativas do incremento na área plantada entre os três sorteios. Em decorrência disto, pode-se afirmar que o incremento em relação ao ano-safra 2000/01 está entre 11,4 e 12,5% e que o incremento informado pelos órgãos oficiais (8,8%) está subestimado. Esta afirmação é reforçada pelo valor do incremento fornecido pela empresa Cargill Agrícola S.A. complexo soja para o mesmo período, avaliado em 11% (MOREIRA, 2003), a qual possui ampla experiência em estimativas de safras de soja no Brasil por meio de imagens de SR e visitas em campo. Apesar disso, somente através de um dado de referência confiável poder-se-ia avaliar a exatidão de tais estimativas.
CONCLUSÃO
A avaliação do método de amostragem por segmentos quadrados, proposto por ADAMI (2003) indicou que o mesmo pode estimar a área plantada com soja no Estado do Rio Grande do Sul com baixo CV, sendo que o número amostral ideal para a estimativa em nível estadual pode estar em torno de 530. O incremento na área plantada de soja no ano-safra 2001/02 em relação a 2000/01 está entre 11,4 e 12,5%, sendo que o valor informado pelo IBGE (8,8%) está subestimado.
INFORMAÇÃO PESSOAL
MOREIRA, M. Incremento da área plantada com soja no Rio Grande do Sul entre os anos-safra 2000/01 e 2001/02. Cargill Agrícola S.A. Complexo soja. Comunicação Pessoal, 2003. Jose_Yi@cargill.com.
Recebido para publicação 16.03.05
Aprovado em 24.08.05
- ADAMI, M. Estimativa de áreas agrícolas por meio de técnica de sensoriamento remoto, geoprocessamento e amostragem 2003. 183f. Dissertação (Mestrado em Sensoriamento Remoto) - Instituto Nacional de Pesquisas Espaciais, São José dos Campos.
- BERKA, L.M.S.; RUDORFF, B.F.T. Estimativa de área plantada com soja através de imagens Landsat em municípios do norte do Paraná. In: SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, 11., 2003, Belo Horizonte. Anais... São José dos Campos: INPE, 2003. p.27-31.
- COCHRAN, W.G. Técnicas de amostragem 2.ed. Rio de Janeiro: Fundo de Cultura, 1977. 555p.
- FONTANA, D.C. et al. Monitoramento e previsão da safra de soja 1999/2000 no Brasil Porto Alegre: Centro Estadual de Pesquisas em Sensoriamento Remoto e Meteorologia, CEPSRM/UFRGS, 2001. 116p. (Série D: Relatório Técnico - n.005/01).
- IPPOLITI-RAMILO, G.A. et al. Landsat-5 Thematic Mapper data for pre-planting crop area evaluation in tropical countries. International Journal of Remote Sensing, v.24, n.7, p.1521-1534, 2003.
- SANO, E.E. et al. Monitoramento da ocupação agrícola. In: ASSAD, E.D.; SANO, E.E. Sistemas de informação geográfica: aplicações na agricultura 2.ed. Brasília: Embrapa-CPAC, 1998. Cap.10, p.179-190.
- PINO, F.A. Estimação subjetiva de safras agrícolas. Informações Econômicas, São Paulo, v.31, n.6, p.55-58, 2001.
- RIZZI, R. Geotecnologias em um sistema de estimativa da produção de soja: estudo de caso no Rio Grande do Sul 2004. 212f. Tese (Doutorado em Sensoriamento Remoto) - Instituto Nacional de Pesquisas Espaciais, São José dos Campos.
- RIZZI, R.; RUDORFF, B.F.T. imagens Landsat na estimativa de área plantada com soja em municípios do Rio Grande do sul. In: SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, 11., 2003, Belo Horizonte. Anais... São José dos Campos: INPE, 2003. p.231-238. CD-ROM.
Datas de Publicação
-
Publicação nesta coleção
13 Jan 2006 -
Data do Fascículo
Fev 2006
Histórico
-
Aceito
24 Ago 2005 -
Recebido
16 Mar 2005