Acessibilidade / Reportar erro

Dinâmica da frota de veículos que estacionam no centro de Lavras, MG

Dynamics of the convoy of vehicles parking at Lavras, MG city center

Resumos

Ensaios de captura-recaptura constituem técnica amostral comumente utilizada para estimar o tamanho e outros componentes da dinâmica de uma população. Neste artigo, o objetivo foi estimar a rotatividade (entrada e saída) da frota de veículos que estacionam no centro de Lavras-MG. O período estudado inclui a última semana de agosto até a segunda semana de setembro de 2002, que coincidiu com as férias semestrais. Foram utilizados modelos generalizados Poisson (log-lineares), segundo apresentado por Cormack (1989). Tais modelos requerem registros de cada indivíduo e sua história de captura anterior, compondo grupos mutuamente exclusivos com a mesma história de captura. As placas dos veículos foram utilizadas em sua marcação. Não foi detectada qualquer fonte de interação significativa entre as recapturas, o que indica uma população fechada geográfica e demograficamente. Estimativas pontuais para o tamanho da frota apresentaram valor próximo de 6.000 veículos; no entanto, os intervalos de confiança foram muito amplos. Sugere-se que modelos mais parcimoniosos (de população fechada) resultam em estimativas mais precisas do tamanho da frota.

Captura-recaptura; Modelo linear generalizado; Modelo de Cormack


Capture-recapture techniques were used to estimate aspects of the populational dynamics of the convoy of vehicles parking at the Lavras-MG city center during the inter-term holiday period, from August 26 until September 24, 2002. We started from the open population model of Jolly-Seber. Generalized linear models were used (log-linear), according to Cormack (1989). Such models demand individual records and also its previous capture history. The vehicles plates were used as marks. No source of significative interaction was detected, and this suggests a geographically and demographically closed population. Point estimates values were next to the 6.000 vehicles, but the confidence regions were very broad. It was suggested that parsimonious models (closed population models) should be considered to get more accurate estimates.

Capture-recapture; Generalized linear models; Cormack's models


ESTATÍSTICA E EXPERIMENTAÇÃO AGROPECUÁRIA

Dinâmica da frota de veículos que estacionam no centro de Lavras, MG

Dynamics of the convoy of vehicles parking at Lavras, MG city center

José Otaviano de OliveiraI; Júlio Sílvio de Sousa Bueno FilhoII

IProfessor EAFAJT. Mestrando em Estatística e Experimentação Agropecuária do Departamento de Ciências Exatas da Universidade Federal de Lavras/UFLA - Caixa Postal 3037 - 37200-000 - Lavras, MG. Bolsista CAPES. otaviooliver@hotmail.com

IIProfessor Adjunto do Departamento de Ciências Exatas da UFLA

RESUMO

Ensaios de captura-recaptura constituem técnica amostral comumente utilizada para estimar o tamanho e outros componentes da dinâmica de uma população. Neste artigo, o objetivo foi estimar a rotatividade (entrada e saída) da frota de veículos que estacionam no centro de Lavras-MG. O período estudado inclui a última semana de agosto até a segunda semana de setembro de 2002, que coincidiu com as férias semestrais. Foram utilizados modelos generalizados Poisson (log-lineares), segundo apresentado por Cormack (1989). Tais modelos requerem registros de cada indivíduo e sua história de captura anterior, compondo grupos mutuamente exclusivos com a mesma história de captura. As placas dos veículos foram utilizadas em sua marcação. Não foi detectada qualquer fonte de interação significativa entre as recapturas, o que indica uma população fechada geográfica e demograficamente. Estimativas pontuais para o tamanho da frota apresentaram valor próximo de 6.000 veículos; no entanto, os intervalos de confiança foram muito amplos. Sugere-se que modelos mais parcimoniosos (de população fechada) resultam em estimativas mais precisas do tamanho da frota.

Termos para indexação: Captura-recaptura. Modelo linear generalizado. Modelo de Cormack.

ABSTRACT

Capture-recapture techniques were used to estimate aspects of the populational dynamics of the convoy of vehicles parking at the Lavras-MG city center during the inter-term holiday period, from August 26 until September 24, 2002. We started from the open population model of Jolly-Seber. Generalized linear models were used (log-linear), according to Cormack (1989). Such models demand individual records and also its previous capture history. The vehicles plates were used as marks. No source of significative interaction was detected, and this suggests a geographically and demographically closed population. Point estimates values were next to the 6.000 vehicles, but the confidence regions were very broad. It was suggested that parsimonious models (closed population models) should be considered to get more accurate estimates.

Index terms: Capture-recapture. Generalized linear models. Cormack's models.

INTRODUÇÃO

Tradicionalmente, a técnica de captura-recaptura tem sido aplicada em problemas de estimação do tamanho populacional e de outros parâmetros de interesse em populações biológicas. Demógrafos e epidemiologistas, entre outros, têm adotado a técnica nas pesquisas em que o tamanho populacional é de difícil contagem. A técnica consiste em marcar os indivíduos e, em seguida, tomar amostras sucessivas (recapturas) detectando os marcados. Com os dados coletados, é possível compor a história de captura de cada grupo de indivíduos em relação a sua presença ou ausência em cada amostra. No presente estudo, a história de captura dos veículos é registrada, por meio de suas placas, em um padrão de classes mutuamente exclusivas. Considerou-se a abordagem de Cormack (1989), que utiliza os modelos log-lineares para estimar componentes da dinâmica populacional. Nessa abordagem, cada elemento é individualmente marcado com marcas únicas que não podem ser perdidas. As freqüências das classes assim constituídas são consideradas variáveis aleatórias com distribuição Poisson. É possível identificar por meio desses modelos se a população sofre interação ou pode ser considerada fechada (não há adições ou deleções de novos indivíduos).

A análise dos modelos lineares generalizados é discutida em extensão por McCullagh e Nelder (1989). No contexto da análise de experimentos de captura-recaptura, o primeiro a utilizar essa metodologia foi Feinberg (1972), que analisou os dados dispostos em uma tabela de contingência multidimensional. A modelagem dos parâmetros demográficos (tanto para população biológica aberta como para população fechada) foi desenvolvida por Cormack (1989) no contexto dos modelos generalizados. Pereira (1995) aplicou a mesma metodologia no estudo da dinâmica da população de jacarés na região do pantanal mato-grossense. Evans et al. (1994) apresentaram uma teoria geral para modelar os dados de captura-recaptura em população fechada.

A escolha entre tais modelos permite estimar parâmetros de rotatividade da frota de veículos que estacionam no centro de Lavras, que foi o objetivo principal quando da realização deste trabalho.

MATERIAL E MÉTODOS

A região de aplicação do ensaio denominada "Área Central" compreende a praça Dr. Augusto Silva, as três ruas paralelas até a praça Dona Josephina (Colégio Nossa Senhora de Lourdes) e suas adjacências, incluindo ainda a região do estacionamento do Hospital Vaz Monteiro. A aplicação da técnica de captura-recaptura foi efetuada da seguinte forma:

a) a primeira amostra efetuada no dia 26/08/02 a 30/08/2002 com 181 veículos (ocasião 1 - O1);

b) a segunda amostra efetuada entre 02/09/02 a 06/09/02 com 118 veículos (ocasião 2 - O2);

c) a terceira amostra efetuada no dia 16/09/02 a 20/09/02 com 164 veículos (ocasião 3 - O3);

d) a quarta amostra efetuada 24/09/02 com 156 veículos (ocasião 4 - O4).

Com essas amostras, foram obtidas as histórias de captura apresentadas na Tabela 1.

Parâmetros do modelo de regressão e seus correspondentes biológicos

Os coeficientes de regressão apresentam alguma combinação de fatores de interesse para estimar o tamanho da frota em estudo. Na Tabela 2 são apresentados os parâmetros correspondentes à dinâmica da frota e seus respectivos modelos a se-rem estudados em cada caso específico. Estes modelos são apresentados a seguir, considerando as mais diversas situações amostrais. Genericamente, os coeficientes de regressão têm correspondência direta com os parâmetros biológicos em estudo geral de populações abertas, de acordo com a Tabela 2.

As estimativas para o tamanho populacional, probabilidades de captura, sobrevivência para os períodos amostrais podem ser obtidas a partir do modelo completo e são descritas em detalhes por Cormack (1989), como se segue:

pi: probabilidade de captura de um indivíduo não marcado na i-ésima amostra,

i: probabilidade de um indivíduo sobreviver da iésima para ( i + 1 )-ésima amostra,

χi: probabilidade de que um indivíduo não seja visto após a i-ésima amostra,

1/ψi: probabilidade de que um animal vivo e não marcado na população no momento da (i + 1)-ésima amostra estava na população no momento da i-ésima amostra, este parâmetro refere-se à entrada de novos indivíduos, de forma permanente, dentro da área pesquisada, 1/λi: probabilidade de que um indivíduo vivo na população no momento da i-ésima amostra mas não observado em ocasiões subseqüentes, ainda esteja vivo na população no momento da (i + 1)-ésima amostra.

As demais estimativas podem ser obtidas diretamente dos valores estimados para as freqüências de captura:

Probabilidades de Sobrevivência

i;

Os parâmetros

i representam a fração de indivíduos que sobreviveram de uma ocasião de amostragem para a seguinte. Esses parâmetros não podem ser estimados na presença de migrações, mas apenas algumas combinações dessas estimativas (a menos que se use alguma restrição). Há, no entanto, delineamentos (e os respectivos modelos) específicos para estimar parâmetros de sobrevivência.

Número de Nascimentos: Bi = Ni(1-pi)iψi;

Por nascimento, entende-se a quantidade de entrada de novos indivíduos em um período amostral específico. Esse valor é diretamente proporcional ao parâmetro de entrada obtido diretamente do modelo de regressão. Nota-se que essa quantidade somente é estimável admitindo algumas restrições. É importante observar que esse modelo resulta em estimativas imprecisas de entradas e saídas temporárias.

Parâmetros de Entrada: λi = χi/[i(l-pi+l)χi+l];

As estimativas de λi representam as entradas de indivíduos de um período para o outro. Esses parâmetros somente são estimáveis com algumas restrições, já que existem mais parâmetros do que estatísticas observáveis.

As estimativas para o tamanho populacional, probabilidade de captura, sobrevivência e número de veículos novos para os períodos amostrais podem ser obtidas a partir do modelo completo. As demais estimativas podem ser obtidas diretamente dos valores estimados para as freqüências de captura. Na seção seguinte, é apresentada a conversão entre os parâmetros biológicos e os parâmetros do modelo de regressão.

Matriz do delineamento amostral

Seja X a matriz de variáveis indicadoras que representa a presença (0) e (1) ausência do indivíduo na amostra i:

Por exemplo, no presente estudo, têm-se quatro ocasiões de amostragem. O primeiro vetor coluna de X representa a constante do modelo de regressão proposto. Os demais vetores colunas representam as ocasiões de captura. As linhas de X representam as histórias de captura do indivíduo durante as ocasiões amostrais. Os demais parâmetros de interesse biológicos são obtidos a partir de operações nas colunas da matriz. Tem-se a = (25-1) observações, qualquer modelo retirado daí pode conter no máximo (25-1) parâmetros. É interessante escolher aqueles que tenham algum interesse do ponto de vista da dinâmica da população. Cormack (1989) apresentou um conjunto de parâmetros de interesse possível de serem obtidos a partir do modelo de regressão por conversão ("back transformation") ou interpretado diretamente dos parâmetros de regressão.

Para estudar os componentes de rotação dos carros, será apresentada a seguir a matriz do delineamento referente ao modelo mais completo, o qual possui todos os possíveis parâmetros de interesse. A primeira coluna da matriz refere-se à constante do modelo. As quatro seguintes representam os efeitos principais (referentes aos períodos de amostragem). A quinta e sexta colunas referem-se, respectivamente, às interações de segunda e terceira ordem, construídas como produtos diretos das columas 2 e 3 (β52) e das colunas 1, 2 e 3 (β63).

O produto do último pela penúltima e a última pela penúltima e antepenúltima representam as interações de saída. A última coluna representa a interação que é relativa puramente à detecção de algum comportamento em relação ao processo amostral ou armadilha. Isso é facilmente observado na matriz do modelo:

O vetor estimativas dos parâmetros β é obtido iterativamente por procedimento de aproximação numérica.

Alguns componentes de rotação podem ser retirados diretamente dos parâmetros do modelo de regressão. Os demais podem obtidos por combinações lineares dos parâmetros do modelo e convertidos para valores estimados dos parâmetros de interesse. Alguns deles não podem ser estimados, a não ser que alguma restrição seja efetuada.

As freqüências das classes dos grupos mutuamente exclusivos estimadas contêm tais combinações na escala logarítmica. Os estimadores

5 e 6 representam as interações de entrada e 7 e 8 , as de saída. 9 deverá captar algum comportamento em relação a "armadilha". Assim, a solução para a situação mais geral possível pode ser retirada diretamente da equação de regressão ou dos valores ajustados.

Ajuste do modelo linear generalizado a dados com distribuição Poisson

O algoritmo utilizado para ajustar os modelos generalizados são descritos por Nelder e Wedderburn (1972) e trata-se de um processo de estimação de quadrados mínimos reponderados iterativamente. A estimativa de ß para a (r + 1)-ésima iteração é

em que Wr é a matriz diagonal dos valores de wi para a r-ésimo iteração e y* é o vetor de pseudo-valores.

Para um determinado valor inicial βr atribuído, estima-se βr+1 no passo seguinte. O processo termina quando o módulo da diferença entre βr+1 e βr convergir para zero. O procedimento de ajuste foi efetuado usando o software livre R (IHAKA, e GENTLEMAN, 1996) usando o comando "glm( )", que além do ajuste, fornece a análise de "deviance" e ferramentas para diagnósticos como os resíduos da análise.

Critério para análise e seleção de modelos

Para testar a adequação do modelo linear generalizado, aplica-se na prática a diferença das "Scaled Deviance", que para a distribuição Poisson equivale a "Deviance" dos dados, confrontando esse resultado com o valor crítico da distribuição de qui-quadrado com (n-p) graus de liberdade a um nível de significância desejado. O modelo será rejeitado se o valor da deviance for superior ao valor de qui-quadrado crítico encontrado, caso contrário, o modelo é aceito (CORDEIRO e PAULA, 1989; DEMÉTRIO, 1993).

Análise de Deviance

Se existir uma seqüência de modelos originados de um modelo maior (modelos hierárquicos), esses podem ser testados contra o modelo com maior número de parâmetros. Dessa forma, a diferença entre as "deviances" dos dois representam um valor que tem distribuição aproximada χ2 (CORDEIRO e PAULA, 1989).

Sejam dois modelos M1 e M2 em que M1 possui p parâmetros e M2 , q parâmetros, sendo e p>q ; então: L(M1)-L(M2) (a diferença nas verossimilhanças pelos dois modelos) segue uma distribuição aproximada de qui-quadrado com p-q, graus de liberdade.

Modelos considerados

O conjunto de modelos apresentado a seguir foi escolhido de forma a representar todas as possíveis combinações entre fatores de interesse do ponto de vista da dinâmica da frota:

a) População aberta com modelo composto de entrada e saída e dependência M1:

Esse é o modelo mais completo do ponto de vista da parametrização proposta por Cormack (1989). Todas as combinações dos parâmetros de interesse são contempladas.

b) População aberta (somente entrada) - M2:

Nesse modelo, discute-se o efeito de entrada de novos veículos na Área central de estacionamento. Tais efeitos são estimados pela interação em ordem crescente entre os períodos amostrais.

c) População aberta (somente saída) M3:

Da mesma forma que os modelos anteriores, trocando apenas a ordem das interações, que são tomadas da última para a primeira, como apresentado no modelo acima, são sete parâmetros para descrever a dinâmica da rotação, para quinze observações de classes mutuamente exclusivas.

d) População aberta com modelo composto de entrada e saída - M4:

Com esse modelo, é possível estimar os parâmetros de entrada e saída. Esses parâmetros, quando significativos, apontam para uma população aberta em termos de rotação dos seus indivíduos de forma permanente. Se nenhum deles for significativo em nenhuma ordem, pode-se concluir que a população é fechada.

Um problema comum em estimação do tipo mínimos quadrados reponderados é a presença de estimativas fora do domínio admissível para os parâmetros. Tais casos foram tratados retirando-se os parâmetros correspondentes do modelo e, em seguida, efetuado um novo ajuste (CORMACK, 1989).

e) População fechada - M6:

Esse modelo é composto somente pelo os efeitos principais, como no exemplo descrito na seção anterior. O coeficiente da média geral representa a ligação entre tamanho populacional e as probabilidades de captura em cada período amostral.

f) População fechada com esforço constante nas amostras centrais - M7:

Por meio desse modelo, pode-se determinar se nas diferentes ocasiões o esforço de amostragem foi uniforme ou não. No caso abordado, considerou-se a possibilidade de que as duas amostras centrais possam ser estudadas como se fossem uma só.

g) População fechada com esforço constante nas três últimas amostras - M8:

h) População fechada com esforço constante nas três primeiras amostras - M9:

i) População fechada com esforço totalmente constante - M10:

No caso do modelo M10, a equação de regressão é composta apenas pelo intercepto e o coeficiente de regressão, sendo esse modelo considerado de esforço inteiramente constante.

RESULTADOS E DISCUSSÃO

Analisando o critério de deviance utilizado nas tabelas 3 e 4, nota-se que não há diferença estatística entre os modelos de população aberta e fechada. Foi selecionado o modelo de população fechada por ser mais parcimonioso e conter todos os parâmetros dentro do espaço paramétrico.

Os modelo encaixados (submodelos do modelo geral de população fechada) não são equivalentes ao modelo de esforço variável pelo teste de qui-quadrado. Portanto, o M6 (Mt de Schnabel) foi considerado o mais representativo para o conjunto de dados. No caso em estudo, não é possível aplicar modelos com quaisquer combinações de esforço constante de amostragem.

Verificou-se que os modelos de população aberta não diferem estatisticamente entre si, sendo o modelo M6, de população fechada, mais parcimonioso entre todos os apresentados, sendo aceito para representar o tamanho da frota.

As estimativas dos parâmetros obtidos mostram-se bem ajustadas, com baixos erros padrões e altamente significativas pelo teste de qui-quadrado. Interações de segunda ordem não foram significativas, mostrando que não há nenhum comportamento em relação ao método amostral ou entrada e saída significativos.

Os valores preditos e os valores observados, bem como intervalos de confiança para as predições, são apresentados na Tabela 6.

Tabela 5

CONCLUSÕES

a) O modelo que melhor se ajustou aos dados foi o de independência entre as ocasiões amostrais, mostrando que a população é fechada, não havendo entradas ou saídas significativas no período do estudo;

b) A melhor estimativa do número de veículos que estacionam no centro de Lavras-MG foi de 5840, com intervalo de confiança de 95 % de [4024; 8618] veículos.

(Recebido para publicação em 14 de abril de 2003 e aprovado em 18 de agosto de 2004)

  • CORDEIRO, G. M.; PAULA, G. A. Modelos de regressão para análise de dados univariados. In: COLÓQUIO BRASILEIRO DE MATEMÁTICA, 17., 1989, Rio de Janeiro. Anais... Rio de Janeiro: IMPA-CNPq, 1989.
  • CORMACK, R. M. Log-linear models for capture-recapture. Biometrics, Alexandria, n. 45, p. 395-413, 1989.
  • DEMÉTRIO, C. G. B. Modelos lineares generalizados na experimentação agronômica. In: SIMPÓSIO DE ESTATÍSTICA APLICADA À EXPERIMENTAÇÃO AGRONÔMICA, 5.; REUNIÃO ANUAL DA REGIÃO BRASILEIRA DA SOCIEDADE INTERNACIONAL DE BIOMETRIA, 38., 1993, Porto Alegre. Anais... Porto Alegre: [s.n.], 1993.
  • EVANS, M. A.; BONETT, D. G.; McDONALD, L. L. A general theory for modeling capture-recapture data from a closed population. Biometrics, Alexandria, n. 50, p. 396-405, 1994.
  • FEINBERG, S. E. The multiple recapture census for closed populations and incomplete 2k contingency tables. Biometrics, Alexandria, n. 59, p. 591-603, 1972.
  • IHAKA, R.; GENTLEMAN, R. R. A language for data analysis and grafics. Journal of computation and graphics statistics, Alexandria, v. 5, n. 3, p. 299-314, 1996.
  • McCULLAGH, P.; NELDER, J. A. Generalized linear models 2. ed. London: Chapman and Hall, 1989. 511 p.
  • NELDER, J. A.; WEDDERBURN, R. W. M. Generalized linear models. Journal of the Royal Statistical Society A, London, v. 135, n. 3, p. 370-384, 1972.
  • PEREIRA, J. E. Análise de experimento de captura-recaptura através de modelos log-lineares 1995. 106 f. Dissertação (Mestrado) - Escola Superior de Agricultura de Luiz de Queiroz, Piracicaba, 1995.

Datas de Publicação

  • Publicação nesta coleção
    29 Set 2010
  • Data do Fascículo
    Out 2004

Histórico

  • Aceito
    18 Ago 2004
  • Recebido
    14 Abr 2003
Editora da Universidade Federal de Lavras Editora da UFLA, Caixa Postal 3037 - 37200-900 - Lavras - MG - Brasil, Telefone: 35 3829-1115 - Lavras - MG - Brazil
E-mail: revista.ca.editora@ufla.br