Acessibilidade / Reportar erro

Um Exercício de Identificação Automática de Desatualizações na Representação de Edificações em Bases Cartográficas de Áreas Urbanas

An Exercise of Automatic Identification of Changes in Building's Representation in Cartographic Basis of Urban Areas

Resumos

Apresenta-se nesse artigo a aplicação de uma metodologia de processamento de imagens aerofotogramétricas, associadas a dados LIDAR, para detecção automática de desatualizações na representação das edificações, em planos de informação correspondentes, de bases cartográficas de grande escala de áreas urbanas. A técnica proposta, constitui-se de rotinas clássicas de processamento de imagens aplicadas a um grande número de pequenas imagens, recortes relacionadas aos limites de lotes residenciais urbanos, obtidos automaticamente de um mosaico ortorretificado. O processo foi totalmente implementado no curso do estudo, e integra-se de rotinas da clássica metodologia de processamento de imagens. A base de dados utilizada compõe-se de: (a) base cartográfica digital, com camadas de informações associadas aos limites dos lotes e à projeção das construções sobre o terreno; (b) mosaico aerofotogramétrico georreferenciado e ortorretificado e (c) nuvem de pontos laser scanner da área de estudo. O procedimento operacional consiste no recorte automático da área associada a cada lote na imagem-mosaico, a segmentação e classificação desse produto com suporte altimétrico em função da nuvem de pontos laser scanner e formação de geometrias prováveis a serem associadas às edificações existentes. Esses procedimentos são executados sem qualquer intervenção do usuário. Um protótipo do sistema foi implantado e testado numa base de dados cedida pela Secretaria de Patrimônio da União, do litoral do RS

Palavras-chave:
automação cartográfica; processamento digital de imagens; fotogrametria; LIDAR


This paper presents the results of a digital aerophotogrametric image processing and LIDAR data for automatic detection of outdated information layers corresponding to buildings in cartographic databases of large-scale urban areas. The proposed technique consists of classical image processing routines applied to a large number of small images. These small images are clippings to the limits of the urban lots, automatically obtained a orthoretificated mosaic. The database used consists of: (a) a digital cartographic database with information layers associated with the boundaries of lots and projection of buildings on the land; (b) a georeferenced and orthoretificated aerophotogrammetric mosaic and (c) a cloud of laser scanner points of the study area. The operational procedure consists of the automatic trimming of the area associated with each lot in the mosaic, followed by the segmentation and classification of this image with altimetry data support to the laser cloud points and followed by the formation of geometries probable to be associated with the existing buildings. These procedures are performed without any user intervention, by a program implemented in a structured language whose input files and output data are in standard formats. A prototype system was implemented and tested in a database courtesy of Federal Patrimony Bureau, in the coastline of the state of Rio Grande do Sul - Brazil.

Keywords:
automated cartography; digital photogrammetric image processing; LIDAR


1. Introdução

Segundo os dados divulgados pela Secção de Cartografia, Meteorologia e Aerolevantamentos do Ministério da Defesa, atualmente no Brasil, assim como na maioria dos países desenvolvidos, o maior volume de projetos de aerolevantamento executados é composto por aquisição de dados laser scanner e fotogramétricos, adjuntos e integrados, conforme mostra a Tabela 1. Ou seja, as empresas que operam no mercado têm hoje ajustadas condições econômicas e técnicas para ofertar aos usuários condições de contratar bases de dados de maior complexidade, a fim de registrar e representar os territórios administrados. Porém, não há informações concretas acerca do impacto na efetiva melhoria da qualidade da cartografia de grande escala do território nacional que essas informações trouxeram nos últimos anos.

Tabela 1:
Número de Projetos de aerolevantamento do território nacional registrados no Ministério da Defesa.

Por uma consulta direta a dez prefeituras que receberam dados integrados laser-fotogramétrico nos últimos dois anos, nos estados do Rio Grande do Sul e Santa Catarina, o Laboratório de Tecnologia da Geoinformação do Centro de Ciências Computacionais da FURG, determinou que somente uma declarou ter feito uso direto dos dados laser scanner. As demais não fizeram qualquer uso da nuvem de pontos LIDAR, cuja aquisição se deu apenas para a produção de ortofotocartas, ou seja, por opção de estratégia de processamento da própria empresa prestadora do serviço.

As principais justificativas para subutilização de tais dados nas instâncias contratantes são o desconhecimento do significado desses dados, o déficit na infraestrutura computacional, a indisponibilidade de softwares especialistas e a ausência de recursos humanos qualificados para tarefas que envolvam seu processamento.

O cenário descrito demonstra a importância do desenvolvimento de estratégias como a aqui apresentadas, para investimento em sistemas computacionais capazes de assistir o processo de atualização cartográfica de grande escala, em ambientes urbanos, sob base tecnológica que envolve a aerofotogrametria digital e elementos clássicos do processamento e interpretação de imagens digitais, por mais que tais sistemas constituam hoje tecnologia dita consolidada.

Considere-se a hipótese inicial de que se tenha disponível uma base cartográfica da área urbana de uma cidade e que ela esteja em formato digital, vetorial, estruturada em camadas temáticas editáveis, com base de atributos vinculada e georreferenciada a um sistema geodésico reconhecido, permitindo seu reajustamento ou redução a qualquer outro referencial. Um exemplo de uma base cartográfica com essa qualificação está apresentado na Figura 1, de uma parte do centro do município de Torres, no litoral norte do Rio Grande do Sul, onde as parcelas urbanas e suas edificações estão representadas, planimetricamente, referenciadas ao Datum SAD69, realização 1996.

Figura 1:
Base cartográfica cadastral do Município de Torres - RS

(Cortesia: Prefeitura Munic. de Torres).

Considere-se a hipótese de um aerolevantamento atualizado da mesma área, cujo produto final esteja composto de um banco de imagens fotogramétricas aerotrianguladas, de um mosaico ortorretificado dessas imagens, referenciado a um sistema geodésico específico, e de uma nuvem de pontos laser scanner, reduzidas ao referencial geoidal local (datum vertical oficial). A Figura 2, apresenta tais produtos, em algumas de suas possíveis versões, produzidas por intermédio de um sistema de tratamento de imagens e geoprocessamento.

Figura 2:
(a) Aerofotografia ortorretificada de uma parte do centro de Torres-RS. (b) Versão shaded relief do modelo número digital de elevações, obtido por reamostragem dos dados laser scanner de área selecionada em (a). (c) Vista perspectiva da massa de dados laser nessa mesma secção. (d) Detalhe da sobreposição dos pontos laser scanner sobre a imagem

Como se observa na Figura 2, o ajustamento dos dados promovido pela redução ao mesmo referencial horizontal, SIRGAS 2000, é altamente preciso. A nuvem de pontos laser possui referência ao Datum Vertical Brasileiro, o Marégrafo de Imbituba, e essa redução, como será visto na sequência, foi obtida através de um modelo empírico da ondulação geoidal para a região.

O processo de atualização de alguns dos planos dessa base cartográfica por meio desse conjunto de dados pode ser realizado manualmente, segundo métodos estabelecidos ao longo de anos de prática, por comparação simples das informações pictóricas, com uso de ferramentas de sobreposição em ambiente gráfico interativo como o dos sistemas fotogramétricos digitais. É, então, lógico propor a construção de uma ferramenta computacional que efetue tal comparação e determine automaticamente onde as alterações ocorreram, e isso tem sido feito na última década. Porém, esse é ainda um tema de pesquisa em curso e representa um interessante desafio no campo da Interpretação Automática de Imagens, como pode-se perceber em diversas referências, tais como Tao et all (2013Tao, Chao, Tan, Yihua e Zou Zheng-rong. Gaussian mixture models (GMM) Hierarchical Method of Urban Building Extraction Inspired by Human Perception. Photogrammetric Engineering & Remote Sensing, Number 12, pp. 1109-1119. Dezembro, 2013.), Mayer et all (1999Mayer, Helmut. Automatic Object Extraction from Aerial Imagery-A Survey Focusing on Buildings. Computer Vision and Image Understanding, Computer Vision and Image Understanding,Volume 74, Issue 2, Pag. 138-149. Maio 1999.) e McKeown et all (1989)McKeown Jr., D.M.; Harvey, Wilson A. e Wixson, Lamert E. Automating Knowledge Acquisition for Aerial Image Interpretation. Department of Computer Science, Carnegie-Mellon University. Computer Vision, Graphics, and Image Processing 46, 37-81, 1989., onde são exploradas soluções para problemas similares em contextos genéricos.

Em função da rigidez geométrica do modelo fotogramétrico, da precisão e resolução da nuvem de pontos laser scanner, e partindo do pressuposto que a metodologia objetiva somente indicar onde alterações significativas são observadas, nos limites físicos de cada lote, o desafio torna-se bem menos pretensioso e se pode prever bons resultados, como os descritos aqui, especialmente em áreas cujas taxas de ocupação são moderadas, ou seja, onde não existam prédios altos, e/ou ambientes urbanos de alta densidade. Esse é um exercício de validação de uma implementação cujo objetivo é, futuramente, avançar sobre elementos mais complexos, mas no momento presente deve mostrar-se suficiente em tais cenários controlados.

Seguem em três subtítulos o desenvolvimento desse estudo: primeiramente, um modelo teórico de interpretação de imagens ampara a metodologia proposta; em seguida, a própria metodologia é detalhada, com ênfase no tratamento preliminar das bases de dados; no ajuste geodésico aplicado para permitir a comparação espacialmente coerente entre dados coletados sob processos independentes; no processamento digital das imagens; e, finalmente, a metodologia é aplicada em uma área piloto, onde 139 lotes foram automaticamente extraídos da base cartográfica. As coordenadas dos vértices desses lotes foram utilizadas como parâmetros para a rotina de recorte do ortofotomosaico. Em seguida, os recortes foram segmentados e classificados de forma a permitirem a aplicação de uma métrica de similaridade sobre as duas representações gráficas dos elementos da área urbana. Como resultado, os estudos mostraram que a métrica de similaridade adotada permitiu destacar as construções presentes na imagem aerofotogramétrica que não se encontravam na base cartográfica.

2. Fundamentação

O modelo de interpretação de imagens que se propõe usar é baseado naquele apresentado por Kanade (1980Kanade, takeo. Survey - Region Segmentation: Signal vs Semantics. Computer Graphics and Image Processing 13, 279-297. 1980.), e que vêm sendo utilizado em diversas soluções do mesmo gênero, em outras temáticas e outras escalas, e possui muitos outros derivados para aplicações diversas da visão computacional. A idéia básica é a composição de um modelo de objetos a partir de um ciclo de interpretação de imagens, ou seja, do fluxo de informações compartilhado entre o domínio real (cena) e o domínio de representação (imagem). As imagens brutas originais estão num nível de informação denominado sinal e as construções, por exemplo, estão num nível semântico, uma vez reconhecidas e categorizadas. Entre os dois, o nível de informação físico representa uma área de interface, concretizada, no caso em questão, do resultado da segmentação da imagem original e da classificação desses segmentos em classes pré-definidas, conforme diagrama da Figura 3.

A alta complexidade do modelo pode ser reduzida por diversas estratégias. Por exemplo, pela prévia definição das classes de objetos provavelmente existentes na cena, pela sua precisa descrição sob diversas métricas espaciais, espectrais e topológicas ou, ainda, pela redução controlada da complexidade da imagem.

É sob esse referencial teórico que foram desenvolvidas as ações metodológicas apresentadas na sequência, cujo resultado é um protótipo de um sistema para assistência à atualização da cartografia de grande escala, especialmente em relação aos objetos construídos sobre o terreno, e que a princípio presume-se interativo, na medida em que apenas indica os lotes onde há diferenças significativas entre os objetos descritos na base cartográfica (em nível de informação semântico) e aqueles segmentados (em nível de informação físico).

Figura 3:
O modelo Kanade (1980Joy, Kenneth I., breshenham's algorithm. On-Line Computer Graphics Notes, Department of Computer Science University of California. Consultado em http://graphics.idav.ucdavis.edu/education/GraphicsNotes/Bresenhams-Algorithm.pdf, 2014.
http://graphics.idav.ucdavis.edu/educati...
) para análise automática de imagens.

3. Metodologia de Processamento

Na solução aqui proposta, é utilizada uma estratégia baseada na redução da complexidade da imagem. Essa redução é obtida mediante uma simples restrição do domínio espacial, ou seja, mediante o recorte da ortoimagem em múltiplas imagens, cada qual correspondente a área de um lote urbano. Para cada uma dessas imagens singulares, serão aplicadas as rotinas de interpretação de imagens, como será na sequência descrito. É importante notar que os recortes serão diretamente orientados pela base cartográfica pré-existente e em processo de atualização. A metodologia de processamento e o fluxo de informações estão sumarizados no diagrama da Figura 4.

O primeiro elemento é um controlador de fluxo de dados partir do qual são executadas todas as rotinas sobre todos os lotes presentes na base cartográfica. As estruturas de dados lidas pelas rotinas estão em três arquivos: a imagem ortorretificada, a nuvem de pontos laser scanner e o descritivo da base cartográfica. Pelas duas primeiras rotinas operam-se, respectivamente, o recorte do ortofotomosaico, gerando uma imagem precisa dos lotes em seus limites, e as amostras da nuvem de pontos laser scanner nos mesmos limites do lote, e em uma região adjunta ao lote, na via pública, para definir a altitude de referência em seu leito.

Segue a aplicação de um filtro suavizador na imagem, para reduzir a variância e aumentar a homogeneidade dos pixels em áreas de potenciais objetos, e a segmentação em si, cujo resultado são conjuntos de pixels conectados em regiões, devidamente rotulados como provável edificação ou não. Para tal decisão os pontos laser scanner associados a cada segmento são fundamentais. Em paralelo a essas rotinas acima descritas, um procedimento clássico de computação gráfica provê uma imagem sintética simples, binária, demarcando as construções sobre o lote em análise.

A última rotina aplica uma métrica de similaridade entre o produto da segmentação, classificado, e a imagem sintetizada com os dados da base cartográfica. Uma tabela final indica os lotes com informações corretas e aqueles que devem seguir para atualização.

Figura 4:
Fluxograma de operações da técnica proposta.

4. Base de Dados e seu Pré-processamento

Para o teste da metodologia dispõem-se de uma base de dados vetorial organizada em dois arquivos no formato SHP (shape files da ESRI(c)), um para os limites dos lotes, outro para o contorno das construções. As primitivas geométricas são polígonos fechados. Os atributos são aqueles comuns aos cadastros urbanos, entre eles, para os lotes, o geocódigo, o endereço, a área total, a medida linear de fachada e de fundos do terreno e alguns parâmetros urbanísticos; para as construções, a área total, o número de pavimentos e alguns parâmetros para avaliação da classe da edificação. Dessa base de dados é extraída uma tabela com as coordenadas dos vértices dos polígonos delimitadores dos lotes (utilizado nos recortes da imagem original e amostragens da nuvem de pontos laser) e das construções e o número de pavimentos para estimativa da altura da edificação. A Figura 5 ilustra esse procedimento e apresenta as tabelas de atributos geradas.

Figura 5:
A relação entre a base gráfica e de atributos utilizada no processamento.

A Figura 6 mostra um exemplo de imagens recortadas. Os limites dos recortes são os segmentos de reta que ligam os vértices listados na estrutura de dados. O algoritmo para construção desses segmentos a partir dos pixels-vértice, no espaço imagem, é o de Bressenhan (Joy, 2014Joy, Kenneth I., breshenham's algorithm. On-Line Computer Graphics Notes, Department of Computer Science University of California. Consultado em http://graphics.idav.ucdavis.edu/education/GraphicsNotes/Bresenhams-Algorithm.pdf, 2014.
http://graphics.idav.ucdavis.edu/educati...
).

Figura 6:
Uma secção da imagem original ortorretificada e três amostras de lotes extraídos automaticamente, sob orientação geométrica da base cartográfica.

A classificação de um objeto, identificado pela segmentação da imagem, como edificação ou não, se dá, basicamente, pela comparação de sua cota altimétrica com a cota do solo, ambas medidas por amostragem da nuvem de pontos laser scanner. O valor da cota do solo, portanto, é fundamental e, para sua estimativa, uma região correspondente ao leito da rua em frente ao lote em processamento é determinada automática e iterativamente.

A região de coleta é definida por um quadrilátero, como mostra a Figura 7. Inicialmente, são selecionados os dois primeiros pontos, A (xa,ya) e B (xb,yb), dos polígonos que delimitam os lotes (os lotes são sempre descritos com vértices seguindo uma ordem pré-fixada, sendo o primeiro e o segundo necessariamente da fachada e os demais, em sequência, seguindo sentido horário).

Figura 7:
Técnica de definição do polígono que define a área de interesse para obtenção de amostras de altitude à frente do lote.

Dessa informação básica são obtidos os vértices da área de interesse para coleta de amostras da nuvem de pontos laser scanner (na Figura 7, o polígono CDEF):

Onde, os valores 2,5 e 7,5 correspondem às distâncias arbitradas em metros para que a área esteja provavelmente no leito da via, e α é o coeficiente angular das retas suportes CD e EF, perpendiculares a AB, donde:

A nuvem de pontos laser scanner utilizada para o processamento é formada apenas pelas colunas de coordenadas planimétricas e pela altitude do último pulso, filtrados de medidas originais, dispostas em linhas de vôo. As altitudes estimadas nessas tabelas são obtidas das medidas elipsoidais originais, reduzidas ao geóide por um modelo empírico de alta resolução e precisão estimada melhor que o decímetro, obtida segundo técnica detalhada por Oliveira et all (2014)Oliveira, K.C.L.; Thomaz, H.R.; Monico, J.F.G. Modelo Geoidal local para a região de Presidente Prudente. Universidade Estadual Paulista. Faculdade de Ciências e Tecnologia. Departamento de Cartografia. Disponível em: Disponível em: http://www.cartografia.org.br/xixcbccd/artigos/c2/CII-54/MODELO.pdf . Acesso em: 2014.
http://www.cartografia.org.br/xixcbccd/a...
, conforme mostra o cartograma da Figura 8. Esse modelo foi desenvolvido conforme descrito em Gonçalves e Mitishita (2015Gonçalves, G.A. e Mitishita, E.A. Uso de Dados LIDAR e Fotogrametria Digital para Produção de Cartas de Vulnerabilidade à Intrusão de Águas Marinhas. Anais XVII Simpósio Brasileiro de Sensoriamento Remoto - SBSR, João Pessoa-PB, Brasil, 25 a 29 de abril de 2015, INPE.).

Figura 8
: Mapa das estimativas da ondulação geoidal

Figura 9:
Uma secção da ortofotoimagem sobreposta por uma parcela do DTM.

A base de imagens é composta por um conjunto de aerofotos digitais, ortorretificadas após o resultado do processo de aerotriangulação e ajustadas em bloco. Tanto o controle fotogramétrico, conforme sugerido por de Lara e Mitishita (2006), quanto o modelo numérico digital do terreno utilizado na ortorretificação das imagens, foram baseados em uma reamostragem regular à taxa de 20 cm da nuvem de pontos laser scanner. A Figura 9 ilustra a qualidade do ajuste obtido, sobrepondo um modelo numérico de elevações, processado dos mesmos dados laser, à imagem ortorretificada.

As imagens, uma vez recortadas nos limites dos lotes (Figura 10.a), são segmentadas por rotina automática baseada na técnica Mean Shift, conforme Comaniciu e Meer (2002Comaniciu, D.; Meer, P. Mean Shift: A Robust Approach Toward Feature Space Analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002. v. 24, n. 5.), Gu et all (2001Gu, Irene Y.H.; Gui, Vasile. Color Image Segmentation using Adaptive mean Shift Filters. Proceedings of IEEE International Conference Image Processing, ICIP 2001.), Trémeua (2000Trémeau, Alain e Colantoni, Philippe. Regions Adjacency Graph Applied To Color Image Segmentation. IEEE Transactions on Image Processing, 2000.), adequada às imagens coloridas (Figura 10.b). Para resultados mais consistentes, as imagens sofreram transformação do espaço de cores de RGB original, para Lab, conforme CIE (1978)C.I.E. (1978) Recommendations on uniform color spaces, color difference equations, psychometric color terms. Supplement No.2 to CIE publication No.15 (E.-1.3.1) 1971/(TC-1.3.).. Nesse espaço de cores convencional a técnica de segmentação torna-se menos sensível as diferenças de tons nas cores de um mesmo objeto, diferença essa produzidas pelo efeito de sombreamento por obstáculos vizinhos e por variações na orientação do ângulo de incidência da radiação solar sobre os objetos. Após o resultado da segmentação, os elementos são ainda agrupados por rotina de avaliação de pertinência de segmentos menores, onde o critério para agrupamento é a distância espectral entre as médias das componentes de cores de cada um dos segmentos envolvidos no teste.

Concluído o processo de segmentação, cada segmento é classificado como pertencendo a uma classe edificação ou não edificação, e uma imagem sintética desse resultado é gerada (Figura 10.c). A fim de suprimir pequenas ilhas internas e suavizar os contornos dos objetos segmentados aplica-se uma operação morfológica de fechamento com elemento estruturante de dimensões 5x5 (Figura 10.d), como sugerido por Facon (1996Facon, Jacques. Morfologia Matemática: Teoria e Exemplos. Editora Universitária Champagnat. PUC-PR. Curitiba, 1996.). Num processo em paralelo é criada uma imagem sintética binária a partir da representação vetorial do lote na base cartográfica (Figura 10.e). Nesse processo utiliza-se uma reamostragem espacial com resolução idêntica a da imagem aerofotográfica, ou seja, 0,125 m por pixel (Figura 10.f).

Essas duas imagens são então comparadas para estimativa de similaridade. No modelo implementado, as imagens binárias são submetidas a uma operação booleana XOR (ou exclusivo). Se pixels na mesma posição apresentam valores iguais, retorna nulo. Se, no entanto, na mesma posição, apresentam valores diferentes, retorna como valor a unidade (Figura 10.g).

A aplicação desse processo demonstrou que pequenas diferenças na posição e orientação das feições podem resultar no aparecimento de pixels assinalados como diferença no contorno dos objetos. Para mitigar esse efeito faz-se também uso de um filtro morfológico, inverso ao anteriormente aplicado, denominado abertura, com elemento estruturante 3x3, que eliminará resultados menos significativos, tais como esse citado (Figura 10.f). Por fim, um teste de aceitabilidade é aplicado para definição da condição do lote: atualizado ou não. Esse procedimento encontra-se melhor detalhado em Gonçalves (2007).

Figura 10:
Súmula do processamento das imagens, do recorte a avaliação da diferença entre a aerofotografia e a representação em base cartográfica.

5. Resultados e Discussão

Uma base de dados precisa e qualificada foi selecionada para execução de um experimento de interpretação automática de imagens, com objetivo de reconhecer alterações num plano de informações de uma base cartográfica de grande escala, no qual estão representadas as edificações sobre o terreno. O estudo de caso recaiu sobre a área urbana central do município de Torres (RS), da qual se possuía uma base cartográfica de uma época T e um levantamentos aerofotogramétrico e laser scanner de uma época T+6 anos. O objetivo do experimento montado trata fundamentalmente da avaliação da eficiência do sistema em determinar se um lote na base cartográfica está ou não com os objetos sobre ele edificados atualizados.

As rotinas foram implantadas individualmente na linguagem de alto nível do ambiente operacional do MatLab e compiladas. Um script chama cada uma a seu tempo, submetendo a base de dados de lotes aos procedimentos, sequencialmente, até a obtenção de uma métrica de similaridade final para cada lote. Por fim, resta a tomada de decisão, comparando a métrica de similaridade a um limite arbitrado como 5% do total de pixels marcados como construções na imagem sintética, composta a partir dos dados da base cartográfica.

A área urbana em teste está apresentada na Figura 11. Nessa secção existem 139 lotes identificados, cuja área está totalmente contida no mosaico fotogramétrico e na nuvem de pontos laser.

Figura 11:
Área teste, extraída da área urbana da cidade de Torres - RS.

A Figura 12 apresenta cinco cenários retirados desse conjunto e alguns dos seus estágios intermediários obtidos durante o processamento.

As imagens da primeira coluna são os recortes efetuados automaticamente pelos limites dos lotes constantes na base cartográfica, apresentados na última coluna. A segunda coluna é o resultado da segmentação pela técnica mean shift, agregados os segmentos menores pelos seus vizinhos segundo limite de tolerância já explicitado. A terceira coluna é resultado da classificação para identificação das construções. Esse resultado é obtido após a intersecção dos segmentos com a nuvem de pontos laser scanner, pelo qual são vinculadas cotas altimétricas a cada segmento. Aqueles segmentos cuja cota está pelo menos 3 metros acima do nível da rua, também estimado pelos dados laser scanner conforme descrito na metodologia, são identificados como provável construção. Caso ocorram segmentos isolados, marcados como construções cuja área em medidas do espaço objeto seja menor do que 3 m2, esses são desprezados no resultado final.

A penúltima coluna é a imagem sintetizada a partir dos registros cartográficos do lote, com suas construções. A coluna intermediária, marcada como "Resultado do teste de similaridade", apresenta os valores resultantes da comparação das duas imagens binárias, onde, respectivamente: DFP é a diferença entre as duas imagens expressa por número de pixels, TOT é o total de pixels identificados como construção na imagem resultante da base cartográfica, DF% é a diferença percentual obtida pela operação DFP/TOT, quando essa diferença é possível. Caso TOT seja igual a zero, qualquer valor de DFP resulta no lote sendo marcado para atualização. RES é o indicador final da condição do lote, onde "ok" significa que os dados da base são compatíveis com os classificados na imagem e "não ok" significa que esse lote exige sua atualização, ou seja, a edição dos vetores contidos na base cartográfica.

Figura 12:
Análise de cinco cenários amostrais encontrados na área de interesse e em processamento.

A tolerância para definição da condição "ok" ou "não ok" foi arbitrada em DF% > 5%. Observe-se que nos casos 1 e 4 ocorre uma diferença devida a imprecisão da segmentação, porém, com pequeno número de pixels resultantes da comparação entre as duas imagens, o que permite a correta classificação para esse lote. Os casos 2 e 3 são os mais simples, pois não havia nenhuma construção na base cartográfica original. No caso 3, a segmentação resultou em alguns pequenos locais inicialmente classificados como construção, pois a vegetação impõe o registro de pontos na nuvem de pontos laser scanner com mais de 3 metros de elevação. Porém, o filtro de área mínima exclui esses falsos negativos. Se as áreas desses segmentos resultassem maiores que a mínima, o lote seria encaminhado para edição, indicando uma falha no processamento. Porém, numa fase de edição esse erro seria corrigido.

O sistema diagnosticou 111 lotes "em dia" e 28 como tendo sofrido alguma alteração em relação ao expresso na base cartográfica, como mostrado na Figura 13.

O mesmo conjunto de lotes foi sujeito ao julgamento de um fotointérprete e o resultado comparado entre os diagnósticos automático e manual indicaram absoluta concordância em relação aos 111 lotes em dia, porém, verificou-se que 17 dos 28 diagnósticos automáticos de alterações eram falsos positivos.

Os erros de detecção apresentados possuem, evidentemente, impactos em relação ao objetivo da metodologia proposta. Porém, esses falsos positivos não representam necessariamente perdas definitivas para o processo de atualização cartográfica, uma vez que o resultado da classificação automática encaminha os lotes para edição futura. Fato é que produz apenas um aumento da massa de lotes a ser editado manualmente. Erros de não detecção de alterações representariam uma falha no processo e esses lotes restariam desatualizados na base final, no entanto, no conjunto de lotes analisados, esse tipo de erro não ocorreu.

Figura 13:
Resultado da aplicação da técnica na área teste. 139 lotes analisados, 122 diagnósticos corretos.

Os fatores mais complexos relacionados a essas falhas no algoritmo proposto estão diretamente vinculadas à erros de segmentação, em relação aos objetos em comparação, e podem ser listados como:

- presença de vegetação densa de grande porte na vizinhança das edificações;

- interferência entre prédios vizinhos;

- sombras produzidas por elevações vizinhas sobre os telhados.

6. Conclusões

A idéia de integrar múltiplas técnicas de processamento de imagens digitais à metodologia autônoma de avaliação de bases cadastrais vem se constituindo um dos principais componentes no aumento do potencial dessa tecnologia para manutenção das informações sobre áreas urbanizadas. No momento em que obter respostas rápidas ao avanço acelerado e contínuo das ocupações urbanas é uma necessidade constante das administrações territoriais, técnicas como a aqui proposta mostram-se atrativas e importantes. Possuem ainda, relação íntima com a redução dos custos da atividade de atualização cartográfica, em função da redução do tempo de processamento de grandes blocos de imagens, especialmente em relação a fotointerpretação e edição manuais.

A metodologia proposta vale-se de imagens aerofotogramétricas digitais adquiridas simultaneamente (ou quase) à nuvem de pontos laser scanner. Esses dados são fundamentais para obtenção de boas ortoimagens e alimentam também o algoritmo de segmentação e de classificação automática de objetos nas imagens. É ainda crítica a presença de uma base cartográfica cadastral composta segundo técnicas estruturadas e de alta precisão posicional, ou seja, da pré-existência de uma base cadastral vetorial qualificada.

Um passo fundamental para êxito da ferramenta indicada, e, talvez, a maior originalidade do processo aqui descrito, é o recorte automático das imagens ortorretificadas nos limites físicos dos lotes presentes na base cartográfica. Isso produz um grande número de pequenas imagens, cujo processamento é rápido e eficiente, pois reduz-se consideravelmente a complexidade do cenário, quando comparado ao tecido urbano como um todo. Ainda, esse procedimento é indicador da possibilidade de processamento paralelo por sistemas computacionais de alto desempenho, com perspectivas de redução ainda maior no tempo computacional.

Um teste da metodologia, integralmente implantada no ambiente gráfico interativo do software científico MatLab(c) resultou em uma taxa de acerto de 87,7% do total de lotes submetidos ao processamento. Salienta-se, no entanto, que tal resultado foi obtido em uma área urbana de fisiografia bastante favorável, com prédios em sua grande parte isolados, em terrenos regulares de grande área, e com geometrias euclidianas, ou seja, sugerindo volumes arquitetonicamente simples.

Áreas onde objetos mais complexos, sujeitos a interferências nos limites de divisão entre lotes, com taxas de arborização mais expressivas e com índices de ocupação maiores tendem a produzir mais erros de classificação e nuvens de pontos laser scanner mais complexas. Esses fatores podem reduzir significativamente os resultados aqui apresentados e exigiriam tratamentos específicos para manutenção de desempenho.

Entre os itens que se mostram mais promissores para o tratamento dessas limitações está no reconhecimento automático de copas de árvores em espaços urbanos, associando a informação pictórica da imagem fotogramétrica e os perfis laser scanner aerotransportados de alta densidade

AGRADECIMENTOS

Agradecemos à Secretaria de Patrimônio da União e à Prefeitura Municipal de Torres no Estado do Rio Grande do Sul a disponibilização de dados que permitiram a realização dos experimentos aqui apresentados. Ainda, à CAPES, pelo incentivo promovido no período do doutoramento, junto ao Programa de Pós-Graduação em Ciências Geodésicas na Universidade Federal do Paraná.

REFERÊNCIAS BIBLIOGRÁFICAS

  • SECMA, Seção de Cartografia, Meteorologia e Aerolevantamento do Ministério da Defesa. Consultado em http://www.defesa.gov.br/cartografia-e-aerolevantamento-claten, 2015.
    » http://www.defesa.gov.br/cartografia-e-aerolevantamento-claten
  • Kanade, takeo. Survey - Region Segmentation: Signal vs Semantics. Computer Graphics and Image Processing 13, 279-297. 1980.
  • Joy, Kenneth I., breshenham's algorithm. On-Line Computer Graphics Notes, Department of Computer Science University of California. Consultado em http://graphics.idav.ucdavis.edu/education/GraphicsNotes/Bresenhams-Algorithm.pdf, 2014.
    » http://graphics.idav.ucdavis.edu/education/GraphicsNotes/Bresenhams-Algorithm.pdf
  • Gonçalves, G.A. e Mitishita, E.A. Uso de Dados LIDAR e Fotogrametria Digital para Produção de Cartas de Vulnerabilidade à Intrusão de Águas Marinhas. Anais XVII Simpósio Brasileiro de Sensoriamento Remoto - SBSR, João Pessoa-PB, Brasil, 25 a 29 de abril de 2015, INPE.
  • Oliveira, K.C.L.; Thomaz, H.R.; Monico, J.F.G. Modelo Geoidal local para a região de Presidente Prudente. Universidade Estadual Paulista. Faculdade de Ciências e Tecnologia. Departamento de Cartografia. Disponível em: Disponível em: http://www.cartografia.org.br/xixcbccd/artigos/c2/CII-54/MODELO.pdf . Acesso em: 2014.
    » http://www.cartografia.org.br/xixcbccd/artigos/c2/CII-54/MODELO.pdf
  • Gu, Irene Y.H.; Gui, Vasile. Color Image Segmentation using Adaptive mean Shift Filters. Proceedings of IEEE International Conference Image Processing, ICIP 2001.
  • Trémeau, Alain e Colantoni, Philippe. Regions Adjacency Graph Applied To Color Image Segmentation. IEEE Transactions on Image Processing, 2000.
  • Comaniciu, D.; Meer, P. Mean Shift: A Robust Approach Toward Feature Space Analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002. v. 24, n. 5.
  • C.I.E. (1978) Recommendations on uniform color spaces, color difference equations, psychometric color terms. Supplement No.2 to CIE publication No.15 (E.-1.3.1) 1971/(TC-1.3.).
  • Facon, Jacques. Morfologia Matemática: Teoria e Exemplos. Editora Universitária Champagnat. PUC-PR. Curitiba, 1996.
  • Tao, Chao, Tan, Yihua e Zou Zheng-rong. Gaussian mixture models (GMM) Hierarchical Method of Urban Building Extraction Inspired by Human Perception. Photogrammetric Engineering & Remote Sensing, Number 12, pp. 1109-1119. Dezembro, 2013.
  • Mayer, Helmut. Automatic Object Extraction from Aerial Imagery-A Survey Focusing on Buildings. Computer Vision and Image Understanding, Computer Vision and Image Understanding,Volume 74, Issue 2, Pag. 138-149. Maio 1999.
  • McKeown Jr., D.M.; Harvey, Wilson A. e Wixson, Lamert E. Automating Knowledge Acquisition for Aerial Image Interpretation. Department of Computer Science, Carnegie-Mellon University. Computer Vision, Graphics, and Image Processing 46, 37-81, 1989.

Datas de Publicação

  • Publicação nesta coleção
    Set 2016

Histórico

  • Recebido
    Fev 2016
  • Aceito
    Mar 2016
Universidade Federal do Paraná Centro Politécnico, Jardim das Américas, 81531-990 Curitiba - Paraná - Brasil, Tel./Fax: (55 41) 3361-3637 - Curitiba - PR - Brazil
E-mail: bcg_editor@ufpr.br