Modelos Probabilísticos Matriciais para Dados de Sensoriamento Remoto

Dr. Jodavid Ferreira

PPGE | Estatística | UFPE

Estrutura da Apresentação




  1. Imagem de Sensoriamento Remoto


  1. Dados PolSAR


  1. Modelagem de dados PolSAR


  1. Resultados e Conclusões

Introdução


  • RADAR é um acrônimo de Radio Detection and Ranging

  • Ele é baseado nos princípios de propagação eletromagnética, em que uma onda eletromagnética é emitida por uma fonte e é retroespalhada para o radar

  • Uma imagem de radar é o resultado de uma interação entre a energia emitida pelo radar e o objeto sob estudo, e a aparência da imagem é influenciada pela forma e a textura do alvo;


Geometria de uma imagem de RADAR.

Níveis de textura de acordo com o sinal retornado.

Introdução


  • Radar de Abertura Sintética (Synthetic Aperture Radar - SAR) geralmente são estão acoplado a uma plataforma que transmite micro-ondas ao longo de sua rota planejada em direção a um cenário geográfico;

  • Pulsos são emitidos em direção ao cenário e o radar recebe os sinais de retorno que são processados para formar uma imagem, estes podem ser na polarização circular ou linear.

  • Quando apenas um par de direções é usado, as imagens geradas são chamadas de SAR monopolarizadas e, quando várias direções são usadas, o processo é chamado de PolSAR (SAR Polarimétrico);

Introdução



Vantagens

  • Images SAR podem ser obtidas de qualquer lugar (terra, mar, ar);
  • a qualquer momento (dia ou noite);
  • em quase todas as condições climáticas (nuvens, chuva);
  • produzem imagens de alta resolução (alta largura de banda) das superfícies estudadas;



Desvantagens

  • custo elevado para aquisição e manutenção dos satélites e radares;
  • as imagens são afetadas por um ruído chamado speckle, que cria uma aparência granulada nas imagens, dificultando a interpretação e análise;

Introdução



Speckle em imagem SAR.

Dados Polarimétricos multi-look



  • Cada entrada de uma image PolSAR é associada com os elementos da seguinte matriz:

\[ \mathbf{S}=\left( \begin{array}{cc} S_{hh} & S_{hv} \\ S_{vh} & S_{vv} \end{array} \right) \label{matrizpolar} \]

em que \(S_{hh}\), \(S_{hv}\), \(S_{vh}\) e \(S_{vv}\) são os coeficientes de espalhamento complexos do alvo para os respectivos canais de polarização, e os subscritos \(h\) e \(v\) representam a polarização horizontal e vertical, respectivamente, e,

\[ S_{rs} = A_{rs} e^{i \phi_{rs}} = \mathrm{Re}(S_{rs}) + i \mathrm{Im}(S_{rs}) \]

em que \(\mathrm{Re}(S_{rs})\) e \(\mathrm{Im}(S_{rs})\) são as partes real e imaginária do coeficiente de espalhamento, respectivamente, e \(i\) é a unidade imaginária, \(A_{rs}\) é a amplitude do coeficiente de espalhamento e \(\phi_{rs}\) é a fase do coeficiente de espalhamento, para \(r,s \in \{h,v\}\).

Dados Polarimétricos multi-look



  • Na prática, as polarizações cruzadas são muito semelhantes; ou seja, \(S_{hv} \approx S_{vh}\).

Dados Polarimétricos multi-look



  • Dados PolSAR single-look não levam em conta o controle do efeito speckle sobre as imagens
  • Um processo para contornar isso é chamado de processamento multi-look

Dados Polarimétricos multi-look



\(\mathbf{z}_i = (S_1^{(i)}\,S_2^{(i)}\,\cdots\,S_p^{(i)})^{\top} \, \in \mathbb{C}^{p}\) é o \(i\)-ésimo vetor associado a \(p\) canais de polarização em uma amostra de \(L\) informações extraídas da mesma cena, para \(i=1,\ldots,L\).

Dados Polarimétricos multi-look



  • Uma imagem PolSAR pode ser entendida como uma cena, na qual cada entrada está associada a uma matriz hermitiana definida positiva, o que requer o uso de métodos de processamento multivariado

Modelos da literatura

para retornos PolSAR por MM


Como o ruído speckle é multiplicativo, o modelo multiplicativo (MM) é um mecanismo gerador de distribuições PolSAR que tem sido amplamente utilizado para modelar os dados multi-look.


Sejam \(X\) e \(\boldsymbol{Y}\) duas variáveis aleatórias positivas e independentes tal que, \(X\) está associado ao retroespalhamento, enquanto \(\boldsymbol{Y}\) descreve o speckle.


O MM para imagens PolSAR multilook assume que cada pixel segue a identidade \(\boldsymbol{Z}=\boldsymbol{Y}\times X\).

Nesse caso, enquanto a variável aleatória \(X\) modela o retroespalhamento do terreno, \(\boldsymbol{Y}\) descreve o ruído speckle multidimensional multi-look.

Modelos da literatura

para retornos PolSAR por MM



Tomando o MM como mecanismo gerador de distribuições PolSAR, cada retorno associado a uma entrada da imagem é o produto de duas variáveis aleatórias independentes, que descrevem a configuração do terreno e o efeito do speckle.


O retorno \(\mathbf{Z} = \mathbf{Y} X\) tem densidade dada por (ANFINSEN; ELTOFT , 2011)

\[\begin{align*} \begin{array}{lr} f_{\mathbf{Z}}(\dot{\mathbf{Z}}) = \int_0^{\infty} x^{-m^2}\underbrace{f_{\mathbf{Y}}(\dot{\mathbf{Z}}/x)}_{\text{Speckle}}\underbrace{f_X(x)}_{\text{Backscatter}} \mathrm{d}x, & (25) \end{array} \end{align*}\]

em que \({\dot{\mathbf{Z}}}\in\mathbf{\Omega}_+:=\{\mathbf{Z}\in \mathbb{C}^m\times \mathbb{C}^m:\mathbf{Z}=\mathbf{Z}^*\}\) é uma possível realização de \(\mathbf{Z}\) e \((\cdot)^*\) é o operador transposto conjugado.

Modelos da literatura

para retornos PolSAR por MM


Resumo das distribuições matriciais1.

Modelos da literatura

para retornos PolSAR por MM


Limitações desses modelos:

1 - Eles não conseguem modelar adequadamente os dados PolSAR que apresentam intensidades multimodais, ou seja, aquelas que possuem mais de um pico em suas distribuições de intensidade.

Distribuição Wishart

Distribuição \(\mathcal{G}^0_m\)

Modelos da literatura

para retornos PolSAR por MM


2 - Esses modelos não levam em consideração a variação do número de retroespalhadores entre as células de resolução, o que pode resultar em uma representação inadequada dos dados PolSAR.

  • Tomando apenas um canal de polarização, sabe-se que se o número de espalhadores, diga-se \(n\), em uma célula de resolução for grande o suficiente e aproximadamente constante entre diversos pixels, então o sinal eletromagnético retornado

\[ S_{rs} = \sum_{k=1}^N S^{(k)}_{rs} = \sum_{k=1}^N A_{rs}^{(k)} e^{i \phi_{rs}(k)}, \]

segue a lei Gaussiana complexa, em que \(S^{(k)}_{rs}\) é a quantidade de valor complexo que representa o espalhador individual.

Modelagem Estatística

Retroespalhadores



Como o número de retroespalhadores mudam entre as células de resolução, é interessante que ele seja descrito como uma variável aleatória, diga-se \(N\).

Modelagem Estatística

Modelos da literatura e formulação física das novas propostas



  • Há evidências de que a distribuição Wishart complexa pode representar o retorno PolSAR de cenários homogêneos.


  • As distribuições Poisson truncada e geométrica podem ser usadas para modelar a quantidade de sinais retornados em uma célula de resolução.


  • Combinando essas duas evidências, propomos a soma aleatória da distribuição Wishart complexa com o número de termos seguindo as leis Poisson truncada e geométrica como dois descritores para o retorno de dados PolSAR.

Modelagem Estatística

Novos modelos



Primeiramente, seja \(\mathbf{Z}_i\sim \mathcal{W}_{m}^{\mathbb{C}}(\mathbf{\Sigma},L)\) para \(i=1,\ldots,N\) com função densidade de probabilidade

\[\begin{align} \begin{array}{lr} f({\dot{\mathbf{Z}}_i}) = \frac{|{\dot{\mathbf{Z}}_i}|^{L-m}}{|\mathbf{\Sigma}|^L\Gamma_m(L)} \exp \left\{ - \operatorname{tr} \left(\mathbf{\Sigma}^{-1}{\dot{\mathbf{Z}}_i} \right) \right\} \, \mathbb{I}_{ \mathbf{ \Omega }_+ } ( \dot{ \mathbf{S} } ) \end{array} \end{align}\]

em que \(\Gamma_m(L)\) é a função gama multivariada. Então, seja \(\mathbf{S}_k=\sum_{i=1}^k\mathbf{Z}_i\sim \mathcal{W}_{m}^{\mathbb{C}}(\mathbf{\Sigma},kL)\) e a matriz de coerência por célula segue a soma composta \[\mathbf{S}=\sum_{i=1}^N\mathbf{Z}_i\] com \(N\sim \text{TPo}(\lambda)\), logo a densidade é dada por

Modelagem Estatística

Novos modelos



\[\begin{align*} \begin{array}{lr} \begin{array}{rl} f({\dot{\mathbf{S}}}) &=\sum_{k=1}^\infty P(N=k)f_{\mathbf{S}_k}({\dot{\mathbf{S}}})\,\mathbb{I}_{\mathbf{\Omega}_+}(\dot{\mathbf{S}}) \\ &= \left(\frac{1}{\mathrm{e}^\lambda-1}\right) \sum_{k=1}^\infty\frac{\lambda^k}{k!}f_{\mathcal{W}_{m}^{\mathbb{C}}(\mathbf{\Sigma},kL)}({\dot{\mathbf{S}}}) \\ &=\left(\frac{\mathrm{e}^{-\operatorname{tr}\left(\mathbf{\Sigma}^{-1}{\dot{\mathbf{S}}}\right)}}{|{\dot{\mathbf{S}}}|^m\left(\mathrm{e}^\lambda-1\right)}\right)\sum_{k=1}^\infty\frac{\left(\lambda|\mathbf{\Sigma}^{-1}{\dot{\mathbf{S}}}|^L\right)^k}{k!\Gamma_m(kL)}, \end{array} \end{array} \end{align*}\]


em que \({\dot{\mathbf{S}}}=\{s_{i,j}\}\) é uma possível realização de \({\mathbf{S}}=\{S_{i,j}\}\).


Esta situação é denotada por \(\mathbf{S}\sim \text{CPT}\mathcal{W}_{m}^{\mathbb{C}}(\lambda,\mathbf{\Sigma},L)\).

Modelagem Estatística

Novos modelos



Agora assuma que \(N\sim \text{Geo}(p)\) e \(\mathbf{Z}_i\sim \mathcal{W}_{m}^{\mathbb{C}}(\mathbf{\Sigma},L)\) para \(i=1,\ldots,N\), a matriz de coerência por célula segue a soma composta \(\mathbf{S}=\sum_{i=1}^N\mathbf{Z}_i\) com densidade

\[\begin{align*} \begin{array}{lr} \begin{array}{rl} f({\dot{\mathbf{S}}}) &=\sum_{k=1}^\infty P(N=k)f_{\mathbf{S}_k}(\dot{\mathbf{S}}) \mathbb{I}_{\mathbf{\Omega}_+}(\dot{\mathbf{S}}) \\ &= \left( \frac{ p\mathrm{e}^{-\operatorname{tr}\left(\mathbf{\Sigma}^{-1}{\dot{\mathbf{S}}}\right)} }{ (1-p)|{\dot{\mathbf{S}}}|^m } \right) \sum_{k=1}^\infty \frac{ \left((1-p)|\mathbf{\Sigma}^{-1}{\dot{\mathbf{S}}}|^L\right)^k }{ \Gamma_m(kL) }\,\mathbb{I}_{\mathbf{\Omega}_+}(\dot{\mathbf{S}}). \end{array} \end{array} \end{align*}\]


Essa situação é denotada como \(\mathbf{S}\sim \text{CG}\mathcal{W}_{m}^{\mathbb{C}}(p,\mathbf{\Sigma},L)\).

Modelagem Estatística

Novos modelos



Densidades marginais das distribuições \(\text{CPT}\mathcal{W}_{m}^{\mathbb{C}}\) e \(\text{CG}\mathcal{W}_{m}^{\mathbb{C}}\).


  • Os EMVs para os parâmetros para as ditribuições \(\text{CPT}\mathcal{W}_{m}^{\mathbb{C}}\) e \(\text{CG}\mathcal{W}_{m}^{\mathbb{C}}\) foram obtidos por meio do algoritmo EM.

Modelagem Estatística

Novos modelos



Diagrama das relações entre distribuições PolSAR. Aqui, o vetor de parâmetros ( \(\alpha , \beta , \lambda , p\) ) representa a forma, \(\mathbf{\Sigma}\) denota um tipo de locação ou uma matriz de dispersão e \(L\) é o Número Estimado de Looks.

Experimentos Numéricos

Análise com dados artificiais


Um experimento de Monte Carlo é realizado para quantificar o comportamento assintótico dos EMVs para os parâmetros \([\lambda,\mathbf{\Sigma}]\) e \([p,\mathbf{\Sigma}]\).

  1. Amostras das distribuições \(\text{CPT}\mathcal{W}_{m}^{\mathbb{C}}\) e \(\text{CG}\mathcal{W}_{m}^{\mathbb{C}}\) são geradas.
  2. Tamanhos \(T=10, 30, 100\) e \(1000\) e mil replicas Monte Carlo são utilizadas.
  3. Adotamos NEL igual a quatro (L = 4).
  4. E uma matriz comum

\[\begin{align} \mathbf{\Sigma} = \left[\!\! \begin{array}{ccc} 0.07582+0i & 0.00364+0.00388i & 0.01604+0.01125i\\ & 0.03737+0i & 0.00151+0.00202i \\ & & 0.06308+0i \end{array} \!\! \right]\!\!, \end{align}\]

com \(\text{tr}(\mathbf{\Sigma})= 0.17626 \text{ e } |\mathbf{\Sigma}| = 0.00016\) .

Experimentos Numéricos

Análise com dados artificiais


Performance dos EMVs para dados \(\text{CPT}\mathcal{W}_{m}^{\mathbb{C}}\)

Parâmetros Verdadeiros: \(\text{tr}(\mathbf{\Sigma})= 0.17626 \text{ e } |\mathbf{\Sigma}| = 0.00016\)

Experimentos Numéricos

Análise com dados artificiais


Performance dos EMVs para dados \(\text{CG}\mathcal{W}_{m}^{\mathbb{C}}\)

Parâmetros Verdadeiros: \(\text{tr}(\mathbf{\Sigma})= 0.17626 \text{ e } |\mathbf{\Sigma}| = 0.00016\)

Resultados

Análise de dados reais



Mapas dos parâmetros estimados das distribuições \(\text{CPT}\mathcal{W}_{m}^{\mathbb{C}}\) (acima) e \(\text{CG}\mathcal{W}_{m}^{\mathbb{C}}\) (em baixo) para a imagem São Francisco (EUA).

Resultados

Análise de dados reais



Mapas dos parâmetros estimados das distribuições \(\text{CPT}\mathcal{W}_{m}^{\mathbb{C}}\) (acima) e \(\text{CG}\mathcal{W}_{m}^{\mathbb{C}}\) (em baixo) para a imagem Foulum (Dinamarca).

Resultados

Análise de dados reais



Mapas dos parâmetros estimados das distribuições \(\text{CPT}\mathcal{W}_{m}^{\mathbb{C}}\) (acima) e \(\text{CG}\mathcal{W}_{m}^{\mathbb{C}}\) (em baixo) para a imagem DEMMIN-Görmin (Alemanha).

Diagrama de Mellin



Avaliar modelagem com distribuições PolSAR é um desafio, pois as técnicas tradicionais de avaliação de ajuste não são adequadas para dados matriciais.


Sendo assim, o diagrama de Mellin é uma ferramenta útil para avaliar a qualidade do ajuste de modelos PolSAR.


O diagrama de Mellin é uma representação gráfica:

  • do segundo (\(\kappa_2\)) e terceiro (\(\kappa_3\)) log-cumulantes de Mellin
  • que são derivados da função geradora de cumulantes do tipo Mellin (MCGF)
  • da matriz de log-cumulante (MLC)
  • obtidas a partir da transformada de Mellin aplicada a matrizes aleatórias hermitianas, como as que descrevem os dados PolSAR.

Diagrama de Mellin



Seja \(\mathbf{C} \in \mathbf{\Omega}_+\), a transformada de Mellin para o mapeamento \(g(\mathbf{C}): \mathbf{\Omega}_+ \rightarrow \mathbb{R}\) é definida como:

\[\begin{align*} \begin{array}{lr} \phi_{\mathbf{C}}(s) & = \mathcal{M}\{g(\mathbf{C})\}(s) = \int\limits_{\mathbf{\Omega}_+}^{}|\mathbf{C}|^{s-m}g(\mathbf{C})\mathrm{d}\mathbf{C} \end{array} \end{align*}\]

com \(s \in \mathbb{C}\), sempre que a integral existe. A função geradora de cumulantes do tipo Mellin (Mellin-kind cumulant-generating function - MCGF) é definida como

\[\begin{align} \begin{array}{lr} \varphi_{\mathbf{C}}(s) = \log \phi_{\mathbf{C}}(s) \end{array} \end{align}\]

e a matriz de log-cumulante (MLC) de \(\nu\) -ésima ordem é definida como

\[\begin{align} \begin{array}{lr} \left. \kappa_\nu{\mathbf{C}} = \dfrac{d^\nu}{ds^\nu}\varphi_{\mathbf{C}}(s) \right|_{s=m}. \end{array} \end{align}\]

Resultados

Análise de dados reais



Diagrama de Mellin com amostra de MLCs calculados a partir das amostras de São Francisco (EUA).

Resultados

Análise de dados reais



Diagrama de Mellin com amostra de MLCs calculados a partir das amostras de Foulum (Dinamarca).

Resultados

Análise de dados reais



Diagrama de Mellin com amostra de MLCs calculados a partir das amostras de DEMMIN-Görmin (Dinamarca).

Conclusões


  • Foram propostas duas novas distribuições para dados PolSAR multilook usando a abordagem de soma estocástica para descrever dados multimodais.

  • Elas foram denominadas como composta Poisson truncada Wishart complexa \((\text{CPT}\mathcal{W}^\mathbb{C}_m)\) e composta geométrica Wishart complexa (\(\text{CG}\mathcal{W}^\mathbb{C}_m\)).

  • Foram derivados estimadores de máxima verossimilhança (EMVs) para ajustar os modelos PolSAR através do Algoritmo Expectation-Maximization e os resultados numéricos indicaram que tais estimativas apresentaram valores baixos de viés e erros quadráticos médios para tamanhos de amostra que são realistas com a prática de processamento de dados PolSAR.

  • Os diagramas de MLCs como critério de comparação apontaram que os modelos \(\text{CPT}\mathcal{W}_m^{\mathbb{C}}\) e \(\text{CG}\mathcal{W}_m^{\mathbb{C}}\) podem fornecer melhores descrições de alguns cenários PolSAR.

Conclusões



Esses resultados podem ser encontrados no artigo publicado na Remote Sensing:

Autores: Ferreira, J.A., Nascimento, A.D.C. & Frery, A.
Ano: 2022 - DOI (link): 10.3390/rs14205083

Referências



  • Ferreira, J.A.; Nascimento, A.D.C.; Frery, A.C. PolSAR Models with Multimodal Intensities. Remote Sens. 2022, 14, 5083.

  • Anfinsen, S.N.; Doulgeris, A.P.; Eltoft, T. Goodness-of-Fit Tests for Multilook Polarimetric Radar Data Based on the Mellin Transform. IEEE Trans. Geosci. Remote Sens. 2011, 49, 2764 –2781.

  • Nascimento, A.D.; Rêgo, L.C.; Nascimento, R.L. Compound truncated Poisson normal distribution: Mathematical properties and Moment estimation. Inverse Probl. Imaging 2019, 13, 787–803.

  • Freitas, C.C.; Frery, A.C.; Correia, A.H. The Polarimetric G Distribution for SAR Data Analysis. Environmetrics 2005, 16, 13–31.

  • Lee, J.S.; Schuler, D.L.; Lang, R.H.; Ranson, K.J. K-distribution for multi-look processed polarimetric SAR imagery. In Proceedings of the International Geoscience and Remote Sensing Symposium (IGARSS’1994), Pasadena, CA, USA, 8–12 August 1994; Volume 4, pp. 2179–2


Contato:

e-mail:

Site Pessoal: https://jodavid.github.io/

Lattes: http://lattes.cnpq.br/4617170601890026

LinkedIn: jodavidferreira

Computational Agriculture Statistics Laboratory - UFPE

Laboratório de Estatística Espacial e Modelagem Estatística - UFPE


Slide produzido com [quarto] + [R]


Link: http://jodavid.github.io/CBJME_PolSAR_Models/