In un’immagine telerilevata, supposta per semplicita’ in bianco e nero, gruppi di pixel relativi a zone diverse del terreno (acqua e bosco, ad esempio) sono caratterizzati ognuno da un certo valore di tono di grigio e da una certa dispersione intorno a tale valore e dunque rappresentabili tramite una variabile casuale. La classificazione dell’immagine, ovvero la suddivisione in gruppi dei pixel relativi a una stessa zona, puo’ allora basarsi sulla probabilita’ di appartenenza di un tono di grigio ad un gruppo, una volta che sia nota la distribuzione di probabilita’ che caratterizza ogni cluster. Negli approcci correnti, tale distribuzione viene stimata a partire da un campione di dati che si sa appartenere ad un cluster, detto training sample; segue la classificazione vera e propria. Pertanto la procedura di stima del modello di distribuzione dei toni di grigio, basata esclusivamente sui training sample, ignora nella costruzione del modello tutte le informazioni contenute nei pixel non classificati. In effetti questi, anche presi a se’ stanti, potrebbero essere classificati mediante algoritmi noti come unsupervised. Nel presente lavoro viene proposta l’applicazione di un opportuno metodo bayesiano noto come “data augmentation algorithm”, che permette di sfruttare a pieno entrambi i tipi di informazione. Il metodo viene descritto in dettaglio nel caso semplice di immagine in bianco e nero e di due soli cluster. In tal modo, infatti, e’ possibile evidenziare con maggiore chiarezza le caratteristiche salienti del metodo. Esso viene applicato a esempi simulati, provando la sua capacita’ di raggiungere quasi il limite teorico per l’errore di classificazione. Lo stesso metodo puo’ essere generalizzato a immagini multi banda con un numero qualunque di cluster, dando risultati di notevole accuratezza.
Classificazione bayesiana tramite l’algoritmo di data augmentation
REGUZZONI, MIRKO;SANSO', FERNANDO;VENUTI, GIOVANNA
2000-01-01
Abstract
In un’immagine telerilevata, supposta per semplicita’ in bianco e nero, gruppi di pixel relativi a zone diverse del terreno (acqua e bosco, ad esempio) sono caratterizzati ognuno da un certo valore di tono di grigio e da una certa dispersione intorno a tale valore e dunque rappresentabili tramite una variabile casuale. La classificazione dell’immagine, ovvero la suddivisione in gruppi dei pixel relativi a una stessa zona, puo’ allora basarsi sulla probabilita’ di appartenenza di un tono di grigio ad un gruppo, una volta che sia nota la distribuzione di probabilita’ che caratterizza ogni cluster. Negli approcci correnti, tale distribuzione viene stimata a partire da un campione di dati che si sa appartenere ad un cluster, detto training sample; segue la classificazione vera e propria. Pertanto la procedura di stima del modello di distribuzione dei toni di grigio, basata esclusivamente sui training sample, ignora nella costruzione del modello tutte le informazioni contenute nei pixel non classificati. In effetti questi, anche presi a se’ stanti, potrebbero essere classificati mediante algoritmi noti come unsupervised. Nel presente lavoro viene proposta l’applicazione di un opportuno metodo bayesiano noto come “data augmentation algorithm”, che permette di sfruttare a pieno entrambi i tipi di informazione. Il metodo viene descritto in dettaglio nel caso semplice di immagine in bianco e nero e di due soli cluster. In tal modo, infatti, e’ possibile evidenziare con maggiore chiarezza le caratteristiche salienti del metodo. Esso viene applicato a esempi simulati, provando la sua capacita’ di raggiungere quasi il limite teorico per l’errore di classificazione. Lo stesso metodo puo’ essere generalizzato a immagini multi banda con un numero qualunque di cluster, dando risultati di notevole accuratezza.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.