minilogo.gif (2094 bytes)

Riconoscimento automatico del volto

left.gif (1019 bytes) up.gif (1014 bytes) right.gif (1020 bytes)

Riconoscimento del profilo

Il riconoscimento del volto basato sul profilo ha sollevato un interesse molto inferiore a quello basato su vista frontale, poiché ai fini della classificazione il suo potenziale discriminatorio è intrisecamente minore di quello di un'immagine frontale; tuttavia, il profilo è molto più facile da analizzare, presenta un numero sufficientemente alto di dettagli da supportare un riconoscimento relativamente affidabile, e consente pertanto di ottenere algoritmi molto veloci e di buone prestazioni. Inoltre, occorre sottolineare come il riconoscimento del profilo rivesta grande importanza in determinate applicazioni di carattere legale e giudiziario, per esempio in quelle legate alla ricerca nei database di foto segnaletiche (Fig. 1).

Il riconoscimento di un profilo si basa in prima istanza sulla localizzazione di specifici punti di interesse, detti punti di fiducia (o anche talvolta, punti di repere: la punta del naso, l'estremità del mento, etc.) e sulla determinazione delle relazioni metriche tra di essi [2] [40] [48] [82]. Molti lavori di ricerca hanno fatto ovviamente ricorso ad approcci tradizionali come i descrittori di Fourier [86], solitamente usati per il riconoscimento di contorni chiusi generici. In [2], ad esempio, viene descritta una tecnica per il riconoscimento del profilo basata sui descrittori di Fourier di tipo P, adatti a descrivere curve sia aperte che chiuse; questi descrittori, che si ottengono applicando una trasformata discreta di Fourier (DFT, discrete Fourier transform) a segmenti rettilinei normalizzati ricavati dal profilo, sono invarianti per traslazione e per cambiamento di scala, e soddisfano inoltre a una relazione molto semplice tra la curva originale e una sua versione ruotata. Il set di addestramento (training set) è stato generato con tre riprese successive di 90 soggetti maschili, mentre una quarta ripresa è stata usata per produrre i dati di test; i descrittori di Fourier (limitati a 10 coefficienti) ottenuti dalle prime tre riprese sono stati mediati e usati come prototipi. Limitando la dimensionalità dei dati a soltanto 4 coefficienti, sono state individuate correttamente 65 persone su 90, con un tasso di accuratezza pari dunque al 72%; usando invece tutti e 10 i coefficienti, il tasso raggiunto è stato del 98%.

Il lavoro presentato in [48] descrive un sistema di riconoscimento basato su silhouette viste di profilo. L'immagine acquisita da una telecamera in bianco/nero viene sogliata per produrre un'immagine binaria, ossia bianca o nera senza sfumature di grigio, dove il nero corrisponde alla regione facciale. Una fase di pre-elaborazione estrae quindi la porzione anteriore della silhouette che delimita l'immagine del volto, cercando così di minimizzare l'effetto delle variazioni del profilo dovute a cambiamenti della pettinatura. Come vettore di feature viene usato un insieme di 12 valori di autocorrelazione normalizzata espressa in coordinate polari: la normalizzazione e la rappresentazione polare garantiscono in ampia misura l'invarianza dei risultati sia per traslazione che per rotazione. Sono stati condotti tre esperimenti su un totale di 120 profili di 10 persone; il training set era costituito da 60 profili scelti a caso nei primi due esperimenti, e da 90 profili nel terzo; altri esperimenti sono stati condotti con training set di dimensioni variabili. Le migliori prestazioni, corrispondenti ad una accuratezza del 90%, risultano conseguite con un training set di 90 campioni e con una dimensionalità del vettore di feature pari a 4. Viene infine riportato l'esito del confronto con un algoritmo analogo dove le feature vengono derivate dagli invarianti dei momenti [24], e viene dimostrato come le autocorrelazioni circolari portino ad ottenere prestazioni significativamente migliori.

Nel sistema per il riconoscimento semi-automatico dei profili presentato in [38], il problema della classificazione viene ricondotto a un confronto di forme d'onda. Le foto di profilo di 256 soggetti maschi vengono ridotte manualmente in curve di contorno da un esperto disegnatore; da queste curve viene automaticamente identificato un set di 9 punti di fiducia (Fig. 4): la fronte, la punta, la base e il dorso del naso, il labbro superiore e inferiore, la bocca, il mento e la gola (i dettagli della procedura sono illustrati in [38]). Da questi punti di fiducia viene ricavato un set di 6 parametri metrici e angolari, che vengono infine convertiti in un vettore di caratteristiche a 11 componenti. Dopo aver normalizzato la posizione del profilo mediante due punti di fiducia di riferimento, la somiglianza dei vettori di caratteristiche derivati dai profili viene quantificata mediante una metrica euclidea; la classificazione dei volti in base al valore di somiglianza viene infine ottenuta mediante semplice ordinamento delle norme euclidee.

fig-04.gif (1915 bytes)

Fig. 4 Esempio di punti caratteristici nell'analisi del profilo [11].

In un lavoro successivo [40] a quello appena citato, vengono usate immagini di soggetti sia maschili che femminili, e vengono eseguiti vari esperimenti col medesimo vettore di caratteristiche. Avendo osservato che i valori delle feature non cambiano di molto su immagini differenti dello stesso volto e che i volti corrispondenti a vettori di feature con distanze euclidee reciproche abbastanza grandi sono significativamente differenti, viene introdotta una fase intermedia di partizionamento per migliorare l'efficienza computazionale. In questa ricerca vengono utilizzati gli stessi metodi di estrazione delle caratteristiche definiti in [38], ma le componenti del vettore di feature vengono adesso ridotte a 10, avendo osservato che la sporgenza del naso è altamente correlata con due altre caratteristiche. La classificazione, basata sia sulla distanza euclidea che sul partizionamento di insiemi (set partitioning), ha prodotto un alto tasso di riconoscimento; il partizionamento si è dimostrato utile per ridurre il numero di candidati nelle misurazioni di distanza, con conseguente aumento di prestazioni e riduzione dei tempi di elaborazione.

Il lavoro descritto in [39] è una prosecuzione di entrambe le ricerche appena citate. L'obiettivo è adesso una miglior comprensione di base del processo di identificazione automatica del profilo facciale, delle condizioni necessarie allo sviluppo di procedure robuste ed economiche per l'implementazione in sistemi real-time, e dei requisiti minimi per un framework tecnologico da usare come supporto per ricerche future. L'algoritmo utilizzato prevede 17 punti di fiducia, che sembrano costituire la combinazione migliore per garantire velocità e affidabilità al riconoscimento del profilo. L'identità del soggetto viene ancora determinata come minima norma euclidea tra il vettore di feature del profilo sconosciuto e quelli dei profili di riferimento; tuttavia, la popolazione di riferimento viene preliminarmente ridotta mediante finestre di sogliatura, la cui dimensione viene determinata in funzione del vettore medio ottenuto da un certo numero di campioni del profilo di un singolo individuo. I profili vengono ricavati da fotografie ad alto contrasto, e il test set è costiuito da vari profili di un gruppo di individui ricavati in varie sedute. La fase di riduzione della popolazione, benché contribuisca significativamente ad accelerare i tempi di elaborazione, non sembra particolarmente importante ai fini dell'accuratezza del riconoscimento, che si attesta intorno al 96% sia in presenza che in assenza di detta fase.

Il metodo proposto in [84] è di fatto soltanto una fase preliminare, integrata successivamente in una procedura ibrida di riconoscimento. L'algoritmo inizia con l'estrazione basata su regole (rule-based) dei punti di fiducia sul profilo facciale, che vengono poi trasformati e normalizzati in una rappresentazione canonica unidimensionale del profilo stesso. In vista della fase di confronto, viene calcolato un modello delle variazioni su un certo numero di profili campione. Il confronto tra il profilo incognito e il modello di variazione dei soggetti campione viene eseguito calcolando la distanza tra i punti del profilo incognito e i corrispondenti punti estremali del modello di variazione.

L'approccio proposto in [32] può essere assegnato sia alla categoria del riconoscimento generico che a quella delle procedure ibride. Contrariamente a quanto riportato in [84], in questo lavoro le caratteristiche facciali vengono estratte esclusivamente per normalizzarne i valori e per definire delle regioni di riferimento, che vengono poi usate in un riconoscimento combinato delle regioni frontali e di profilo mediante un processo classico di template matching. Le tecniche di estrazione impiegate presumono la presenza di condizioni e vincoli particolari, nonché una conoscenza euristica della struttura della testa. Viene inoltre mostrato come le caratteristiche facciali sia frontali che di profilo possano essere usate per precalcolare degli indici di ricerca basati su distanze ed angoli tra punti caratteristici e come questi possano essere sfruttati per accelerare il processo globale di riconoscimento.

minilogo.gif (2094 bytes)

Riconoscimento automatico del volto

left.gif (1019 bytes) up.gif (1014 bytes) right.gif (1020 bytes)

© 1997-2003 Paolo Marincola (Rome, Italy)
e-mail:
pmaNOSPAM@acm.org (eliminare i caratteri "NOSPAM" per ottenere l'indirizzo esatto)
Commenti, osservazioni e suggerimenti sono estremamente graditi.

Last revised: 2003-12-06 22:38