Italiano - English

Ricerca ed estrazione dei caratteri

Sommario

    Riconoscimento Targhe Autoveicoli
    1. Acquisizione dell'immagine
    2. Ricerca e estrazione della targa
    3. Ricerca ed estrazione dei caratteri
    4. Riconoscimento Caratteri
    5. Scenario delle soluzioni
    6. Soluzione Adottata: Feedforward Neural Networks
    7. Neural Networks: Bibliografia

    Dalle immagini rettangolari delle targhe si passa alla suddivisione in caratteri. Questa fase richiede la possibilità di separare i pixel del testo da quelli dello sfondo. Come già detto le immagini sono a 256 toni di grigio e sono tutti presenti nel rettangolo della targa, tuttavia ci si aspetta che i pixel dello sfondo siano di colore molto diverso dai pixel di testo. La separazione avviene attraverso una binarizzazione della targa, in cui i pixel dello sfondo hanno valore 255 e quelli del testo valore 0. La soglia di separazione viene determinata attraverso l'analisi in frequenza delle intensità di grigio.

    istogramma


    Il grafico mostra una situazione tipica in cui i toni di grigio principali sono sui valori a e b, che sono proprio toni dei pixel per il testo e per lo sfondo. Tutti i pixel il cui tono è minore di S prendono il valore 0, i rimanenti prendono il valore di 255.

    I picchi a e b non sono sempre sugli stessi toni a causa delle differenti condizioni di illuminazione e del tipo di targa. Inoltre, la situazione può anche essere invertita, nel caso di targhe scure con testo chiaro.

    Con la targa binarizzata è possibile individuare i caratteri, facendo scorrere una linea verticale ideale, da sinistra verso destra. Quando la linea incontra un pixel nero, allora inizia un carattere che continua fino a quando almeno un pixel è nero. Quando tutti i pixel della linea verticale sono bianchi, allora il carattere è terminato e comincia uno spazio. Per ottenere l'altezza del carattere basta prendere il pixel nero più alto e quello più basso per ogni carattere.

     

    immagini di esempio

     

    Il procedimento di riquadramento fallisce nel caso in cui i caratteri non sono separati da almeno un pixel. Alcune situazioni tipiche sono mostrate in figura. Il caso b) è dovuto ad una imprecisione dell'estrazione della targa, mentre il caso c) si verifica in presenza di targhe sporche o troppo in prospettiva. Questi casi vanno risolti con operazioni di condizionamento, in cui tratti neri di spessore inferiore ad una soglia vengono sommersi.

    Il risultato di questa fase è una serie di immagini rettangolari di dimensioni variabili tra 25..34 per l'altezza e 15..24 per la larghezza (i caratteri I e 1 la larghezza può arrivare anche a 10 pixel). La dimensione media delle immagini è di circa 30x18. Il numero dei rettangoli trovati non è sempre uguale, sia perchè il numero dei caratteri presenti nelle targhe è variabile (8 per le targhe vecchie come MI 12A379 7 per le targhe nuove come AB 123 XY oppure per targhe molto vecchie come BA 68010) sia perchè a volte ai bordi delle targhe vi sono delle ampie zone scure che vengono interpretate come caratteri come in figura c. Inoltre, nei singoli rettangoli vengono lasciati tutti i toni di grigio originali.

    Vota questa pagina:

    0 Commenti:

    Lascia il tuo commento:

    Note:
    • La tua email non è obligatoria e non sarà visibile in alcun modo
    • Si prega di inviare solo commenti relativi a questa pagina
    • Commenti inappropriati o offensivi saranno modificati o eliminati
    • Codici HTML non sono consentiti. Prego usare i BB code:
      [b]bold[/b], [u]underline[/u], [i]italic[/i], [code]code[/code]
    Il codice, le illustrazioni e gli esempi riportati in questa pagina sono solo a scopo illustrativo. L'autore non prende alcuna responsabilità per il loro utilizzo da parte dell'utente finale.
    Questo materiale è di proprietà di Pk Lab ed è utilizzabile liberamente a condizione di citarne la fonte.