Esistono in rete diversi programmi e anche servizi web-based che permettono di estrarre testo da immagini jpeg, gif, png, bmp ecc… Questo è possibile grazie alla funzionalità OCR (riconoscimento ottico dei caratteri) che in pratica riconosce le lettere, le parole e le estrae dalle immagini. Non tutti i programmi hanno lo stesso motore OCR, e quindi la qualità di estrazione testo puo’ risultare diverso a seconda dell’applicazione utilizzata.
In questo articolo abbiamo fatto dei test di estrazione testo da immagini utilizzando il software Document Image Converter PRO
La prima cosa da fare è scaricare il software:
SCARICA DOCUMENT IMAGE CONVERTER PRO
Una volta scaricato e installato sul computer vedremo una schermata come questa:
Carichiamo adesso la nostra immagine cliccando sul simbolo “+” presente in alto a sinistra. Nel nostro caso abbiamo caricato la seguente immagine:
Abbiamo volutamente scelto un immagine con del testo per verificare se il programma poi effettivamente lo estrae.
Per attivare la funzionalità di riconoscimento caratteri (OCR) siamo andati a destra nella sezione “Other Setting”. Bisogna verificare che sia selezionato il box “CUSTOM OCR Language” e dal menu a tendina bisogna selezionare la lingua del testo presente nell’immagine (nel nostro caso “Italiano”).
In alto a destra impostiamo il formato di conversione, es. Word oppure HTML oppure TXT e infine clicchiamo in basso a destra su CONVERT per avviare la conversione e l’estrazione del testo dall’immagine.
Il risultato ottenuto è stato un file txt con all’interno:
Click, anche se il tempo è veloce come un
click,
bisogna vivere al massimo è cosi
Ci scatteranno le foto come Carla Bruni
insieme a Sarkosy
Weed, tu già lo sai io vado fuori per la..
Essendo il programma in versione “Trial” è normale che non sia stata fatta la conversione totale dell’immagine. In ogni caso l’estrazione del testo è stata velocissima e fedele all’immagine di partenza.
La versione completa e senza limitazioni è acquistabile da Questo Link