In questo articolo vogliamo proporre ed elencare diversi modi semplici e gratuiti per estrarre testo da immagini. I software e applicazioni che permettono di “leggere” i testi su file immagine o di convertire immagini in documenti editabili, sono detti software OCR (Optical Character Recognition)
Molti non sanno che un primo modo, semplice e veloce per convertire immagini in file testuali è quello di utilizzare GOOGLE DOCS. Se hai già un account google, vai nella sezione “Documenti” e qui carica il file immagine o file PDF da cui vuoi effettuare l’estrazione del testo. Google Docs supporta il caricamento di vari formati immagini e PDF e consente la loro conversione nei formati testuali ODT, PDF, TXT, RTF, DOC, HTML.
Di seguito vediamo altre risorse on-line che consentono di effettuare l’operazione di riconoscimento testuale delle immagini:
i2OCR :
- Tipi di file in ingresso: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM
- Tipo di file in uscita: TXT
- Lingue supportate: più di 30
OCRonline:
- Tipi di file in ingresso: JPG, TIFF, PNG, GIF
- Tipo di file in uscita: TXT, PDF, RTF, DOC
- Lingue supportate: più di 150
Online OCR:
- Tipi di file in ingresso:JPG, JPEG, BMP, TIFF, GIF
- Tipo di file in uscita: DOC, XLS, TXT (+ PDF per utenti registrati)
- Lingue: oltre 30