Come convertire i documenti scansionati in Word - The Happy Android

Se hai bisogno di digitalizzare un libro in formato testo, potresti avere diverse domande. Può essere fatto? Che ne dici della qualità, è buona? Non solo può essere fatto, ma ci sono anche diversi modi per convertire un documento scansionato in Word. Vediamo:

  • Scansionando il documento in formato PDF e successivamente modificandolo con Adobe Acrobat XI Pro per salvarlo in formato Word. La versione Pro di Acrobat è a pagamento, ma puoi acquistare una licenza di prova gratuita di 30 giorni.
  • Dal sito Web OnlineOCR.net . Questa applicazione web consente di convertire documenti PDF, JPG, TIFF e GIF in Word, Excel e testo. Nella versione gratuita possiamo convertire fino a 15 pagine all'ora e documenti di non più di una pagina.
  • Scansionando il documento in formato (OCR) e salvandolo come testo. Quindi possiamo aprire Word e modificarlo o salvarlo in formato .doc.
  • Utilizzando alcuni programmi di riconoscimento ottico dei caratteri :
    •  VueScan (disponibile per Windows, Mac OS X e Linux)
    • Kooka  (per Linux)
    • Office Lens (per Android e iOS )
    • CamScanner (per Android e iOS )

Il modo più efficiente di tutto quello che possiamo dire è tramite Adobe Acrobat Pro, ma solo se la scansione è molto, molto pulita e di alta qualità. Le applicazioni di riconoscimento ottico dei caratteri hanno fatto molta strada, ma mostrano ancora alcune scappatoie con cose come il grassetto o il corsivo e la trascrizione di alcune parole a seconda del tipo di carattere del documento originale può essere sbagliata.

Prova a scansionare e passare questo documento a Word per vedere cosa succede

Dallo scanner stesso

Alcuni scanner includono la funzione di riconoscimento ottico (OCR) nel proprio programma di scansione. Per scansionare un documento in testo devi solo impostare il formato di digitalizzazione e guardarne uno che si riferisce all'OCR o simile (dipende dalla marca / modello dello scanner).

Passa da PDF a Word con Adobe Acrobat XI Pro

Una volta scaricato e installato Adobe Acrobat XI Pro ( QUI hai una versione di prova gratuita di 30 giorni) vai su " Strumenti -> Riconoscimento del testo -> In questo file ".

Nella finestra " Riconosci testo " , fai clic su " Modifica " e scegli la lingua del testo, lo stile di output e la risoluzione.

Infine, torna a " Strumenti -> Modifica del contenuto -> Modifica testo e immagini " e modifica il testo se devi correggere qualsiasi parola. Per finire, fare clic su " File -> Salva con nome " e salvarlo in formato Word.

OnlineOCR

OnlineOCR è un'applicazione web per trasferire immagini o PDF in Word ed è molto facile da usare. Ti spiego come funziona: entra in //www.onlineocr.net/ e clicca su " Seleziona file ". Seleziona il documento scansionato, quindi scegli la lingua e il formato di output dai 2 menu a discesa che hai al centro dello schermo.

Per finire, clicca su " Converti ". Appena sotto apparirà un'anteprima di testo semplice che puoi modificare se devi correggere qualsiasi parola. Infine, fai clic su " Scarica file di output " e puoi scaricare il file in formato Word. Ecco un esempio di un PDF convertito in Word con OnlineOCR:

  • PDF originale:

  • Documento convertito:

Se questa applicazione web non ti soddisfa, puoi provare altre alternative simili come FreeOCR o Free-Online-OCR .

Programmi di riconoscimento ottico dei caratteri (OCR)

Se non vuoi modificare i tuoi documenti online e hai bisogno di un'applicazione desktop, puoi utilizzare applicazioni come VueScan (che è disponibile anche per Mac e Linux oltre all'onnipresente Windows).

Un'altra possibilità è utilizzare il tuo dispositivo Android o iOS per scansionare il documento e convertirlo direttamente in testo. Esistono applicazioni come Office Lens (per Android e iOS ) o CamScanner (per Android e iOS ) che eseguono l'intero processo dalla stessa applicazione. Si consiglia in questi casi di pulire l'immagine prima di convertirla in testo. Se vuoi saperne di più su questo metodo dai un'occhiata a QUESTO POST .

A mio parere, la tecnica di riconoscimento ottico dei caratteri, sebbene sia migliorata molto negli ultimi anni, è ancora lontana anni luce dall'essere una tecnica perfetta. Molti dettagli, molte parole che "traduce" con lettere e simboli errati che sporcano il testo. Gli manca ancora quell'intelligenza extra che gli fa capire che " t &! $ Olog1a " non può essere una traduzione valida di nessuna parola in un testo. Continuo a non vedere una comprensione della lettura, ma un semplice riconoscimento visivo di singole lettere che formano parole senza integrarle con il resto del testo. Tuttavia, sono convinto che il momento in cui faremo quell'ultimo grande salto si avvicina ogni giorno di più.

Hai installato Telegram ? Ricevi il miglior post di ogni giorno sul nostro canale . Oppure, se preferisci, scopri tutto dalla nostra pagina Facebook .