Estrarre testo da PDF scansionato — OCR gratis nel browser
Un PDF scansionato è essenzialmente una fotografia di carta — vedi il testo ma non puoi selezionarlo, cercarlo o copiarlo. Per renderlo utile serve l'OCR (riconoscimento ottico dei caratteri). La maggior parte dei tool OCR online richiede upload e account. Ecco come fare OCR gratis, interamente nel browser.
Cosa fa realmente l'OCR
L'OCR scansiona ogni immagine di pagina, identifica le forme delle lettere e le converte in vero testo Unicode. Il layout originale viene preservato, il risultato sembra ancora la scansione ma sotto c'è ora testo ricercabile. Una scansione di 10 pagine si elabora in 10–30 secondi a seconda della CPU.
Perché l'OCR nel browser batte l'OCR cloud
I servizi OCR cloud (anche quelli gratuiti) caricano il tuo documento scansionato sui loro server. Se la scansione contiene una carta d'identità, una dichiarazione fiscale o un contratto, lo hai appena condiviso con una terza parte. L'OCR nel browser esegue il motore di riconoscimento (Tesseract.js compilato in WebAssembly) interamente sul tuo dispositivo — il file non lascia mai il browser.
Come fare OCR su un PDF scansionato nel browser
Apri lo strumento OCR, rilascia il PDF scansionato, scegli la lingua del documento (italiano, inglese, tedesco, francese, spagnolo, portoghese, olandese, polacco, giapponese, coreano, hindi, arabo, cinese — e oltre 90 altre) e clicca Elabora. L'output è un PDF ricercabile che puoi scaricare. Aprilo in qualsiasi visualizzatore PDF e usa Ctrl+F per cercare.
Consiglio rapido: L'accuratezza dell'OCR dipende dalla qualità della scansione. Riscansiona a 300 DPI se il testo esce confuso. Raddrizza prima le pagine inclinate con lo strumento Ruota — anche 5° di inclinazione degradano il riconoscimento.
Fai OCR sul tuo PDF scansionato
Gratis, senza upload, supporta oltre 100 lingue inclusi arabo, hindi, cinese, giapponese, coreano.
Apri strumento OCR →