Extraire le texte d'un PDF scanné — OCR gratuit dans le navigateur
Un PDF scanné est essentiellement une photographie de papier — vous voyez le texte mais ne pouvez pas le sélectionner, rechercher ou copier. Pour le rendre utilisable, il faut un OCR (reconnaissance de caractères). La plupart des OCR en ligne demandent upload et inscription. Voici comment faire de l'OCR gratuitement, entièrement dans votre navigateur.
Ce que fait réellement l'OCR
L'OCR analyse chaque image de page, identifie les formes de lettres et les convertit en vrai texte Unicode. La mise en page d'origine est conservée, le résultat ressemble toujours au scan, mais en dessous il y a désormais du texte recherchable. Un scan de 10 pages se traite en 10 à 30 secondes selon votre CPU.
Pourquoi l'OCR navigateur surpasse l'OCR cloud
Les services OCR cloud (même les gratuits) uploadent votre document scanné sur leurs serveurs. Si votre scan contient une carte d'identité, une déclaration fiscale ou un contrat, vous venez de le partager avec un tiers. L'OCR navigateur exécute le moteur de reconnaissance (Tesseract.js compilé en WebAssembly) entièrement sur votre appareil — le fichier ne quitte jamais votre navigateur.
Comment OCR un PDF scanné dans votre navigateur
Ouvrez l'outil OCR, déposez votre PDF scanné, choisissez la langue du document (français, anglais, allemand, espagnol, italien, portugais, néerlandais, polonais, japonais, coréen, hindi, arabe, chinois — et plus de 90 autres), puis cliquez sur Traiter. La sortie est un PDF recherchable que vous pouvez télécharger. Ouvrez-le dans n'importe quel lecteur PDF et utilisez Ctrl+F pour rechercher.
Astuce rapide: La précision OCR dépend de la qualité du scan. Re-scannez à 300 DPI si le texte ressort déformé. Redressez d'abord les pages obliques avec l'outil Rotation — même 5° d'inclinaison dégrade la reconnaissance.
Faites de l'OCR sur votre PDF scanné
Gratuit, sans upload, prend en charge plus de 100 langues dont arabe, hindi, chinois, japonais, coréen.
Ouvrir l'outil OCR →