Tekst uit gescande PDF halen — gratis browser-OCR
Een gescande PDF is in wezen een foto van papier — je ziet de tekst maar je kunt hem niet selecteren, doorzoeken of kopiëren. Om hem bruikbaar te maken heb je OCR nodig (Optical Character Recognition). De meeste online OCR-tools eisen een upload en account. Zo doe je OCR gratis, volledig in je browser.
Wat OCR eigenlijk doet
OCR analyseert elke pagina-afbeelding, herkent letterpatronen en zet ze om naar echte Unicode-tekst. De oorspronkelijke opmaak blijft behouden, het resultaat ziet er nog steeds uit als de scan, maar eronder is nu doorzoekbare tekst. Een scan van 10 pagina's wordt in 10–30 seconden verwerkt afhankelijk van je CPU.
Waarom browser-OCR beter is dan cloud-OCR
Cloud OCR-diensten (ook de gratis) uploaden je gescande document naar hun servers. Als je scan een ID-kaart, belastingaangifte of contract bevat, heb je het zojuist met een derde partij gedeeld. Browser-OCR draait de herkenningsengine (Tesseract.js gecompileerd naar WebAssembly) volledig op je apparaat — het bestand verlaat je browser nooit.
Hoe je OCR doet op een gescande PDF in de browser
Open de OCR-tool, sleep je gescande PDF erin, kies de documenttaal (Nederlands, Engels, Duits, Frans, Spaans, Italiaans, Portugees, Pools, Japans, Koreaans, Hindi, Arabisch, Chinees — en 90+ meer) en klik op Verwerken. De uitvoer is een doorzoekbaar PDF dat je kunt downloaden. Open hem in elke PDF-viewer en gebruik Ctrl+F om te zoeken.
Snelle tip: De OCR-nauwkeurigheid hangt af van de scan-kwaliteit. Scan opnieuw op 300 DPI als de tekst wartaal oplevert. Recht eerst scheve pagina's met de Roteer-tool — zelfs 5° scheefstand verslechtert de herkenning.
Voer OCR uit op je gescande PDF
Gratis, zonder upload, ondersteunt 100+ talen inclusief Arabisch, Hindi, Chinees, Japans, Koreaans.
Open OCR-tool →