Text aus gescanntem PDF extrahieren — kostenloses Browser-OCR
Ein gescanntes PDF ist im Grunde ein Foto von Papier — du siehst den Text, aber du kannst ihn nicht markieren, durchsuchen oder kopieren. Um es nutzbar zu machen, brauchst du OCR (Texterkennung). Die meisten Online-OCR-Tools verlangen Upload und Konto. So machst du OCR kostenlos und komplett im Browser.
Was OCR wirklich macht
OCR scannt jedes Seitenbild, erkennt Buchstabenformen und wandelt sie in echten Unicode-Text um. Das ursprüngliche Layout bleibt erhalten — das Ergebnis sieht aus wie der Scan, aber darunter liegt nun durchsuchbarer Text. Ein 10-seitiger Scan läuft je nach CPU in 10–30 Sekunden durch.
Warum Browser-OCR besser ist als Cloud-OCR
Cloud-OCR-Dienste (auch die kostenlosen) laden dein gescanntes Dokument auf ihre Server. Wenn dein Scan einen Ausweis, eine Steuererklärung oder einen Vertrag enthält, hast du es gerade einem Dritten übergeben. Browser-OCR führt die Erkennungs-Engine (Tesseract.js, kompiliert zu WebAssembly) komplett auf deinem Gerät aus — die Datei verlässt deinen Browser nie.
So machst du OCR für ein gescanntes PDF im Browser
Öffne das OCR-Tool, ziehe dein gescanntes PDF rein, wähle die Dokumentsprache (Deutsch, Englisch, Französisch, Spanisch, Italienisch, Portugiesisch, Niederländisch, Polnisch, Japanisch, Koreanisch, Hindi, Arabisch, Chinesisch — und 90+ weitere) und klicke auf Verarbeiten. Die Ausgabe ist ein durchsuchbares PDF, das du herunterladen kannst. Öffne es in einem PDF-Viewer und nutze Strg+F zum Suchen.
Schnell-Tipp: Die OCR-Genauigkeit hängt von der Scan-Qualität ab. Wenn der Text verstümmelt rauskommt, scanne mit 300 DPI neu. Drehe schiefe Seiten erst mit dem Drehen-Tool — schon 5° Schräglage verschlechtern die Erkennung deutlich.
OCR auf gescanntes PDF anwenden
Kostenlos, kein Upload, unterstützt 100+ Sprachen inklusive Arabisch, Hindi, Chinesisch, Japanisch, Koreanisch.
OCR-Tool öffnen →