Tutorial

Text aus gescanntem PDF extrahieren — kostenloses Browser-OCR

6 Min. Lesezeit · Tutorial · 2026-05

Ein gescanntes PDF ist im Grunde ein Foto von Papier — du siehst den Text, aber du kannst ihn nicht markieren, durchsuchen oder kopieren. Um es nutzbar zu machen, brauchst du OCR (Texterkennung). Die meisten Online-OCR-Tools verlangen Upload und Konto. So machst du OCR kostenlos und komplett im Browser.

Was OCR wirklich macht

OCR scannt jedes Seitenbild, erkennt Buchstabenformen und wandelt sie in echten Unicode-Text um. Das ursprüngliche Layout bleibt erhalten — das Ergebnis sieht aus wie der Scan, aber darunter liegt nun durchsuchbarer Text. Ein 10-seitiger Scan läuft je nach CPU in 10–30 Sekunden durch.

Warum Browser-OCR besser ist als Cloud-OCR

Cloud-OCR-Dienste (auch die kostenlosen) laden dein gescanntes Dokument auf ihre Server. Wenn dein Scan einen Ausweis, eine Steuererklärung oder einen Vertrag enthält, hast du es gerade einem Dritten übergeben. Browser-OCR führt die Erkennungs-Engine (Tesseract.js, kompiliert zu WebAssembly) komplett auf deinem Gerät aus — die Datei verlässt deinen Browser nie.

So machst du OCR für ein gescanntes PDF im Browser

Öffne das OCR-Tool, ziehe dein gescanntes PDF rein, wähle die Dokumentsprache (Deutsch, Englisch, Französisch, Spanisch, Italienisch, Portugiesisch, Niederländisch, Polnisch, Japanisch, Koreanisch, Hindi, Arabisch, Chinesisch — und 90+ weitere) und klicke auf Verarbeiten. Die Ausgabe ist ein durchsuchbares PDF, das du herunterladen kannst. Öffne es in einem PDF-Viewer und nutze Strg+F zum Suchen.

Schnell-Tipp: Die OCR-Genauigkeit hängt von der Scan-Qualität ab. Wenn der Text verstümmelt rauskommt, scanne mit 300 DPI neu. Drehe schiefe Seiten erst mit dem Drehen-Tool — schon 5° Schräglage verschlechtern die Erkennung deutlich.

OCR auf gescanntes PDF anwenden

Kostenlos, kein Upload, unterstützt 100+ Sprachen inklusive Arabisch, Hindi, Chinesisch, Japanisch, Koreanisch.

OCR-Tool öffnen →