OCR-PDF

Wandeln Sie Ihre gescannten PDFs in DockDocs in durchsuchbaren, wiederverwendbaren Text um.

Gescanntes PDF ablegen

oder Datei hierher ziehen

Unterstützt PDFLokal verarbeitet – nicht hochgeladen

// Vorteile

Extrahieren Sie Text aus Scans ohne komplizierte Oberfläche

Scan hochladen, OCR anwenden, den extrahierten Text prüfen, kopieren oder herunterladen.

Wiederverwendbarer Text

Verwandeln Sie gescannte Seiten in durchsuchbaren Text.

OCR-Fortschritt

Zeigt den Fortschritt der Erkennung vor dem Ergebnis an.

Kopieren und herunterladen

Bietet textorientierte Aktionen für das Ergebnis.

// Workflow

Wie sich OCR-PDF in die Dokumentenarbeit einfügt

OCR-PDF hilft, bildbasierte Dokumente in durchsuchbaren und wiederverwendbaren Text umzuwandeln.

  1. 1

    Laden Sie ein gescanntes PDF hoch.

  2. 2

    Starten Sie die OCR-Texterkennung.

  3. 3

    Kopieren oder laden Sie den extrahierten Text herunter.

Häufige Fragen zur OCR von PDF

Wie führe ich mit diesem Werkzeug eine OCR an einem PDF durch?

Wählen Sie Ihr gescanntes PDF, stellen Sie die Sprache ein (Englisch oder vereinfachtes Chinesisch), legen Sie den gewünschten Seitenbereich fest und starten Sie. Das Werkzeug rendert jede ausgewählte Seite, erkennt den Text darauf und gibt Ihnen den extrahierten Text zum Kopieren oder Herunterladen. Alles geschieht direkt in Ihrem Browser.

Wird meine Datei auf einen Server hochgeladen?

Nein. Die OCR läuft vollständig in Ihrem Browser mit Tesseract.js, und Ihr PDF verlässt Ihr Gerät nie. Es gibt keinen Upload-Schritt, und bei uns wird nichts gespeichert, was es für sensible Scans wie Verträge oder Ausweise sicher macht.

Wie viele Seiten kann ich auf einmal verarbeiten?

Bis zu 3 Seiten pro Durchgang. Bei einem längeren Dokument legen Sie einen Seitenbereich fest (zum Beispiel 1-3), um auszuwählen, welche Seiten gelesen werden. Bei einer größeren Datei führen Sie es mehrmals für verschiedene Bereiche aus. Das PDF selbst muss außerdem 25 MB oder kleiner sein.

Welche Sprachen erkennt es?

Englisch (eng) und vereinfachtes Chinesisch (chi_sim). Sie wählen pro Durchgang eine Sprache, also die, die zum Haupttext der Seite passt. Bei gemischtsprachigen Dokumenten wird die von Ihnen gewählte Sprache bevorzugt.

Was bekomme ich zurück, und in welchem Format?

Sie erhalten reinen, kopierbaren Text. Wenn Sie mehrere Seiten verarbeiten, wird die Ausgabe durch einfache Überschriften „--- Page N ---“ getrennt, sodass Sie erkennen, welcher Text von welcher Seite stammt. Sie können ihn in die Zwischenablage kopieren oder als .txt-Datei herunterladen.

Warum ist der extrahierte Text fehlerhaft oder leer?

Die OCR-Genauigkeit hängt von der Scanqualität ab. Klare, hochauflösende, gerade Scans werden gut gelesen; unscharfe, schiefe, kontrastarme oder handschriftliche Seiten erzeugen Fehler oder kommen leer zurück. Das Werkzeug gibt einen Konfidenzwert aus, damit Sie einschätzen können, wie zuverlässig ein Ergebnis ist, und es teilt Ihnen mit, wenn kein Text erkannt werden konnte – versuchen Sie in dem Fall einen saubereren Scan. Beachten Sie, dass dieses Werkzeug für bildbasierte, gescannte PDFs gemacht ist: Wenn Ihr PDF aus einem Scan oder Foto entstanden ist, ist der „Text“ in Wirklichkeit nur ein Bild, das Sie nicht auswählen oder durchsuchen können – und genau das behebt die OCR.

Ist es kostenlos?

Ja, OCR PDF ist kostenlos. Da die Erkennung lokal in Ihrem Browser läuft, ist zum Extrahieren von Text kein Konto und keine Zahlung erforderlich.

Verlassen Sie sich nicht auf unser Wort – überzeugen Sie sich selbst

Dieses Tool läuft vollständig in Ihrem Browser. Ihre Datei verlässt niemals Ihr Gerät – sie wird auf keinen Server hochgeladen.

Überzeugen Sie sich selbst: Öffnen Sie die Entwicklertools Ihres Browsers (F12 oder Rechtsklick → „Untersuchen") → den Tab „Network / Netzwerk" → und führen Sie dann dieses Tool aus. Sie werden nicht sehen, dass Ihre Datei irgendwohin hochgeladen wird, denn die Verarbeitung findet lokal auf Ihrem Gerät statt.