Direkt zum InhaltDirekt zur SucheDirekt zur Navigation
▼ Zielgruppen ▼

Humboldt-Universität zu Berlin - Öffentliche Computerarbeitsplätze

Informationen zu Texterkennung (OCR)

Mit OCR (englisch für optical character recognition), auch bekannt als Texterkennnung, können Textauszüge eingescannter Dokumente in ein für die Verarbeitung mit dem Computer geeignetes Format umwandeln.

Ein konkreter Anwendungsfall wäre beispielsweise das kopieren eines Zitats aus von einer eingescannten Buchseite.

Voraussetzungen zum Benutzen der Texterkennung:
  • eingescannte Inhalte (Briefe, Buchseite oder Ähnliches) in einer PDF-Datei
  • aktives CMS-Benutzerkonto oder freigeschaltetes Universitätsbibliotheksbenutzerkonto
Anleitung
  1. Melden Sie sich mit ihrem persönlichen Benutzerkonto über die Schaltfläche Windows-Anmeldung an.
  2. Öffnen Sie das eingescannte Dokument mit dem Programm Adobe Acrobat (im Startmenü verfügbar).
  3. Wählen Sie über die Menüleiste oben den Punkt Anzeige -> Werkzeuge -> Texterkennung aus:
  4. Klicken Sie auf der rechten Seite im aufgeklappten Menü auf den Punkt In dieser Datei:
  5. Es öffnet sich ein Dialogfenster, in dem eine Übersicht der aktuellen Texterkennungseinstellungen zu sehen ist:


    Option: Wenn Sie die Texterkennung mit einer anderen Sprache als Deutsch durchführen wollen, klicken Sie auf die Schaltfläche Bearbeiten, dann öffnet sich ein weiteres Fenster. Dort können Sie eine andere Sprache wählen:
  6. Klicken Sie auf OK, dann wird die Texterkennung für alle Seiten des PDF-Dokuments durchgeführt.
    Hinweis: Bei sehr großen Dateien (viele MB groß und/oder sehr viele Seiten) dauert die Texterkennung dementsprechend lange. Bitte haben Sie Geduld.