19.6. OCR Texterkennung

Möchten Sie Texterkennung durchführen, muss das Paket ocrad installiert sein. Das Paket enthält ein Kommandozeilentool, das von Kooka verwendet wird, um die Textanalyse durchzuführen.

Sie können Dokumente im Lineart Modus scannen, im vorgeschlagenen Format speichern und dann aus dem Menü Bild die Texterkennung entweder nur für einen mit der Maus markierten Bereich oder für das gesamte Dokument starten.

In dem sich öffnenden Konfigurationsdialog sehen Sie im ersten Reiter einige Information zum verwendeten OCR Werkzeug. Hier kann auch die zu verwendende Layout Analyse eingestellt werden. Layout Analyse bedeuted, dass versucht wird, Text, der auf dem Original in mehreren Spalten angelegt ist, zu erkennen.

Der zweite Reiter zeigt Information zum Quellbild an (nur bei OCR des gesamten Bildes), der dritte Reiter erlaubt Konfiguration der Wörterbuchüberprüfung des Ergebnisses. Die Wörterbuchüberprüfung hilft Ihnen, falsch erkannte Wörter zu korrigieren und verbessert das Ergebnis erheblich.

Abbildung 19.5. Die Texterkennung von Kooka

Die Texterkennung von Kooka

Schalten Sie zum Fenster OCR Ergebnis um, sehen Sie den Text, der eventuell von Ihnen noch korrigiert werden muss. Es öffnet sich ein Fenster, das zum Wörterbuch gehört und Vorschläge zur Korrektur anbietet. Beachten Sie die Farbmarkierungen im Bild- und Textfenster von Kooka. Zur Weiterverarbeitung kann der Text über das Menü Datei mit dem Punkt Speichere OCR Ergebnis-Text gespeichert werden. Jetzt könn Sie den Text mit OpenOffice oder KWrite bearbeiten.


SUSE LINUX 9.2