ScanAll-Logo

Scan-As-Scan-Can® – Scannen und Digitalisieren in Perfektion!

BlueStar® – Die Leistungsmarke eines führenden Scandienstleisters

BlueStar-Grafik Volltext-OCR/ICR

Volltext-OCR/ICR

Nicht einfach nur Scans ... sondern weiterverwendbare Texte.

Jeder Beleg durchläuft einen Texterkennungsprozess. Wir lesen hierbei nicht nur einzelne Felder für die Indexierung aus, sondern immer auch den Volltext. Dieser Text wird in das PDF-Dokument integriert und steht somit für eine Volltextsuche zur Verfügung.

Das eigentliche Bild des Dokuments verändert sich dabei nicht, da der Text als zusätzliche Ebene eingebunden wird. Selbst eine Weiterverwendung der Texte wie für "Copy & Paste" oder in Textverarbeitungsprogrammen ist möglich.

Mit unseren Scans stehen Ihnen Copy & Paste sowie die Volltext-Suche zur Verfügung.

Dank dieses Vorgehens können Dokumente einfach und schnell mit verschiedensten Suchroutinen aufgefunden und bearbeitet werden. Alle Such- und Textfunktionen stehen auch gänzlich ohne Dokumentenmanagementsystem – einfach mit Windows®- und Adobe® Acrobat/Reader®-Bordmitteln – zur Verfügung.

Optimale Texterkennung durch Farbeliminierung und ausgefeiltes Image-Processing

Der Text wird vom Hintergrund separiert, also noch vor der Texterkennung freigestellt und in eine separate Ebene abgelegt. Auf diese greift im Anschluss die OCR-Maschine zu. Dieser Textlayer wird weiter durch verschiedenste Prozesse – z. B. die Linien- und Konturenverstärkung (besonders wichtig bei Faxen oder Nadeldrucken) – speziell aufbereitet. Das nachfolgende Deskewing (Geraderichten) wird auf Farb- oder Graustufenebene (niemals nur in S/W, da eine 1-Bit-Information höchstens um ein Pixel verschoben, aber nicht wirklich gerade gerichtet werden kann) ausgeführt. Zusätzlich kommt eine Kontrastverstärkung und Gammakorrektur, sowie eine Schriftfreistellung (Umsäumung von Schriften, die z. B. durch Textmarker übermalt wurden, mit einem weißen Rand) hinzu. Bei Bedarf kann im Image-Processing auch eine Eliminierung von Textmarkern oder über der Schrift liegender Farbe erfolgen. Farbige Schriften werden nach S/W auf 24-Bit-Basis mit entsprechenden Filtern gedithert. Es folgt eine verlustfreie Komprimierung des Textlayers mit neuesten und aufwändigen Wavelet-Algorithmen.

Die Volltext-OCR/ICR gehört bei uns zum Standard und kostet keinen Aufpreis!

« Seite 11 von 20 »

Mit unserer BlueStar®-Scantechnologie garantieren wir Ihnen den "schärfsten" Scan!

Bildnachweis: © 2009 Michael Lauterbach

Autor: Michael Lauterbach
Bearbeitung: Miriam Elting