KLUMPP OCR Extractor (KOE)

Automatisierte Archivierung Ihrer Scanbelege

Direkter Scan in das ELO Archiv

Scannen Sie Ihre Dokumente schnell und unkompliziert über Ihren Scanner in das ELO Archiv. Die Ablage und Verschlagwortung wird automatisiert durch den Dienst ausgeführt. Sie können auch eine Massenverarbeitung durchführen. Das heißt, Sie scannen z.B. mehrere Dokumente auf einmal ein. Die Separierung der einzelnen Dokumente sowie die Verschlagwortung und Archivierung wird durch unseren internen KOE-Dienst durchgeführt. 

Funktionsweise

Über OCR-Zonen werden die relevanten Daten (wie Dokumententyp, Indexierung) gezielt extrahiert.  Diese Daten werden aus dem Volltext des Dokumentes entnommen. Die korrekte Dokumentenablage innerhalb des ELO-Archives erfolgt in der Regel auf Basis der extrahierten Indexierung.

Zusätzliche Datenextraktion aus Datenbanken

Zusätzlich zum Volltext können Indexrelevante Informationen aus einer Datenbank gelesen und anschließend in die Verschlagwortung des Dokumentes geschrieben werden.      

Umgang mit OCR-Fehlern

OCR-Fehler können bei gescannten Dokumenten prinzipiell immer auftreten. Dafür kann es mehrere Ursachen geben. Potenzielle Fehlerquellen sind beispielsweise Kaffeeflecken, schlechte Scanqualität, geknickte Papiere, Stempel oder Handschriftliches, welches sich auf der zu extrahierenden OCR-Zone befindet. Sicher gibt es noch viele weitere Fehlerquellen, doch entscheidend ist, wie mit diesen Dokumenten umgegangen wird.

Sollte zum Beispiel ein Schlagwort nur zu einem Teil nicht mehr leserlich auf dem Dokument vorhanden sein, so besteht weiterhin die Möglichkeit das Wort in die Verschlagwortung des Dokumentes aufzunehmen. Die Entscheidung, wann ein Begriff in die Verschlagwortung aufgenommen wird und wann nicht, wird über einen sogenannten Schwellenwert definiert.

Features im Überblick

  • Vollautomatische Verschlagwortung und Archivierung von Scanbelegen
  • Verarbeitung von Stapeldokumenten
  • Hinzufügen eines oder mehrerer Hintergrundlogos
  • Erweiterte Indexierung über externe Datenbankabfragen
  • Interne Scripting-Schnittstelle für kundenspezifische Anpassungen
  • Starten eines Nachfolgeprozesses (z.B. Workflow in ELO)
  • OCR-Fehlerbehandlung über individuell konfigurierbare Vergleichswerte