Klassifizierung

InputManagement verwendet Künstliche Intelligenz und Maschinelles Lernen, um Dokumente zu klassifizieren. Derzeit werden zwei Klassifikatoren unterstützt: optisch und textuell.

Um Dokumente zu klassifizieren, stellen Sie sicher, dass die Klassen existieren und korrekt konfiguriert sind.

Training

Die Klassifizierung muss trainiert werden. Das Training erfolgt im Kontext einer Pipeline. Pipelines können im Administrationsbereich konfiguriert werden. Jede Pipeline hat mehrere Klassendefinitionen. Eine Klassendefinition ist ein Verweis auf eine Klasse mit einer Sammlung von Beispieldokumenten. Diese Beispiele können direkt in die Klassendefinition hochgeladen werden. Je besser die Beispiele für jede Klasse sind, desto besser wird die spätere Klassifizierung sein.

Ein gutes Trainingsset hat die folgenden Eigenschaften:

  • keine Anhänge (zum Beispiel von Forderungsanmeldungen und Kontoauszügen)
  • nur die ersten 1-5 Seiten längerer Dokumente
  • keine extra großen Dokumente
  • keine handschriftlichen Dokumente
  • gute Scanqualität (300 dpi)
  • nur PDFs
  • 80 Dokumente pro Klasse e

e