DIGI-XTRACT

Eine vollautomatisierte Datenextraktionslösung, die menschliches Eingreifen überflüssig macht.

DIGI-XTRACT ist eine OCR-Lösung (Optical Characteristic Recognition, übersetzt Texterkennung), die auf der Grundlage von Machine Learning und Deep Learning-Technologie aufgebaut ist, um die Klassifizierung von Dokumenten, die Datenextraktion und die Qualitätskontrolle für verschiedene Dokumenttypen durchzuführen.

Verarbeitete Dokumenttypen sind u.a. Rechnungen, Antragsformulare, historische Dokumente, handschriftliche Formulare, etc.

DIGI-XTRACT ist an individuellen Kundenanforderungen anpassbar, z.B. spezielle Dokumenttypen oder mehrsprachige Dokumente. Der Dienst kann sicher und aus der Ferne im Datenzentrum von DIGI-TEXX gehostet werden oder einfach in den Räumlichkeiten des Kunden unter Verwendung modernster Technologien bereitgestellt werden.

DIGI-XTRACT KOMPONENTEN

AUTO CLASSIFY

Mit AutoClassify-Komponente erkennt und klassifiziert DIGI-XTRACT verschiedene Dokumenttypen automatisch auf der Grundlage von Vektorisierung und Big Data Analysen. Anschließend leitet das System das Dokument an die AutoExtract-Komponente weiter, um die Daten mit optimierter Genauigkeit zu extrahieren.

Zu den üblichen Dokumenttypen von Einzelpersonen/Organisationen gehören:

  • Antragsformulare, historische Dokumente (Heiratsurkunde, Sterbeurkunde,…)
  • Identitätsdokumente: Personalausweis, Reisepass, Geburtsurkunde
  • Arbeitsdokumente: Arbeitsvertrag, Arbeitserlaubnis, Bestätigungsschreiben
  • Einkommensnachweise: Kontoauszug, Gehaltsabrechnung
  • Finanz- und Buchhaltungsdokumente: Rechnung, Vertrag, Jahresabschluss,…
  • Andere Dokumenttypen: Prüfungsbogen, Katalogbuch, Grundbuch.

AUTO EXTRACT

Bei vordefinierten zu extrahierenden Datenfeldern wählt AutoExtract-Komponente das richtige Datenfeld aus dem Bild oder der Datei aus und extrahiert die benötigten Daten mit hoher Sicherheit und Qualität auf der Grundlage des Bildausschnittes. Die Informationen auf Kundendokumenten werden hiermit nicht von Dritten eingesehen oder weitergegeben.

AutoExtract erstellt für jedes vordefinierte Datenfeld einen Wert im Sinne des Konfidenzniveaus, sogenannten Konfidenzwert. Dieser Wert wird zur Bestimmung der Qualität der Datenextraktion nach festgelegten Regeln der AutoQC-Komponente verwendet.

AUTO QC

AutoQC-Komponente führt die Qualitätskontrolle basierend auf einer komplexen Scoring-Kombination bestehend aus:

  • Gemeinsame Regeln wie das Format von IBAN-Nummer, Personalausweis, Postleitzahl, Alter, Geschlecht, Datum/Uhrzeit usw.
  • Geschäftsregeln auf der Grundlage des Geschäftsbereichs des Kunden
  • Gruppenbeziehungen zwischen Datenfeldern wie {Alter, Geschlecht, Krankheit}, {Position, Gehalt, Branche}, {Krankenhaus, Behandlung, Alter, Geschlecht}, etc.
  • Analyse der Bildqualität: klar, unklar, unscharf, schief, gedreht, verzerrt, niedrige Auflösung

Bei der traditionellen Qualitätskontrolle gibt es verschiedene Methoden mit menschlicher Beteiligung. Mit Auto QC wird der Prozess in Datenebenen unterteilt und durch Metadaten in verschiedenen Schritten nachverfolgt. Die automatische Qualitätskontrolle durchläuft 100 Prozent der verarbeiteten Daten und weist auf mögliche Fehler hin.

Anhand der Bewertung kann Auto QC den potenziellen Fehler erkennen und die Straight-Through-Rate (STR) steuern, so dass das System entscheiden kann, ob es die Daten durchlässt oder sie zur Qualitätsverbesserung an die Datenkorrektur weiterleitet.

AUTO CLASSIFY

Mit AutoClassify-Komponente erkennt und klassifiziert DIGI-XTRACT verschiedene Dokumenttypen automatisch auf der Grundlage von Vektorisierung und Big Data Analysen. Das System leitet das Dokument dann an die AutoExtract-Komponente weiter, um die Daten für eine optimierte Genauigkeitsrate zu extrahieren.

Zu den üblichen Dokumenttypen von Einzelpersonen/Organisationen gehören:

  • Antragsformulare, historische Dokumente (Heiratsurkunde, Sterbeurkunde,…)
  • Identitätsdokumente: Personalausweis, Reisepass, Geburtsurkunde
  • Arbeitsdokumente: Arbeitsvertrag, Arbeitserlaubnis, Bestätigungsschreiben
  • Einkommensnachweise: Kontoauszug, Gehaltsabrechnung
  • Finanz- und Buchhaltungsdokumente: Rechnung, Vertrag, Jahresabschluss,…
  • Andere Dokumenttypen: Prüfungsbogen, Katalogbuch, Grundbuch.

AUTO EXTRACT

Bei vordefinierten zu extrahierenden Datenfeldern wählt AutoExtract-Komponente das richtige Datenfeld aus dem Bild oder der Datei aus und extrahiert die benötigten Daten mit hoher Sicherheit und Qualität auf der Grundlage des Bildausschnittes. Die Informationen auf Kundendokumenten werden hiermit nicht von Dritten eingesehen oder weitergegeben.

AutoExtract erstellt für jedes vordefinierte Datenfeld einen Wert im Sinne des Konfidenzniveaus, sogenannten Konfidenzwert. Dieser Wert wird zur Bestimmung der Qualität der Datenextraktion nach festgelegten Regeln der AutoQC-Komponente verwendet.

AUTO QC

AutoQC-Komponente führt die Qualitätskontrolle basierend auf einer komplexen Scoring-Kombination bestehend aus:

  • Gemeinsame Regeln wie das Format von IBAN-Nummer, Personalausweis, Postleitzahl, Alter, Geschlecht, Datum/Uhrzeit usw.
  • Geschäftsregeln auf der Grundlage des Geschäftsbereichs des Kunden
  • Gruppenbeziehungen zwischen Datenfeldern wie {Alter, Geschlecht, Krankheit}, {Position, Gehalt, Branche}, {Krankenhaus, Behandlung, Alter, Geschlecht}, etc.
  • Analyse der Bildqualität: klar, unklar, unscharf, schief, gedreht, verzerrt, niedrige Auflösung

Bei der traditionellen Qualitätskontrolle gibt es verschiedene Methoden mit menschlicher Beteiligung. Mit Auto QC wird der Prozess in Datenebenen unterteilt und durch Metadaten in verschiedenen Schritten nachverfolgt. Die automatische Qualitätskontrolle durchläuft 100 Prozent der verarbeiteten Daten und weist auf mögliche Fehler hin.

Anhand der Bewertung kann Auto QC den potenziellen Fehler erkennen und die Straight-Through-Rate (STR) steuern, so dass das System entscheiden kann, ob es die Daten durchlässt oder sie zur Qualitätsverbesserung an die Datenkorrektur weiterleitet.

DIGI-XTRACT Eigenschaften

Automatische Extraktion von unstrukturierten/semi-strukturierten Daten

Wegfall manueller Dateneingabe

Integration von API-Gateways

Web-Überwachungsdienste für Echtzeit-Verfolgung und automatische Berichtsfunktion

Hohe Leistungsfähigkeit und Qualität

Hohe Verfügbarkeit von Backend-Verarbeitungssystemen

PROZESS DES PRODUKTS

STRAIGHT-THROUGH PROZESS (STP)/ AUTOMATISIERUNGSPROZESS

GARANTIERTER PROZESS/ AUTOMATISIERUNGSPROZESS MIT MENSCHLICHER ÜBERPRÜFUNG

GENAUIGKEITSRATE

Unsere Genauigkeitsrate berechnet einen Konfidenzwert, der die Sicherheit der aus dem Originalbild extrahierten Daten misst. Eine höhere Trefferquote, die von der Qualität des bewerteten Dokuments abhängt, führt zu einer besseren Datenqualität und unterstützt analytische Zwecke.

Bei DIGI-XTRACT ist die Genauigkeitsrate mit intelligenten Motoren ausgestattet, um sicherzustellen, dass die Qualität den Erwartungen des Kunden entspricht.

Die Genauigkeitsrate kann in verschiedenen Einheiten wie Zeichen, Wort, Feld und Zeile gemessen werden.

KUNDENSUPPORT

Wir unterstützen Sie mit unserem exzellenten Onboarding-Team sowie dem Kundenbetreuungsteam.

Alle Projekte werden rund um die Uhr durch unser Network Operating Center überwacht, um eine optimale Serviceverfügbarkeit zu gewährleisten.

DIGI-TEXX bietet eine End-to-End Kundenbetreuung von der ersten Analyse bis zur abschließenden Implementierung und Adjustierung bei Bedarf. Darüber hinaus begleitet das Kundensupport-Team die Kunden während des gesamten Prozesses, um einen reibungslosen Übergang und einen erfolgreichen Abschluss des Projektes sicherzustellen.

WAS UNS UNTERSCHEIDET?

01

AUTOMATISIERUNG MIT RUND UM DIE UHR ÜBERWACHUNG

Vollständig automatisierte Lösung ohne menschliches Eingreifen und ein transparenter Prozess mit Web Monitoring Services, die den Datenstatus für jeden Prozessschritt liefern.

02

EINFACHE INTEGRATION UND SCHNELLE EINRICHTUNG

Je nach Kundenanforderungen und -wünschen können alle kundenspezifischen Übertragungsmethoden wie Secure Transfer Protocols (STP), Application Programming Interface (API), E-Mail an Kundensystem angepasst und eingerichtet werden. Die Einrichtungsdauer beträgt ca. 2-4 Wochen.

03

FLEXIBLE PREISMODELL

Attraktives Preismodell auf der Grundlage von Transaktionen, Abonnements und festen Volumina, um den Bedürfnissen aller Kunden gerecht zu werden.

FALLSTUDIEN

Data Extraction Solution for Customer Onboarding Straight-Through Process

BUSINESS CHALLENGES Our Client We serve a leading international insurance and financial services company with over 1.5 million customers operating in Asia, Canada, and the …

Read More

Erfahren Sie mehr
INTELLIGENT DOCUMENT SCANNING 2

Intelligent Document Scanning Solution

The Intelligent Document Scanning Solution is designed for Customer Service (CS) at branches to process documents and detect appropriate document types,…
Erfahren Sie mehr

Durchgängiger Prozess für das Kunden-Onboarding

Eine automatische Lösung, bei der keine manuellen Eingriffe erforderlich sind und die die betriebliche Effizienz steigert
Erfahren Sie mehr