Skip links

Mehr als OCR: KI-basierte Dokumentenverarbeitung mit AWS Textract

In der sich ständig weiterentwickelnden Landschaft der Cloud-Dienste sind Unternehmen und Entwickler immer auf der Suche nach leistungsstarken Tools, die Arbeitsabläufe optimieren und die Effizienz steigern können. Ein Dienst, der viel Aufmerksamkeit erhalten hat, ist Amazon Web Services (AWS) Textract. In diesem Artikel werden die Möglichkeiten von AWS Textract untersucht und seine Funktionen, Vorteile und ein spezieller Anwendungsfall beschrieben.

Was ist AWS Textract?

AWS Textract ist ein Managed-Service basierend auf maschinellem Lernen (ML), der automatisch Text, Handschrift und Daten aus gescannten Dokumenten extrahiert. Im Gegensatz zu einfachen OCR-Lösungen (Optical Character Recognition), die nur Text lesen, geht Textract einen Schritt weiter und versteht das Layout des Inhalts und die Beziehungen zwischen den extrahierten Informationen. Diese Fähigkeit macht es zu einem unverzichtbaren Werkzeug für Unternehmen, die ihre Dokumenten-Workflows ohne großen manuellen Aufwand digitalisieren wollen.

Hauptfunktionen von AWS Textract

  • Text- und Datenextraktion: Textract kann eine Vielzahl verschiedener Aarten von Dokumenten, einschließlich Formularen und Tabellen, verarbeiten und daraus Text und Daten präzise extrahieren.
  • Handschrifterkennung: Eines der herausragenden Merkmale von Textract ist die Fähigkeit, handschriftliche Notizen zu verarbeiten. Dadurch ist es deutlich breiter einsetzbar als Lösungen, die nur gedruckten Text verarbeiten können.
  • Erkennung von Formularen und Tabellen: Textract identifiziert die Struktur von Formularen und Tabellen und ermöglicht so eine bessere Extraktion und Analyse strukturierter Daten..
  • Integration und Skalierbarkeit: Lässt sich problemlos in andere AWS-Services integrieren und bietet so eine skalierbare Lösung, die mit Ihren Geschäftsanforderungen wachsen kann.
  • Sicherheit und Compliance: Wie bei allen AWS-Services gewährleistet Textract ein hohes Maß an Sicherheit und Compliance und schützt Ihre Daten während des gesamten Extraktionsprozesses.

Vorteile von AWS Textract aus fachlicher Sicht

  • Effizienz und Zeitersparnis: Durch die Automatisierung des Datenextraktionsprozesses können Unternehmen viel Zeit einsparen und so Ressourcen für wichtigere Aufgaben freisetzen.
  • Genauigkeit und Zuverlässigkeit: Durch den Einsatz fortschrittlicher ML-Modelle bietet Textract eine hohe Genauigkeit bei der Datenextraktion und reduziert die mit der manuellen Dateneingabe verbundenen Fehler.
  • Kosteneinsparungen: Reduziert den Bedarf an manueller Dokumentenverarbeitung, was zu Kosteneinsparungen für Unternehmen führt.
  • Verbesserte Datenanalyse: Durch die Digitalisierung und Strukturierung von Daten ermöglicht Textract eine tiefere Datenanalyse und einen besseren Einblick.

Nutzung von AWS Textract für die Verarbeitung von Versicherungsanträgen

Unser Kunde, ein Versicherungsunternehmen, stand vor der Herausforderung, handschriftliche Versicherungsanträge zu verarbeiten. Herkömmliche OCR-Lösungen, einschließlich derer von bekannten Anbietern von Dokumentenverarbeitungslösungen, waren aufgrund der komplexen und variablen Natur von Handschrift unzureichend.

AWS Textract erwies sich als eine gute Lösung. Seine hochentwickelten Algorithmen für maschinelles Lernen eignen sich hervorragend für die Erkennung handschriftlicher Inhalte, eine Aufgabe bei der herkömmliche OCR-Lösungen nicht die notwendige Genauigkeit erreichen können. 

Hohe Genauigkeit und Konfidenzwerte

AWS Textract extrahiert nicht nur Text mit bemerkenswerter Genauigkeit, sondern weist auch jedem extrahierten Textteil Konfidenzwerte zu. Diese Funktion ist für unseren Kunden von entscheidender Bedeutung, da sie es ihm ermöglicht, die Verarbeitung von Antragsformularen mit hohen Konfidenzwerten zu automatisieren. Das heisst, Formulare, die Textract mit Konfidenzwerten versieht, die den Schwellenwert unseres Kunden erreichen oder überschreiten, werden automatisch verarbeitet, was die Effizienz erhöht und die manuelle Überprüfung minimiert.

    {
      "BlockType": "LINE",
      "Confidence": 99.75729370117188,
      "Text": "Chicago",
      "Geometry": {
        "BoundingBox": {
          "Width": 0.10312779992818832,
          "Height": 0.02201165445148945,
          "Left": 0.36064571142196655,
          "Top": 0.5263997912406921
        },
        "Polygon": [
          {
            "X": 0.3606738746166229,
            "Y": 0.5263997912406921
          },
          {
            "X": 0.4637735188007355,
            "Y": 0.5264415740966797
          },
          {
            "X": 0.4637455642223358,
            "Y": 0.54841148853302
          },
          {
            "X": 0.36064571142196655,
            "Y": 0.5483691692352295
          }
        ]
      },

API-Antwort mit Konfidenzwert zusammen mit dem handgeschriebenen Formular.

Human-in-the-Loop für die Validierung

Für Antragsformulare, bei denen die Konfidenzwerte von Textract unter dem von unserem Kunden gewünschten Schwellenwert liegen, wird ein «Human-in-the-Loop»-System eingesetzt. Diese Formulare werden zur Überprüfung an menschliche Mitarbeiter weitergeleitet, um die Genauigkeit aller verarbeiteten Dokumente zu gewährleisten. Dieser Ansatz kombiniert nahtlos automatisierte Effizienz mit der Präzision menschlicher Kontrolle.

Vorgefertigte Benutzeroberfläche, die von AWS zu Demonstrationszwecken bereitgestellt wird

Der nächste Schritt

Die oben beschriebenen Funktionen und Möglichkeiten sind nur der Anfang. Textract kann nicht nur Dokumente betreffend des Layouts analysieren, sondern auch Fragen zum Inhalt beantworten. Mit anderen Worten, es versteht den Inhalt des Dokuments auf einer semantischen Ebene. Dies birgt ein großes Potenzial, da Daten auch dann extrahiert werden können, wenn der Formulartyp unbekannt ist oder variiert.

Beispiel für ein deutsch- und französischsprachiges Formular zur Ummeldung von Auto-Kennzeichen. Textract versteht den Inhalt und gibt eine passende Antwort.

Weitere Überlegungen

Ich sehe die folgenden Vorteile und Herausforderungen bei der Verwendung von AWS Textract aus betrieblicher und technischer Sicht:

Vorteile:

  • Solide Handschrifterkennung: In unseren Analysen war die Genauigkeit etwa 20 Mal besser als bei der Verwendung eines herkömmlichen Tools
  • Keine Konfiguration erforderlich: Es ist keine Konfiguration für ein bestimmtes Formular oder eine bestimmte Dokumentenstruktur erforderlich. Folglich ist der Prozess unempfindlich gegenüber Änderungen im Layout der zu verarbeitenden Formulare.
  • Skalierbarkeit: Wird von AWS als verwalteter Service auf einer Pay-per-Use-Basis bereitgestellt.

 

Herausforderungen:

  • Nicht in allen Regionen verfügbar: Textract ist z.B. noch nicht in der AWS-Region Schweiz verfügbar. Dies kann für einige Anwendungen ein Problem darstellen.
  • Komplexes Preismodell: Die Preisgestaltung hängt von den verwendeten Funktionen ab (z. B. Textextraktion, Tabellenextraktion, Formularextraktion) und variiert um den Faktor 40. Daher ist es wichtig, den Anwendungsfall genau zu analysieren, um zuverlässige Preisinformationen zu erhalten.

Fazit

Die Integration von AWS Textract geht über die herkömmlichen OCR-Funktionen hinaus. Für unsere Kunden ist Textract ein revolutionäres Werkzeug, das es ihnen ermöglicht, handgeschriebene Antragsformulare effizient und mit hoher Genauigkeit zu verarbeiten. Dieses Beispiel einer innovativen Dokumentenverarbeitung zeigt, wie fortschrittliche Technologie langjährige Herausforderungen der Branche überwinden und neue Standards für betriebliche Effizienz und Kundenservice setzen kann.

Explore
Drag