Rechnungen, Verträge und gescannte Belege automatisch klassifizieren und auslesen, ohne dass ein Dokument Ihre Infrastruktur verlässt. DNA Solutions entwickelt Modelle zur Dokumentklassifikation und -extraktion: Im Canon-Projekt erreichte ein individueller SVM-Klassifikator 94,7 % Genauigkeit und übertraf Azure AI auf 2 von 3 Datensätzen (Baseline: 84,2 %). Betrieben in privaten Clouds, konform mit DSGVO und EU AI Act.
Wer Posteingang, Rechnungsverarbeitung oder Vertragsablage automatisiert, legt sensible Dokumente in die Hände eines KI-Systems. Genau deshalb gehört bei der Dokumentenautomatisierung die Datenhoheit an den Anfang: keine Daten, die die EU verlassen, Audit-Trails, die Ihre Aufsicht akzeptiert, ob DSGVO, EU AI Act oder BaFin. DNA Solutions entwickelt und betreibt diese Pipelines in privaten Cloud-Umgebungen. Im Canon-Projekt erreichte unser Klassifikator 94,7 % Genauigkeit (Baseline: 84,2 %).

Wir entwickeln und betreiben KI-, Daten- und Billing-Infrastruktur für europäische Unternehmen mit regulierten Workloads und transaktionsstarken Systemen.
Kundenergebnisse ansehenDurch die Optimierung von Softwarelizenzkosten haben wir für mehrere europäische Organisationen über 1 Mio. € an jährlichen Einsparungen erzielt.
Wir haben eine von Deloitte auditierte Billing-Plattform aufgebaut und betreiben sie: 300 Mio. € auditierte Transaktionen jeden Monat.
Ein Senior-Team aus Ingenieuren und Consultants in ganz Europa.
T-Systems, Satellic und die Europäische Kommission haben uns über mehrjährige Programme hinweg beauftragt.

Wir bauen die Pipeline in Ihrer Cloud und Ihrer Jurisdiktion. Jede der folgenden Fähigkeiten wird vor einem breiteren Rollout an einer Stichprobe Ihrer eigenen Dokumente gemessen.
Die Pipeline verarbeitet Rechnungen und strukturierte Dokumente in hohem Volumen und extrahiert Positionen, Summen und Referenzfelder automatisch in Ihre nachgelagerten Systeme. Wir bauen sie auf OCR mit Tesseract auf und stimmen die Merkmalsextraktion auf die wiederkehrenden Formate ab, die Ihr Betrieb am häufigsten erzeugt. Die Extraktionsqualität bleibt konstant, wenn das Volumen wächst, und jedes extrahierte Feld lässt sich auf das Quelldokument zurückverfolgen. So hält der Durchsatz, auf den sich Ihre Finanz- und Betriebsteams verlassen, ohne manuelles Nacherfassen.
Wir trainieren ein Klassifikationsmodell pro Dokumenttyp. Im Canon-Projekt übertraf unser individueller SVM-Klassifikator Azure AI auf 2 von 3 Datensätzen und erreichte 94,7 % Genauigkeit gegenüber einer Baseline von 84,2 %, auf Basis von word2vec- und tf-idf-Merkmalen. Jedes Modell ist auf die Dokumentklassen und den Präzisionsschwellenwert dimensioniert, den der Workflow verlangt. Das hält die Klassifikation erklärbar, und die Genauigkeit bleibt auf den Formaten stabil, die für Ihren Betrieb zählen.
Die Pipeline extrahiert strukturierte Metadaten aus unstrukturierten Dokumenten: Daten, Parteien, Beträge und Dokumenttyp. Diese Ausgabe speist Suche, Indexierung und Audit-Trails mit der Präzision, die auditierte Workflows verlangen. Jedes extrahierte Feld bleibt auf sein Quelldokument zurückverfolgbar. Nachgelagerte Teams arbeiten so mit verlässlichen Daten, und Prüfer können jeden Wert bis zur Seite zurückverfolgen, von der er stammt, ohne den Pfad nachträglich rekonstruieren zu müssen.
Für die Dokumentklassen, bei denen ein Fehler Kosten verursacht, leitet die Pipeline Vorhersagen mit niedriger Konfidenz an einen menschlichen Prüfer weiter, bevor das Ergebnis weiterfließt. Den Konfidenz-Schwellenwert setzen wir pro Dokumenttyp, sodass der Großteil der sauberen Dokumente automatisch durchläuft, während Sonderfälle in einer Prüf-Queue landen. Jede Korrektur fließt zurück in die Trainingsdaten. Das Modell verbessert sich auf den Formaten, die Ihr Betrieb täglich verarbeitet, und die Genauigkeit hält, wenn dieselben Dokumente im Audit wieder auftauchen.
Individuelle KI für europäische Unternehmen, betrieben in privaten Clouds, ohne OpenAI- oder Hyperscaler-Abhängigkeit. Die drei Workloads unten decken Dokumentklassifikation, Extraktion pro Dokumenttyp und strukturierte Metadaten ab, jedes Modell dimensioniert auf die Präzision, die der Workflow verlangt.
Projekt besprechenVerarbeitung von Rechnungen und strukturierten Dokumenten in hohem Volumen: Positionen, Summen und Referenzfelder fließen automatisch in nachgelagerte Systeme. Aufgebaut auf OCR mit Tesseract, mit Merkmalsextraktion abgestimmt auf Ihre wiederkehrenden Formate.
Ein Klassifikationsmodell pro Dokumenttyp, dimensioniert auf die Präzision, die der Workflow verlangt. Im Canon-Projekt erreichte ein individueller SVM-Klassifikator 94,7 % Genauigkeit und übertraf Azure AI auf 2 von 3 Datensätzen (Baseline: 84,2 %), auf Basis von word2vec- und tf-idf-Merkmalen.
Extraktion strukturierter Metadaten aus unstrukturierten Dokumenten: Daten, Parteien, Beträge und Dokumenttyp. Die Ausgabe speist Suche, Indexierung und Audit-Trails mit der Präzision, die auditierte Workflows verlangen.
Telekom, Einzelhandel und Mautinfrastruktur verarbeiten jeweils andere Dokumentklassen. Das Modell trainiert auf Ihren eigenen Daten, in Ihrer eigenen Cloud, und die Daten verlassen sie nie. So wird die Pipeline pro Branche abgestimmt:
Klassifikation und Datenextraktion aus Abrechnungsdaten, Verträgen und operativen Dokumenten in Telekom- und Medien-Workflows, in den Volumen, die Netzbetreiber erzeugen.
Verarbeitung von Rechnungen und Lieferantendokumenten in hohem Volumen für Einzelhandel und Vertrieb, mit extrahierten Feldern, die direkt in nachgelagerte Finanzsysteme fließen.
Extraktion strukturierter Daten aus Maut- und Infrastrukturdokumentation, als Grundlage für die operativen und Audit-Aufzeichnungen, auf die diese Systeme angewiesen sind.
Individuelle KI-Modelle, gebaut in europäischen Clouds, abgestimmt auf die Genauigkeit, die auditierte Workflows verlangen, ohne Drittanbieter-Abhängigkeit.

Ein individueller SVM-Klassifikator, trainiert auf Canons eigenen Daten: 94,7 % Benchmark-Genauigkeit ohne Drittanbieter-KI-Abhängigkeit.
94,7 % vs. 84,2 % mit Azure AIEin einziges Payment-Gateway, das Transaktionen über eine Multi-Produkt-Plattform hinweg vereinheitlicht, mit eingebauter Abstimmung.
Ein Gateway, jedes ProduktEntscheider über die Daten-, Klassifikations- und Finanzplattformen, die wir geliefert haben.
"Wir haben gemeinsam an einer innovativen Recruiting-App gearbeitet, und am meisten beeindruckt haben mich die unterstützende Atmosphäre und die große Eigenverantwortung für jedes Teammitglied."
"DNA unterstützt uns dabei, digitale Systeme in großem Maßstab bereitzustellen, damit wir unsere Kunden digital bedienen können. Das Team reagiert schnell auf Anfragen und bringt zugleich proaktiv eigene Ideen und Vorschläge ein."
"DNA Solutions hat Online-Tools geliefert, die den Mitarbeitenden und Endkunden unseres Auftraggebers den Alltag erleichtern. So lassen sich Vorgänge heute in maximal zwei statt fünf Tagen bearbeiten."
Was Kunden zu Genauigkeit, Hyperscaler-Unabhängigkeit und AI-Act-Konformität fragen.
DNA Solutions baut Pipelines für Rechnungen, Verträge und gescannte Belege, und für die gemischten Dokumentströme, die der Unternehmensalltag erzeugt. Unser Team trainiert ein Klassifikationsmodell pro Dokumenttyp und extrahiert dann die strukturierten Felder, die jeder Typ trägt: Daten, Parteien, Beträge, Summen und Referenznummern, direkt in Ihre nachgelagerten Systeme. Die Pipeline ist auf die Dokumentklassen dimensioniert, die Ihr Workflow am häufigsten verarbeitet, damit die Genauigkeit auf den Formaten hält, die zählen. Taucht ein neuer Dokumenttyp auf, ergänzen wir eine Klasse und trainieren auf der bestehenden Pipeline nach. Jedes extrahierte Feld lässt sich auf sein Quelldokument zurückverfolgen, und genau das lässt die Ausgabe einem Audit standhalten.
Im Canon-Projekt zur Dokumentklassifikation erreichte unser individueller SVM-Klassifikator 94,7 % Genauigkeit und übertraf Azure AI auf 2 von 3 Datensätzen, gegenüber einer Baseline von 84,2 %. Diese Zahl gilt für einen Dokumentbestand unter einer Konfiguration, wir behandeln sie also als Referenzpunkt. Die Genauigkeit hängt von den Dokumentklassen ab, die Sie verarbeiten, von der Qualität der Scans und von den verfügbaren Trainingsdaten. Wir stimmen jedes Modell auf die Präzision ab, die der Workflow verlangt. Vor einem breiteren Rollout messen wir die Genauigkeit an einer Stichprobe Ihrer eigenen Dokumente, damit die Zahl, die Sie sehen, zu Ihren eigenen Formaten passt. Wo eine Klasse so wichtig ist, dass Fehler Kosten verursachen, leiten wir Vorhersagen mit niedriger Konfidenz zur menschlichen Prüfung weiter und speisen die Korrekturen zurück ins Training.
Die Pipeline kombiniert OCR mit Tesseract für die Texterkennung, word2vec und tf-idf für die Merkmalsextraktion und einen SVM-Klassifikator, abgestimmt pro Dokumenttyp. Wir wählen etablierte Komponenten, die zum Dokumentbestand passen. Das hält die Pipeline erklärbar: Wir können nachvollziehen, warum ein bestimmtes Dokument so klassifiziert wurde, wie es klassifiziert wurde. Das zählt, wenn ein Prüfer oder ein Fachexperte eine Entscheidung hinterfragt. Wir betreiben den Stack auf Ihrem eigenen Cloud-Account oder in Ihrer On-Premise-Umgebung, ohne proprietäre Lizenz, die Sie bindet, und jede Stufe speist Suche, Indexierung und Audit-Trails. Verschiebt sich der Dokumentenmix, trainieren wir nach oder passen die betroffene Stufe auf der bestehenden Pipeline an.
Ja. Die Parsing-Pipeline ist darauf ausgelegt, Rechnungen und strukturierte Dokumente in hohem Volumen zu verarbeiten und Positionen, Summen und Referenzfelder automatisch in nachgelagerte Systeme zu extrahieren. Wir stimmen die Merkmalsextraktion auf die wiederkehrenden Formate ab, die Ihr Betrieb erzeugt. So bleibt der Durchsatz konstant, wenn das Volumen wächst, und die extrahierten Felder bleiben für das Audit auf das Quelldokument zurückverfolgbar. Wir dimensionieren die Pipeline auf Ihre Produktionsvolumen und validieren sie an einer Stichprobe Ihrer eigenen Rechnungen, bevor sie breiter ausgerollt wird, damit der Durchsatz in Produktion dem entspricht, was wir gemessen haben. Wo ein Wert Kosten trägt, gehen Extraktionen mit niedriger Konfidenz zur menschlichen Prüfung, bevor sie weiterfließen, und diese Korrekturen fließen zurück ins Modell. Die Pipeline nimmt Ihr Rechnungsvolumen ohne manuelles Nacherfassen auf, und der Audit-Trail bleibt intakt.