Erstellen Sie Data Service Level Agreements (SLAs)
Der beste Ausgangspunkt – insbesondere um Ihren optimalen Aufnahmeansatz zu bestimmen – ist, Anwendungsfallanforderungen von Ihren Datenkonsumenten zu sammeln und rückwärts ein Daten-SLA zu entwickeln, das Themen wie:
- Was ist der geschäftliche Bedarf?
- Was sind die Erwartungen an die Daten, und wann müssen die Daten diese erfüllen?
- Wie wissen wir, wann der SLA erfüllt ist, und wie wird die Reaktion ausfallen, wenn der SLA nicht eingehalten wird?
Im Rahmen dessen sollten Sie versuchen, die Herausforderungen durch die entwickelten Anwendungsfälle zu skizzieren und entsprechend zu planen. Identifizieren Sie die spezifischen Quellsysteme, die Ihnen zur Verfügung stehen, und stellen Sie sicher, dass Sie wissen, wie Sie Daten daraus extrahieren können.
Automatisierte Datenerfassung
Mit zunehmendem Datenvolumen und Komplexität sind die Zeiten, in denen man auf manuelle Aufnahmelösungen zur Kuratierung einer so riesigen Menge unstrukturierter Daten angewiesen war, vorbei. Automatisierte Datenerfassungslösungen haben sich als Zeitersparnis erwiesen, Produktivitätssteigerung und Reduzierung manueller Schritte im Datenerfassungsprozess erwiesen.
Darüber hinaus bietet die Automatisierung die zusätzlichen Vorteile architektonischer Konsistenz, konsolidiertes Management, Sicherheit und Fehlermanagement. All dies trägt zu einer verkürzten Datenverarbeitungszeit bei.
Führen Sie Datenqualitätsprüfungen zum Zeitpunkt der Ausgabe durch – aber tun Sie dies vorsichtig
Der beste Zeitpunkt, um festzustellen, ob Sie ein Qualitätskontrollproblem haben, ist zum Zeitpunkt der Einnahme. Obwohl es keine skalierbare Möglichkeit gibt, Tests für jede mögliche Datenkorruption in der Pipeline zu erstellen, implementieren einige Organisationen Daten-Circuit Breaker, die den Datenaufnahmeprozess stoppen, wenn die Daten bestimmte Qualitätskontrollen nicht bestehen. Allerdings gibt es hier inhärente Kompromisse. Setzen Sie Ihre Datenqualitätsschwellen zu hoch, könnten Sie den Datenzugriff unnötig behindern; Setzt man sie zu niedrig, könnte Ihr gesamtes Data Warehouse kompromittiert werden.
Geben Sie hier Ihr Bestes, um ein Gleichgewicht bei der Installation Ihres Leistungsschalters zu finden. Und nutzen Sie Datenvisualisierung und Beobachtbarkeit, um Qualitätsprobleme frühzeitig im Prozess zu erkennen, damit Sie sie lösen können, bevor sie weit verbreitet werden.