Die Kernaufgabe von SAP Data Services ist es, Unternehmen im Umgang mit fragmentierten Daten zu unterstützen. Hierfür hält das System eine Vielzahl von Features bereit. Im Überblick stellen sich die Funktionsbereiche wie folgt dar:
Betrachten wir diese Bereiche im Folgenden genauer.
1. Datenintegration und Datentransformation
SAP DS ist ein ausgewiesenes Datenintegrations- und Datentransformations-Tool. Seine Kernaufgabe ist demnach das Verbinden, Harmonisieren und Verarbeiten von strukturierten und unstrukturierten Daten aus verschiedenen Datenquellen.
Für die Konvertierung und Bereitstellen der Daten bietet die Lösung mehrere Methoden:
Damit unterstützt SAP Data Services nicht nur die Batch-Verarbeitung, den traditionellen Ansatz der Datentransformation. Auch Echtzeit-Services können genutzt werden. Sie ermöglichen das Abfragen von Datendiensten mit definierten Workflows und unmittelbaren Antworten.
Die Transformation der Daten kann parallel (für mehrere Quellen gleichzeitig) erfolgen, wodurch eine besonders hohe Datendurchsatzrate erreicht wird.
2. Datenqualitätsmanagement
Ein weiteres wichtiges Einsatzgebiet von SAP DS ist die Datenqualität. Als zentrale Plattform eignet sich die Lösung dazu, die Qualität systemübergreifend transparent zu machen und zu überwachen. Hierdurch werden auch Qualitätsprobleme und Zusammenhänge sichtbar, die bislang im Verborgenen lagen.
Ebenso gibt die Software Aufschluss darüber, wie sich Qualitätsmängel auf nachgelagerte Anwendungen und Systeme auswirken. Visualisiert werden all diese Aspekte auf übersichtlichen Dashboards.
Darüber hinaus wird SAP Data Services mit vordefinierten, anpassbaren Workflows für die Analyse, Bereinigung, Standardisierung und Anreicherung von Daten ausgeliefert. Dank dieser Eigenschaften ist SAP DS sowohl für ein einmaliges Projekt der Datenbereinigung als auch für die kontinuierliche Qualitätssicherung geeignet.
3. Data Profiling
Das Data Profiling ist eine Funktion, die ebenfalls dem Datenqualitätsmanagement zuzuordnen ist. Es handelt sich hierbei um eine automatisierte Analyse, mit deren Hilfe Qualitätsprobleme aufgedeckt werden können.
Unter anderem liefert das Data Profiling Informationen zu Häufigkeitsverteilungen, ungültigen Werten, Minimal- und Maximalwerten und Mustern in vorhandenen Datensätzen. Somit ist es möglich, Muster und Auffälligkeiten in einer Datenbank zu erkennen. Insbesondere für die frühzeitige Erkennung von Schiefständen ist diese Methode hilfreich.
4. Analyse von Textdaten
Wie erwähnt, erlaubt SAP Data Services auch die Verarbeitung unstrukturierter Daten. Besonders wichtig ist diese Eigenschaft für die Analyse von Textdaten (Text-Data-Processing).
Die Methode erlaubt es, Schlüsselbegriffe, Fakten, Stimmungen, Gefühle und Trends aus über 200 verschiedenen Datei- und Textformaten zu extrahieren und somit wertvolle Einblicke zu gewinnen. Nur einige Beispiele sind Pressemeldungen, soziale Netzwerke, E-Mails und Blogs.
5. Change Data Capture (CDC)
CDC dient dazu, Datenänderungen in einer Quell-Datenbank unmittelbar zu erkennen und auf dieser Basis eine Aktualisierung des Ziel-Systems durchzuführen.
Es muss also nicht permanent der gesamte Datenbestand aktualisiert werden. Vielmehr werden lediglich neue oder geänderte Datensätze übergeben. Hieraus ergeben sich deutliche Einsparungen von Rechenressourcen.
6. Integration mit weiteren SAP-Produkten
Data Services arbeitet mit einer ganzen Reihe weiterer SAP-Produkte aus dem Bereich Enterprise Information Management (EIM) zusammen. Hierzu zählen beispielsweise: