Aus technischer Sicht basiert SAP Data Hub einerseits auf der leistungsfähigen In-Memory-Datenbank SAP HANA, andererseits auf SAP Vora. Letzteres ist eine Plattform für die Integration und das Management von Daten aus Apache Hadoop - einer weitverbreiteten Technologie im Big-Data-Umfeld (weitere Details im Abschnitt „SAP Data Hub vs. SAP Vora“).
Obwohl SAP Data Hub Daten aus verschiedenen Quellen integriert und verwaltet, werden die Daten selbst niemals aus der nativen Quelle herausgenommen und anderweitig gespeichert.
Dieses Vorgehen wird auch Push-Down-Modell genannt und ermöglicht eine verteilte Datenverarbeitung direkt auf dem Quellsystem. Im Vergleich zum klassischen ETL-Prozess (Extract, Transform, Load) wird eine höhere Performance bei der Verarbeitung und der Ausgabe von Ergebnissen erzielt.
Als Frontend kann wahlweise eine einfache Desktop-Design-Variante oder ein Cockpit genutzt werden. Über das Cockpit haben Anwender die Möglichkeit, Datenpipelines in Eigenregie (im Self-Service) zu erstellen.
Es stellt zudem alle verbundenen Datensysteme inklusive dem aktuellen Verbindungsstatus dar. Des Weiteren werden die zugrunde liegenden Datenquellen visualisiert. Es ist also jederzeit ein strukturierter Überblick über die Datenlandschaft sichergestellt. Zudem sind Drag-and-Drop-Funktionen vorhanden, mit denen Mitarbeiter grafische Datenflussmodelle erstellen können.
Was die Bereitstellung betrifft, so unterstützt SAP Data Hub alle denkbaren Varianten. Die Plattform kann sowohl lokal als auch in Cloud- und Hybridumgebungen betrieben werden.