AI-Core: Künstliche Intelligenz, im Kern aber SAP
Dieser Blogbeitrag gibt einen Überblick über den technischen Aufbau des AIC. Falls Sie mehr darüber wissen möchten, was AIC ist und wofür es verwendet werden kann, lesen Sie den ersten Beitrag in unserer Reihe hier.
AIC – Funktionen und Aufbau
AIC ist im Kern eine Kubernetes-Umgebung, also eine Umgebung, in der Code-Schnipsel in Containern geordnet ausgeführt werden können. Zweck der Containerisierung von Code ist es, Abhängigkeiten zu minimieren, was eine einfache Skalierung ermöglicht. Das heißt: Code in einem Container kann in beliebig vielen Anwendungen in beliebigen Umgebungen eingesetzt werden. Gesteuert wird die Ausführung von Containern in AIC mithilfe von Argo, einem Workflow, der auf Kubernetes zugeschnitten ist und es erlaubt, die Ausführung mehrerer Container zu steuern, deren In- und Outputs zu verwalten sowie zusätzliche Parameter zu definieren. Eine weitere Funktionalität ist die Bereitstellung von Modellen in sogenannten Implementierungen. Diese Implementierungen werden mithilfe des KFServe Frameworks verwaltet und erlauben es, mit einfachen Mitteln Web-Endpunkte zu erstellen, mit denen fertig entwickelte Modelle mittels API-Schnittstelle angesprochen und so produktiv eingesetzt werden können.
Mit dieser Infrastruktur bietet AIC eine solide Basis für die Entwicklung und Bereitstellung von KI-Modellen. Im Gegensatz zu bisherigen KI-Funktionalitäten im SAP-Kontext (wie der Predictive Analytics Library) muss man sich hier aber nicht mit vorgefertigten Black Boxes auseinandersetzen, sondern hat volle Kontrolle über jeden Schritt der Modellentwicklung.
In der Funktionalität verlässt sich AIC sehr auf die Services von Drittanbietern: Kubernetes als Umgebung, Docker zur Containerisierung, Argo zur Orchestrierung, git zur Codeentwicklung und Python für die eigentliche KI-Funktionalität (wobei auch andere Programmiersprachen möglich sind). Für viele Entwickler dürften das gute Nachrichten sein, da diese Tools in der einen oder anderen Form ohnehin bereits genutzt werden. Damit müssen Entwickler nicht erst spezifische Programmstrukturen oder -syntax lernen, was sowohl Zeit als auch Kosten spart. Ein weiterer Vorteil: die Nutzung einer beliebten Programmiersprache wie Python erlaubt den Zugang zu zahlreichen Ressourcen, welche die Modellentwicklung maßgeblich beschleunigen – von Tutorien über Bibliotheken bis hin zu fertig entwickelten KI-Modellen.
Ebenso offen gegenüber bestehenden Lösungen zeigt sich die SAP bei der Sicherung von Daten. Zwar gibt es eine native Anbindung an HANA Cloud, Data Lake, allerdings sind auch andere Hyperscaler, wie AWS, Azure und Alibaba, zur Datenablage möglich.
Fallbeispiel: Planung von Finanzströmen mittels KI-gestützter Vorhersage
Problembeschreibung:
Die Möglichkeiten, AIC produktiv zu nutzen sind sehr vielfältig. Einige dieser Möglichkeiten sind auch in Beiträgen der SAP gut aufbereitet nachzulesen, wie etwa die Möglichkeit der vorausschauenden Wartung (Predictive Maintenance). Eine andere Möglichkeit ist aber die Vorhersage von Zeitreihen, wie etwa Verkaufsstatistiken, Lagerbeständen oder Finanzströmen (die Vorteile von KI-gestützten Vorhersagen von Finanzströmen haben wir in einem Booklet für Sie zusammengefasst, das Sie hier herunterladen können).
Die Vorhersage von Zeitreihen bringt eine Reihe an speziellen Anforderungen mit sich. So ist hier zum Beispiel die Aktualität der Trainingsdaten von weitaus größerer Bedeutung als es beispielsweise bei Klassifizierungen der Fall wäre. Eine weitere Besonderheit von Zeitreihenvorhersagen ist, dass Modelle für jede Vorhersage erneut trainiert werden müssen, um möglichst aktuelle Entwicklungen abbilden zu können. Eine Infrastruktur, die für Zeitreihen maßgeschneidert ist, sollte also Daten möglichst nahe an BW-Systemen speichern und keine Trennung zwischen Training und Vorhersage machen.
Lösungsansatz:
Die SAP Datasphere ist eine elegante Lösung für das Problem der Aktualität und Vollständigkeit von Daten. Sie ermöglicht es nicht nur, Daten direkt in der Datasphere zu speichern, sondern kann auch Daten weiterer Systeme – SAP wie nicht-SAP, sowie Cloud-basiert und (mittels BW-Bridge) on-premise– miteinbeziehen (Lesen Sie mehr zur Datasphere – ehemals Data Warehouse Cloud – in unserem Blog-Beitrag hier).
Um auf die Daten der Datasphere zugreifen zu können, gibt es die Möglichkeit sog. Datenbankbenutzer anzulegen. Diese Benutzer erlauben es, von außerhalb auf die HANA-Datenbank der Datasphere per SQL-Client zuzugreifen. Indirekt kann AIC damit Daten aus on-premise BW-Systemen nutzen, also dort, wo nach wie vor ein großer Teil der Unternehmensdaten erstellt und gepflegt werden. Im Kontext des AIC ist dies durch das von der SAP entwickelte Paket hana_ml, möglich. Dieses Paket erlaubt es, Tabellen der Datasphere in ein Python-Format (spezifisch: einen pandas DataFrame) umzuwandeln und somit für weitere Verarbeitung in Python zu nutzen. Einfache Operationen bis hin zu simplen Machine Learning Modellen können dabei im sogenannten Code Push-Down Verfahren durchgeführt werden. Das bedeutet, dass Verarbeitungen direkt auf der HANA Datenbank der Datasphere ablaufen, wodurch Daten nicht unnötig transferiert werden müssen (mehr zu diesem Thema in unserem Blog hier).
Damit wäre die Infrastruktur für das Backend fertig: Daten werden in BW-Systemen erstellt, in der Datasphere gesammelt, im AIC verarbeitet und als Vorhersage wieder zurück in die Datasphere geschrieben. Als Frontend für dieses Konstrukt bietet sich nun die SAP Analytics Cloud (SAC) an, die standardmäßig zusammen mit der Datasphere verfügbar ist. Hier können Dashboards gebaut werden, in denen die Plandaten zusammen mit den tatsächlichen Unternehmensdaten dargestellt werden können. Darüber hinaus kann der AIC über eine Implementierung direkt aus dem AIC heraus angesteuert werden; der Planungsprozess kann also ganz leicht von Benutzern ausgelöst werden.
So ausgerüstet können Unternehmen ihre Planungsfunktionen um mächtige KI-Methoden erweitern, ohne auf den Komfort einer einzigen Benutzeroberfläche verzichten zu müssen.
Abbildung 1 Mögliche Infrastruktur für produktive Systeme. Rohdaten in SAP Datasphere (DS) werden mittels AIC verarbeitet, um eine Vorhersage zu treffen. Rohdaten und Vorhersage können in der SAP Analytics Cloud (SAC), etwa in einem Dashboard, dargestellt werden, von wo aus der ML-Workflow ebenfalls gestartet werden kann.
Kosten:
Der AIC ist, wie die Datasphere auch, Teil der neuen Business Technology Platform (BTP) der SAP und kann dort gebucht werden. Einen detaillierten Überblick über die anfallenden Kosten können Sie der untenstehenden Tabelle entnehmen.
Tabelle 1 Kosten für AIC Instanzen. Kosten sind in Capacity units (CU) angegeben und berechnen sich aus: Speicherplatz (0.0003 CU pro GB pro Stunde), genutzten Stunden der Instanzen (siehe unten), sowie einer Basisgebühr von 1.2241 CU pro Stunde). Eine CU entspricht 1.04€ (CPEA-Modell) bzw. 1,35€ (Pay-As-You-Go).
Es gibt aber auch eine kostenlose Probeversion, in der die BTP, sowie einige Services (wie etwa AIC), getestet werden können (mehr dazu auf der Seite der SAP hier). Zum Ausprobieren der Grundfunktionen des AIC können Sie hier einer Schritt-für-Schritt Anleitung folgen.
Fazit
Der AIC ist eine benutzerfreundliche, SAP-native Lösung für AI und Machine Learning. Durch die Einbindung von bestehenden Cloud-Services und Frameworks sind viele Entwickler schnell in der Lage, AIC produktiv zu nutzen. Dabei erlaubt einem der modulare Aufbau des AIC große Flexibilität in Bezug auf Einsatzgebiete, Größenmaßstab, Zielsetzung und Realisierung.
Gleichzeitig ist AIC als Teil der BTP gut in andere SAP Dienste eingebunden und kann verwendet werden, um bestehende Firmenprozesse zu optimieren, zu automatisieren oder zu beschleunigen.
Klingt interessant? Gerne helfen wir Ihnen dabei zu bewerten, ob und wie Sie von AIC profitieren können. Profitieren Sie zudem von unserer Expertise in den Bereichen Infrastruktur, Modellentwicklung und ML-Operations, indem Sie einfach einen Termin für ein Beratungsgespräch vereinbaren. Wir freuen uns schon.
Wie kann Machine Learning Ihre Arbeit unterstützen? Sprechen Sie uns gerne an, um herauszufinden, wie wir Ihnen helfen können, die besten Ergebnisse zu erzielen.
Veröffentlich am 23.10.2023
Thema: big data, AWS, Data Science