Machine Learning und MLOps mittels Amazon SageMaker

Joshua Zielinski, Data Science Consultant Five1Im Zeitalter von Künstlicher Intelligenz (KI) und Machine Learning (ML) sind intelligente Algorithmen nicht mehr aus unserem Alltag wegzudenken. Auch in der Geschäftswelt eröffnen sich kontinuierlich neue Möglichkeiten durch die Entwicklung von Softwarelösungen, die eine Vielzahl von Anwendungsfällen unterstützen. Es ist offensichtlich, dass ML ein enormes Potenzial birgt, das jedoch häufig nicht vollständig ausgeschöpft wird. Viele Initiativen zur Implementierung von ML in Unternehmen scheitern an der praktischen Umsetzung. Doch woran liegt das? Der Schwerpunkt liegt häufig auf der Entwicklung neuer ML-Modelle und der Datenaufbereitung, wobei die Integration der Modelle in die Geschäftsprozesse vernachlässigt wird. Bei Five1 konzentrieren wir uns ebenfalls darauf, den Entwicklungs- und Bereitstellungsprozess für verschiedene Nutzer und Anwendungsfälle zu standardisieren und die Modelle effizient den Entscheidungsträgern zur Verfügung zu stellen. 

Hier kommt MLOps ins Spiel. MLOps, als Abkürzung für Machine Learning Operations, bezeichnet die praktische Umsetzung von ML-Modellen in Produktionsumgebungen. Es umfasst den gesamten Lebenszyklus einer ML-Anwendung, von der Entwicklung und Bereitstellung bis hin zur Überwachung und Wartung. Durch die Implementierung von MLOps können Unternehmen ihre ML-Workflows robust, skalierbar und kontinuierlich optimiert halten. Um diesen Prozess zu ermöglichen, unterstützt uns bei Five1 zum Beispiel Amazon SageMaker Projects, ein Tool des Cloud-Computing-Anbieters Amazon Web Services (AWS). Es bietet eine umfassende Plattform, die speziell dazu entwickelt wurde, die Herausforderungen bei der Integration von ML in den Geschäftsbetrieb zu adressieren. 

Im Folgenden wollen wir genauer auf die Funktionen und Vorteile von SageMaker Projects eingehen und zeigen, wie Unternehmen diese leistungsstarke Plattform für MLOps effektiv nutzen können.


 

Effizientes IT-Infrastrukturmanagement mit Amazon SageMaker Projects

Amazon SageMaker Projects sind ein funktionsreiches Feature von Amazon SageMaker, das Organisationen und Unternehmen dabei unterstützt, Entwicklungsumgebungen für Data Scientists zu schaffen und vollständige (CI/CD) Pipelines sowie Systeme für MLOps Engineers zu definieren, einzurichten und zu standardisieren. Für den Erfolg von Data Science-Projekten ist eine effiziente Infrastrukturverwaltung von entscheidender Bedeutung. Amazon SageMaker Projects bieten eine umfassende Lösung zur Definition und Einrichtung der erforderlichen AWS-Ressourcen und -Dienste, wie Quellcode-Repositories, Projektumgebungen und ML-Workflows. Durch die Nutzung von Projektvorlagen aus dem AWS Service Catalog oder benutzerdefinierten Templates können alle erforderlichen AWS-Ressourcen und -Dienste für die Entwicklung der ML-Anwendung nahtlos bereitgestellt werden. Infrastrukturkomponenten können dabei flexibel an die spezifischen Anforderungen eines Projekts angepasst werden. 

“Durch die Nutzung von Amazon SageMaker Projects können wir die Entwicklungszeit Ihrer Data Science Projekte erheblich reduzieren, was zu einer verkürzten Time-To-Market führt.”

Dank der vorkonfigurierten Infrastruktur durch SageMaker Projects können Data Scientists sofort mit der Modellentwicklung beginnen, ohne wertvolle Zeit für die manuelle Einrichtung und Konfiguration von AWS-Ressourcen zu verschwenden. Dies führt zu einer erheblichen Beschleunigung des Entwicklungsprozesses und einer verkürzten Time-To-Market. Obwohl SageMaker die Server (EC2-Instanzen), die Speicher (Amazon S3) und das Networking im Hintergrund verwaltet, können dennoch Flexibilität und Anpassungen gewährleistet werden. Die Nutzer behalten die volle Entscheidungsfreiheit über die Auswahl der Recheninstanzen, die für das Modelltraining oder die Modellvorhersagen verwendet werden sollen. Diese Flexibilität ermöglicht es uns Ihre Infrastruktur genau an Ihre Anforderungen anzupassen und Kosten zu optimieren. Ein weiterer Vorteil von SageMaker Projects liegt in der Skalierbarkeit der Infrastruktur. AWS als Hyperscaler stellt die benötigte Rechenleistung und den Speicherplatz bereit, was Unternehmen ermöglicht, agil ihre Ressourcen an veränderte Anforderungen anzupassen. 

“SageMaker Projects bietet Flexibilität, Kosteneffizienz und Skalierbarkeit, um den steigenden Anforderungen im Bereich des maschinellen Lernens gerecht zu werden.“

Amazon SageMaker Pipelines Architecture

Abbildung 1- Mit Amazon SageMaker Projects optimieren wir den Entwicklungs- und Bereitstellungsprozess Ihrer ML-Modelle hinsichtlich Effizienz und Produktivität.

Bereitstellung und Überwachung von ML-Modellen für Ihr Unternehmen

Der Erfolg von ML-Lösungen hängt maßgeblich von der aktiven Beteiligung und engen Zusammenarbeit des Fachbereichs ab. Das Ziel von Five1 besteht darin, Ihr trainiertes Modell für Ihre Nutzer und Kunden verfügbar zu machen und Vorhersagen auf neuen Daten zu ermöglichen. Dieser Prozess umfasst typischerweise mehrere anspruchsvolle Teilschritte, die sorgfältig berücksichtigt werden müssen, um den Erfolg Ihres Produkts zu gewährleisten. Dazu gehören das Verpacken des Modells in Docker Containern, die Registrierung des Modells in einem Docker Image Repository, die Erstellung einer API-Endpoint-Konfiguration sowie die fortlaufende Überwachung und das Nachtrainieren des Modells. Mittels SageMaker Projects können wir diese Prozesse automatisieren, indem die verschiedenen AWS-Services orchestriert werden. Dabei wird vollständige Transparenz gewährleistet, sodass keine Black Box entsteht, sondern bestehende AWS-Services und Ressourcen effizient miteinander vernetzt werden. 

“Auf diese Weise können wir mit Ihnen ML-Anwendungen innerhalb Ihres Unternehmens zugänglich machen, deren Nutzen maximieren und Silobildung verhindern.”

Darüber hinaus bietet Amazon SageMaker (Projects) verschiedene Optionen zur Bereitstellung Ihres Modells, die wir speziell auf Ihren Use Case zuschneiden können. Die gängigste Form der Bereitstellung ist das "Online Deployment". Benutzer können in Echtzeit auf ihre ML-Anwendung zugreifen und Vorhersagen basierend auf ihren Eingaben erhalten. SageMaker Projects passen sich dabei flexibel dem Anfragebedarf an und gewährleisten so die zuverlässige Erreichbarkeit Ihres Produkts. Eine weitere Form der Bereitstellung eines ML-Algorithmus ist das sogenannte "Batch Deployment". Diese Methode eignet sich insbesondere für Vorhersagen, die auf großen Datenmengen basieren. Weitere Bereitstellungsmöglichkeiten können in einem SageMaker Project Template für Ihr Unternehmen festgehalten werden. 

“Durch einen standardisierten MLOps Prozess ermöglichen wir Ihnen langfristig die Zuverlässigkeit und Qualität Ihrer ML-Anwendungen.”

Doch wie können wir einen Beitrag zur Qualitätssicherung des ML-Modells in der Produktionsphase leisten? Hierzu ziehen wir den spezialisierten AWS-Dienst SageMaker Model Monitor hinzu, der die kontinuierliche Überwachung und Kontrolle von Qualität sowie Prognosegenauigkeit bei ML-Anwendungen ermöglicht, die bereits in die Produktionsumgebung eingebunden sind. Sollte die Vorhersagequalität nachlassen, wird automatisch eine Warnmeldung generiert. Um das Problem zu beheben, kann dann vollständig automatisiert ein erneutes Training des Modells eingeleitet werden.

 

Potenzial für Unternehmen und Data Science-Teams maximieren

Unsere ausführliche Analyse der Vorteile von Amazon SageMaker führt uns zu einer zentralen Frage: Wie können Sie als Unternehmen von diesem hochleistungsfähigen AWS-Dienst profitieren? Amazon SageMaker eröffnet den Entwicklern und Data Scientists eine weitreichende Palette an Funktionen. Es verbessert die Effizienz Ihrer Mitarbeiter durch die zentrale und kollaborative Konzentration auf das Training und die Evaluierung Ihrer ML-Anwendungen, während zusätzliche Aufgaben durch eine automatisierte Modellbereitstellung beseitigt werden.

Als umfangreiche Plattform ermöglicht SageMaker ML-Projekte erfolgreich zu managen und zu orchestrieren. Das hierfür erforderliche Fachwissen und die Expertise bringt unser Team an Data Scientists und MLOps Engineers mit, sodass wir Sie dabei unterstützen können, das volle Potenzial von MLOps mittels SageMaker (Projects) für Ihr Unternehmen zu entfalten. Gemeinsam optimieren, automatisieren und standardisieren wir Ihren ML-Workflow. Dies vereinfacht nicht nur die Bereitstellung von Anwendungen, sondern sorgt auch für konsistente Arbeitsabläufe. Anhand von auf Ihren Use Case angepasste ML-Tools können wir den Mehrwert Ihrer Data Science-Projekte maximieren und Ihr Unternehmen vorantreiben. Nutzen Sie die Expertise von Five1, um schneller und effizienter an Ihr Ziel zu kommen.

Wie kann Amazon SageMaker Ihre Arbeit unterstützen? Wir tauschen uns gerne mit Ihnen über die vielfältigen Einsatzmöglichkeiten aus.

Lassen Sie uns sprechen

 

Veröffentlich am 1.8.2023

Thema: big data, AWS, Data Science