Wie Metadaten wichtige Hinweise zum Systemzustand der Cloud liefern
Trends & Innovationen

Künstliche Intelligenz im Cloud-Monitoring – Durch Vogelbeobachtung zur Wettervorhersage

| | SEEBURGER
Künstliche Intelligenz im Cloud-Monitoring

Was hat Vogelbeobachtung mit Cloud-Monitoring zu tun?

Singvögel sind offenbar in der Lage, Stürme frühzeitig vorherzusagen. Amerikanische Umweltforscher haben in den Jahren 2013 und 2014 die Flugrouten von Goldflügel-Waldsängern aufgezeichnet.1 Als im April 2014 eine große Sturmfront über den Osten von Tennessee zog, beobachteten die Forscher, dass die dort brütenden Vögel das Gebiet weiträumig verließen. Das Erstaunliche daran: Die Singvögel waren bereits ein bis zwei Tage vor dem Eintreffen der Sturmfront von ihren Brutstätten aufgebrochen. Und das, obwohl zu diesem Zeitpunkt noch keine lokalen atmosphärischen Veränderungen messbar waren, die auf einen Sturm hätten hindeuten können.

Obwohl Vogelbeobachtung in der modernen Meteorologie nicht mehr angewendet wird, hat sie als Volksweisheit durchaus ihre Daseinsberechtigung. Aber was hat die Beobachtung von Vögeln mit Cloud-Monitoring zu tun?

 

Was ist Cloud-Monitoring?

Cloud-Monitoring bezeichnet die Überwachung der Verfügbarkeit und des Datenflusses im Cloud-Computing. Es ist unerlässlich, um ungewollte Systemausfälle oder Verarbeitungsfehler zu vermeiden. Systemadministratoren überwachen üblicherweise den Systemzustand einer Cloud, indem sie System-Metriken erfassen und auswerten. Dieses Vorgehen bei der Überwachung eines Cloud-Systems weist Parallelen zur Wettervorhersage mit modernen meteorologischen Messmethoden auf.

In beiden Fällen sind die eingesetzten Techniken zwar sehr zuverlässig, erfordern aber ein hohes Maß an Interpretationskompetenz und sind sehr aufwendig in der Auswertung. Im Falle der Wettervorhersage bietet das Beobachten von Vögeln eine unkompliziertere Alternative. Was aber ist das Gegenstück zur Vogelbeobachtung im Cloud-Monitoring? Um dies zu verstehen, ist es sinnvoll, den konkreten Kontext zu beleuchten, in dem Cloud-Monitoring hier zum Einsatz kommt.

 

Wie kann man Cloud-Monitoring sinnvoll ergänzen?

SEEBURGER bietet auf seiner cloudbasierten Integrationsplattform, der BIS Plattform, Cloud-Lösungen zur Unterstützung von Integrationsszenarien für Unternehmen an. Eine der SEEBURGER-Plattform-Funktionen, EDI, ermöglicht es Unternehmen beispielsweise, im Rahmen automatisierter Geschäftsprozesse Rechnungen oder Bestellungen an Geschäftspartner zu übermitteln. Technologisch wird dies auf einem Gateway realisiert, das die Verbindungen zwischen den Geschäftspartnern zentralisiert. Dadurch werden die Wartung, das Testen und die Überwachung der Datenflüsse vereinfacht. Das Gateway wird flexibel in einer Cloud bereitgestellt. Die über das Gateway übertragenen Nachrichten werden durch das SEEBURGER Message Tracking erfasst. Dabei werden Metadaten wie Zeitpunkt, Dauer und Größe der Nachrichtenübertragung protokolliert.

Abbildung 1: So funktioniert SEEBURGER Message Tracking
Abbildung 1: So funktioniert SEEBURGER Message Tracking

 

Die Auswertung dieser Metadaten ist vergleichbar mit der Vogelbeobachtung. Denn wie bei der Vogelbeobachtung spiegeln die Metadaten die Ursache oder Symptomatik für ein Fehlverhalten wider, anstatt tatsächliche Messgrößen eines Fehlers zu sein. Statt Informationen wie Flughöhe, Vogelgesang oder Flugrichtung zur Vorhersage des Wetters auszuwerten, werden hier die Metadaten einer Nachrichtenübertragung zur Vorhersage des Systemzustandes der Cloud ausgewertet. Nicht als alleinige, aber als zusätzliche Entscheidungsgrundlage kann die Auswertung von Metadaten in realen Cloud-Monitoring-Prozessen gewinnbringend eingesetzt werden.

Da Cloud-Computing heutzutage allgegenwärtig ist, ist ein zuverlässiges Cloud-Monitoring unerlässlich.

 

Was ist Cloud-Computing?

Cloud-Computing ist ein IT-Modell, bei dem dynamisch skalierbare und virtualisierte Ressourcen als Dienste über das Internet bereitgestellt werden. Dadurch stehen IT-Ressourcen wie CPU- und Speicherkapazitäten jederzeit und überall zur Verfügung.2 SEEBURGER nutzt die Cloud-Technologie beispielsweise, um Funktionen zum Datenaustausch für Kunden flexibel und skalierbar bereitzustellen. Die Nutzung unbegrenzter Rechenressourcen nach Bedarf bietet nicht nur hohe Flexibilität, sondern auch eine Verarbeitungsumgebung, die von einer einzelnen Maschine nur schwer bereitgestellt werden kann. Unternehmen können von dynamischen und flexiblen Cloud-Umgebungen profitieren, insbesondere bei zunehmender Komplexität der technischen Infrastruktur und rechenintensiveren Aufgaben.3 Da Kunden keinen physischen Zugriff auf Hardwareressourcen haben, müssen sie sich auf die Verfügbarkeit von Cloud-Umgebungen verlassen können. Cloud-Anbieter müssen daher eine hohe Servicequalität und Verfügbarkeitsgarantien bieten. Ihre Aufgabe besteht darin, Dienste bereitzustellen, zu orchestrieren und zu verwalten und dabei die Sicherheit und Einhaltung des Datenschutzes zu gewährleisten.4 Die Verwaltung von Cloud-Diensten umfasst unter anderem die frühzeitige Erkennung von Fehlern und die Minimierung von Ausfällen.5

 

Wie können die Herausforderungen des Cloud-Monitoring gelöst werden?

Bisher obliegt die Interpretation des Systemzustandes im Cloud-Monitoring erfahrenen Systemadministratoren. Ihre Arbeit wird durch die große Menge an aufgezeichneten Daten und die hohe Dimensionalität der Merkmale erschwert. Durch die Nutzung von Rechenressourcen und künstlicher Intelligenz (KI) zur Auswertung, Vorsortierung und Bewertung der Daten können Systemadministratoren dagegen entlastet werden. Ihnen obliegt dann die Überprüfung der zusammengefassten Analysen.

Ein herkömmliches Monitoring kann zukünftige Systemzustände nicht vorhersagen und beschränkt sich daher auf Ausfallreaktionen. Wenn jedoch Regeln ermittelt werden, die eine frühzeitige Vorhersage von unerwünschten Systemzuständen ermöglichen, kann präventiv in den Ablauf eingegriffen werden.

Da der Schwerpunkt der Prozessüberwachung zurzeit auf der Echtzeitüberwachung und insbesondere auf der Ressourcenüberwachung liegt, werden Maßnahmen zur Fehlerbehebung hauptsächlich auf der Ebene der Technologie und Hardware umgesetzt. Möglichkeiten zur Fehlerbegrenzung und Lastverteilung auf der Organisations- und Konfigurationsebene sind wenig untersucht und umgesetzt. Im Gegensatz zu den hardwarezentrierten System-Metriken gewähren die Metadaten einer Nachrichtenübertragung Einblicke in die inhaltlichen Abläufe und Datenflüsse der Cloud. Die Untersuchung dieser Daten ermöglicht daher inhaltliche Aussagen zum betrachteten Sachverhalt.

Durch den Einsatz von künstlicher Intelligenz können auf Basis von Metadatenaufzeichnungen unter Nutzung von Rechenressourcen Regeln für Vorhersagen ermittelt werden. Somit bietet künstliche Intelligenz die Möglichkeit, die genannten umfassenden Herausforderungen des Cloud-Monitorings zu lösen.

 

Was ist künstliche Intelligenz (KI)?

In einer zunehmend digitalisierten Welt entstehen immense Datenmengen, die sowohl neue Herausforderungen als auch unbegrenzte Möglichkeiten mit sich bringen. Die Vielfalt an Informationen, Werten und Messgrößen ermöglicht detaillierte Einblicke in datenzentrische Anwendungsbereiche und deren Abläufe, Zusammenhänge und Wirkungsweisen.6 Durch sorgfältige Analyse und Interpretation von Realbeobachtungen kann umfangreiches Wissen gewonnen werden, welches auf Entscheidungsprozesse einwirken kann.7 Die Verarbeitung schnell wachsender und teils unstrukturierter Datenmengen ist eine anspruchsvolle Aufgabe, bei der menschliche Fähigkeiten an ihre Grenzen stoßen. Leistungsfähige Computer können jedoch erhebliche Datenverarbeitungsaufgaben bewältigen. In den letzten Jahren wurde die hohe Rechenleistung von Computern zunehmend genutzt, um Methoden zu entwickeln, die durch statistische Auswertung von Beobachtungen menschliche kognitive Fähigkeiten nachahmen können.8 Diese Methoden erfreuen sich unter dem Begriff der künstlichen Intelligenz großer Beliebtheit und Begeisterung9. Die Intelligenz von Computern, die es ihnen ermöglicht, informierte Schlüsse zu ziehen, basiert entweder auf programmierten Abläufen oder wird durch maschinelles Lernen erzeugt. Während für die Programmierung eines intelligenten Systems ein menschlicher Experte erforderlich ist, der Berechnungsvorschriften vorgibt, sind maschinelle Lernmodelle in der Lage, diese aus vorhandenen Daten abzuleiten. Sie nutzen Algorithmen, um beobachtbare Zusammenhänge zu erkennen und in einer mathematischen Funktion abzubilden. Durch Anwendung einer erlernten Funktion, auch Modell genannt, auf beobachtbare Eingaben können unbekannte Zielwerte vorhergesagt werden.

 

Wie funktioniert maschinelles Lernen (ML)?

Der Lernprozess eines maschinellen Lernmodells wird als Training bezeichnet. Das Ziel des Trainings besteht darin, eine Abhängigkeitsfunktion zu erlernen, die bekannte Eingabewerte auf einen unbekannten Zielwert abbildet. Eine Form des Lernens ist das sogenannte überwachte Lernen. Hierbei liegen historische Daten vor, die sowohl Eingabe- als auch Zielwerte dokumentieren. In diesem Fall wird die Abhängigkeitsfunktion durch die Analyse der Zusammenhänge zwischen den Eingabe- und Zielwerten in den Trainingsdaten erlernt.

Abbildung 2: Mit Hilfe der KI können uns diese Eigenschaften einer Paketsendung Hinweise auf den Lieferverlauf geben

Abbildung 2: Mit Hilfe der KI können uns diese Eigenschaften einer Paketsendung Hinweise auf den Lieferverlauf geben

 

Das Training eines maschinellen Lern-Algorithmus lässt sich anhand eines Beispiels aus der Logistikbranche veranschaulichen.  Eine Paketsendung wird durch verschiedene Eigenschaften beschrieben, wie

  • die Lieferadresse,
  • das Gewicht des Pakets,
  • den Zeitpunkt,
  • den Fahrer/die Fahrerin

der Sendung. Ein maschinelles Lernmodell kann anhand historischer Paketsendungsaufzeichnungen Zusammenhänge zwischen bekannten Eigenschaften einer Sendung und dem Liefererfolg eines Pakets abbilden. Beispielsweise könnte ein solches Modell feststellen, dass Auslieferungen von Paketen, die mehr als 100 kg wiegen, grundsätzlich fehlschlagen. Durch Anwendung der erlernten Funktion auf Lieferungen mit noch unbekanntem Ausgang können Vorhersagen bezüglich des Liefererfolgs getroffen werden. Für zukünftige Auslieferungen weiß man dann nämlich, dass diese mit besonders schweren Paketen vermutlich nicht erfolgreich sind. Die Eigenschaften der Sendung, die zur Bewertung des Liefererfolgs herangezogen werden, sind die Eingabewerte des Modells.

Abbildung 3: Ein maschinelles Lernmodell kann anhand der Eingabewerte  Aussagen zum Liefererfolg treffen
Abbildung 3: Ein maschinelles Lernmodell kann anhand der Eingabewerte  Aussagen zum Liefererfolg treffen

 

Im überwachten Lernen gibt es im Wesentlichen zwei grundlegende Aufgaben: Klassifikation und Regression. Klassifikation bezieht sich auf die Vorhersage nominaler Werte. Das Beispiel zur Vorhersage des Liefererfolgs einer Paketsendung ist eine Klassifikation, da der Ergebniswertbereich auf zwei Klassen (erfolgreich bzw. nicht erfolgreich) beschränkt ist. Regression wird verwendet, um metrische Werte vorherzusagen. Eine Regression kann beispielsweise genutzt werden, um die Dauer einer Paketsendung vorherzusagen. In beiden Fällen wird versucht, mithilfe einer mathematischen Funktion die Zusammenhänge zwischen den Eingabedaten und den Zielwerten zu modellieren. Das Hauptziel besteht darin, durch den Einsatz von maschinellen Lern-Algorithmen eine möglichst präzise Kategorisierung oder Annäherung zu ermöglichen.

Die Veranschaulichung durch das Paketbeispiel lässt sich übrigens sehr einfach auf die Vorhersage des Übertragungsergebnisses von Cloud-Nachrichten übertragen. Im Grunde handelt es sich dabei ebenfalls um Pakete – virtuelle Nachrichtenpakete. Metadaten spezifizieren auch hier die Eigenschaften der Lieferung bzw. eben der Übertragung.

 

Wie wird maschinelles Lernen praktisch umgesetzt?

Je nach Problemstellung, Zielsetzung und Datengrundlage müssen Lösungen für das maschinelle Lernen individuell geplant und umgesetzt werden. In der Literatur haben sich standardisierte Verfahren für die Bearbeitung von maschinellen Lernproblemen entwickelt, die unter dem Begriff MLOps (Machine Learning Operations) zusammengefasst werden.10

Das Vorgehen beim maschinellen Lernen kann auf die Teilschritte der Datenaufbereitung, des Modelltrainings und der Evaluierung begrenzt werden.

Eine qualitativ hochwertige Datenbasis ist Voraussetzung für ein erfolgreiches Training, weshalb die Erzeugung und Aufbereitung der Datenbasis von großer Bedeutung ist. Mögliche Fehler und Ausreißer können andernfalls das Ergebnis verzerren.

Beim Modelltraining wird durch Anwendung eines Lern-Algorithmus auf die Datenbasis ein Lernmodell erzeugt, das anschließend für die Vorhersage auf unbekannten Daten angewendet werden kann. Die Auswahl eines geeigneten Lern-Algorithmus erfolgt nach Beurteilung des zugrundeliegenden Problems, der verfügbaren Rechenressourcen und der Datenbasis.

Das erzeugte Modell wird letztlich getestet, um dessen Güte festzustellen. Eventuell wird in vorangegangenen Arbeitsschritten nachgebessert, um ein verlässlicheres Ergebnis zu erzielen.

 

Wie können Vorhersagen zukünftig eingesetzt werden?

Wie im obenstehenden Prozess beschrieben, wurden historische Metadatenaufzeichnungen aus dem Cloud Gateway genutzt, um maschinelle Lernmodelle zu trainieren. Diese können nun genutzt werden, um das Ergebnis einer Nachrichtenübertragung vorherzusagen. Insgesamt wurden drei unabhängige Lernmodelle trainiert, die jeweils unterschiedliche Ergebniswerte vorhersagen können.

Dadurch können jeweils

  • der Erfolg einer Nachrichtenübertragung,
  • die Dauer einer Nachrichtenübertragung und
  • die Verfügbarkeit eines Service

vorhergesagt werden.

Abbildung 4: KI-Vorhersage und Empfehlungen zur Übertragung einer Nachricht in der Cloud
Abbildung 4: KI-Vorhersage und Empfehlungen zur Übertragung einer Nachricht in der Cloud

 

Da die Vorhersagen von den Metadaten der zu übertragenden Nachricht abhängen, ist eine Vorhersage erst zum Zeitpunkt der Übertragung möglich, d. h. wenn die Metadaten bekannt sind (siehe „Eingabe“ in der Abbildung).

Die Vorhersagen können für den Anwender in Aussagen wie „Diese Nachricht wird nicht erfolgreich übertragen“ übersetzt werden (siehe „Vorhersage“ in der Abbildung). Der Anwender kann entweder ein Kunde sein, der selbst Nachrichten über die Cloud versendet, oder ein Cloud-Administrator, der diese Nachrichten überwacht.

Wenn die Vorhersage unzufriedenstellend ist, kann eine sinnvolle Intervention zu einem besseren Ergebnis führen. Möglicherweise ist eine Nachricht zu groß und sollte daher in kleineren Einzelpaketen versendet werden. Vielleicht hat das spätere Versenden einer Nachricht bereits einen positiven Einfluss auf den Übertragungserfolg. Empfehlungen wie diese können aus maschinellen Lernmodellen extrahiert und von Anwendern umgesetzt werden (siehe „Empfehlung“ in der Abbildung).

Ein reibungsloser Ablauf unter Berücksichtigung solcher Vorhersagen ist nur durch die Umsetzung dieses Anwendungsfalls in automatisierten Abläufen möglich. Zum aktuellen Zeitpunkt ist dies jedoch noch nicht der Fall. Die Vorhersageergebnisse der simulierten Tests sind allerdings teilweise schon vielversprechend.

Die Vorhersage des Erfolgs einer Nachrichtenübertragung erreicht bisher eine Genauigkeit von 74 %, während der Ausfall eines Service bereits mit einer beeindruckenden Genauigkeit von 99,8 % vorhergesagt werden kann.

Es scheint also schon bald möglich zu sein, durch Vogelbeobachtung das Wetter verlässlich vorherzusagen.


1 Quelle: Streby, Henry M., u. a., »Tornadic storm avoidance behavior in breeding songbirds. «, Current Biology 25.1, 2015, S. 98-102

2 Quelle: L. Huawei Technologies Co., Cloud Computing Technology, 1. Aufl. Springer Singapore, 2023.

3 Quelle: S. Marston, Z. Li, S. Bandyopadhyay, J. Zhang und A. Ghalsasi, »Cloud computing—The business perspective«, Decision support systems, Jg. 51, Nr. 1, PP. 176–189, 2011

4 Quelle: F. Liu, J. Tong, J. Mao u. a., NIST Cloud Computing Reference Architecture, en, 2011.

5 Quelle: B. P. Rimal, E. Choi und I. Lumb, »A taxonomy and survey of cloud computing systems«, in 2009 Fifth international joint conference on INC, IMS and IDC, Ieee, 2009, PP 44–51

6 Quelle: H. Aust und H. Aust, »KI: Hype oder Technologie der Zukunft?«, Das Zeitalter der Daten: Was Sie über Grundlagen, Algorithmen und Anwendungen wissen sollten, PP 21–32, 2021

7 Quelle: A. Gadatsch und H. Landrock, »Big Data für Entscheider«, Entwicklung und Umsetzung datengetriebener Geschäftsmodelle. Wiesbaden (essentials), 2017.

8 Quelle: D. Hecker, I. Döbel, U. Petersen, A. Rauschert, V. Schmitz und A. Voß, Zukunftsmarkt Künstliche Intelligenz. Potenziale und Anwendungen, 2017

9 Quelle: W. Bauer, W. Ganz, M. Hämmerle u. a., »Künstliche Intelligenz in der Unternehmenspraxis«, Studie zu Auswirkungen auf Dienstleistung und Produktion. Fraunhofer-Institut für Arbeitswirtschaft und Organisation IAO, Stuttgart, 2019

10 Quelle: F. Zhengxin, Y. Yi, Z. Jingyu u. a., »MLOps Spanning Whole Machine Learning Life Cycle: A Survey«, 2023

Haben Sie Fragen oder Anmerkungen?

Wir freuen uns hier über Ihre Nachricht.

Teilen Sie diesen Beitrag, wählen Sie Ihre Plattform!

Twitter

Ein Beitrag von:

Stefanie Neumann hat 2023 ihr duales Bachelorstudium in Informatik bei SEEBURGER abgeschlossen. Seitdem arbeitet sie als Softwareentwicklerin in der Forschungsabteilung des Unternehmens. Bei ihrer Arbeit kann sie ihrem kreativen Streben nachgehen, innovative Ideen zu entwickeln und umzusetzen. Dabei treibt sie vor allem ihre Neugier auf das Erforschen der Zusammenhänge und Funktionsweisen von Technologien an. Derzeit arbeitet sie an Projekten zur Konzeption und Implementierung von KI-Anwendungen. In ihrer Freizeit ist sie sportlich und künstlerisch aktiv und engagiert sich als Trainerin und Ausbilderin für Jugendliche.