Nane Kratzke

Thesis:

Entwicklung eines Microservice für automatisiertes Machine Learning

Published: 21 Jul 2022 (latest update: 23 Apr 2023)
Type: Master (M. Sc.)
State: open
Study: Informatik
Language: Deutsch
Company: myLab

Das maschinelle Lernen (ML) hat in den letzten Jahren beachtliche Erfolge erzielt, so dass sich immer mehr Disziplinen auf diese vielfältige Verfahren des ML abstützen. Diese Erfolge hängen jedoch entscheidend von menschlichen Experten für maschinelles Lernen ab, die manuelle Aufgaben - wie bspw. die Wahl des richtigen ML-Verfahrens, der Selektion geeigneter Features, Festlegen von Hyperparamtern, usw., oft auf Basis von schwer externalisierbaren Erfahrungswerten durchführen. Aufgrund dieser Komplexität, die oft die Erfahrungen von Nicht-ML-Experten übersteigt, sind sogenannte AutoML-Bibliotheken entstanden, die selbstständig geeignete ML-Verfahren auf einem gegebenen Problem trainieren und das geeigneste Verfahren auswählen und geeignet parametrisieren.

Es gibt mittlerweile mehrere solcher Open Source AutoML-Bibliotheken. Bspw.:

Diese werden häufig in Form von Programmbibliotheken (oft Python) zur Verfügung gestellt und müssen somit programmatisch genutzt werden. Oft ist dabei die Sprachbindung ein Problem, insbesondere wenn AutoML-Funktionalitäten in Komponenten erforderlich werden, die nicht in Python implementiert wurden. Ziel dieser Arbeit ist es, derartige Bibliotheken webbasiert mittels einer Web UI und einer REST-API in Form eines Microservice bereitzustellen.

  • Der Microservice soll sowohl das Training mittels einer REST-API unterstützen
  • als auch trainierte Modelle für das Inferencing mittels einer REST-API bereitstellen.
  • Das Training soll ferner mittels einer Web UI für Benutzer:innen ermöglicht werden, die keine ML-Experten sind.
  • Die Lösung soll in Kubernetes automatisiert deploybar sein. Eine entsprechende Infrastruktur wird im Rahmen der Abschlussarbeit bereitgestellt werden. Die Implementierung ist vorzugsweise mittels Python vorzunehmen.

Im Sinne des Open Source Gedankens sollte die Autor:in anstreben, die Lösung als Open Source Projekt im Anschluss der Arbeit der Allgemeinheit zur Verfügung zu stellen und über die Abschlussarbeit hinaus als Open Source Produkt fortzuführen.