Ziel dieser Bachelorarbeit ist die Evaluierung des Einsatzes von Large Language Models (LLMs) zur automatisierten Übersetzung und Internationalisierung von Benutzeroberflächen und Hilfetexten in bestehenden Codebasen. Dies soll am konkreten Beispiel von CAD-Programmen der betreuenden Firma geschehen. Die Arbeit umfasst die prototypische Entwicklung und Validierung einer Softwarelösung, die den Prozess der Internationalisierung für diese Programme optimiert und automatisiert, um die Mehrsprachigkeit zu erweitern und die Markteinführung in weiteren internationalen Märkten zu erleichtern.
Aufgaben:
- Analyse bestehender Internationalisierungsmethoden:
- Untersuchung von bestehenden Internationalisierungsstrategien in der Softwareentwicklung.
- Identifikation der Herausforderungen und Grenzen der bestehenden Methoden zur Internationalisierung.
- Recherche zu modernen Ansätzen der Internationalisierung, insbesondere im Zusammenhang mit der Nutzung von LLMs zur maschinellen Übersetzung.
- Entwicklung eines LLM-basierten Internationalisierungskonzepts:
- Untersuchung, wie LLMs genutzt werden können, um die automatische Übersetzung von Menüeinträgen und Hilfetexten zu ermöglichen und den Internationalisierungsprozess zu vereinfachen.
- Entwicklung von Anforderungen an die Software, die eine einfache Integration neuer Sprachen und Übersetzungen sowie die manuelle Überarbeitung durch Übersetzer:innen ermöglicht.
- Konzeption einer neuen Lokalisierungs-Lösung zur Verwaltung und Erweiterung der Sprachressourcen für die genannten CAD-Programme.
- Prototypische Implementierung und Integration:
- Entwicklung eines Prototyps der Softwarelösung zur Demonstration der automatisierten Lokalisierung mithilfe von LLMs.
- Integration der Lösung in die vorhandenen Strukturen der CAD-Programme SheetMetal Works, SheetMetal Inventor und SheetMetal Calculator.
- Implementierung von Funktionen zur Verwaltung und Aktualisierung von Sprachressourcen und zur automatisierten Übersetzung von Benutzeroberflächen und Hilfetexten.
- Evaluierung der Lösung:
- Durchführung einer umfassenden Evaluierung der entwickelten Softwarelösung andhand von CAD-Programmen der betreuenden Firma.
- Analyse der Effizienz und Qualität der automatischen Übersetzungen durch LLMs im Vergleich zu den bestehenden Methoden.
- Sammlung von Feedback durch potenzielle Anwender:innen (z.B. Entwickler:innen, Übersetzer:innen) und iteratives Testen zur Verbesserung der Softwarelösung.
- Dokumentation und Empfehlung:
- Erstellung einer detaillierten Dokumentation des Entwicklungsprozesses, der Implementierungsschritte, der durchgeführten Tests und Evaluierungen sowie der gewonnenen Erkenntnisse.
- Formulierung von Empfehlungen zur Integration der Lösung in die aktiven Produktversionen und zur weiteren Nutzung von LLMs zur Lokalisierung in anderen Softwareprojekten.
Erwartetes Ergebnis:
Die Bachelorarbeit soll eine prototypische Softwarelösung entwickeln und am Beispiel von CAD-Programmen der betreuenden Firma evaluieren, wie LLMs zur automatisierten Lokalisierung eingesetzt werden können. Dabei soll die Arbeit sowohl technische als auch praktische Erkenntnisse darüber liefern, wie LLMs den Übersetzungsprozess vereinfachen und die Mehrsprachigkeit der Programme erweitern können.
Die Arbeit kann dabei auf LLMs zurückgreifen, die vom myLab der TH Lübeck gehosted werden. Sollen darüberhinaus kommerzielle Sprachmodelle genutzt werden, sind die Kosten von der betreuenden Firma zu tragen.