Die Digitalisierung in der Hochschul- und Forschungslandschaft erfordert innovative Methoden zur effizienten Vernetzung und Suche von Expert:innen. Ziel dieser Masterarbeit ist es, zu untersuchen, wie graphbasierte Ansätze die Expertensuche für die regionale Wirtschaft optimieren können. Dazu sollen Expert:innen auf dem Campus anhand bereits vorhandener Informationen, wie bspw. den Webseiten der Institutionen, identifiziert werden, um den Wissenstransfer und die Anbahnung von Kooperationen zu unterstützen.
Ziel:
Das Hauptziel dieser Masterarbeit ist die Untersuchung und Bewertung der Effektivität von Graph/Ontologie-basierten Ansätzen zur Optimierung der Expertensuche in akademischen Netzwerken anhand von automatisiert generierten Expertiseprofilen von Expertiseträger:innen.
Aufgaben:
- Literaturrecherche: Der aktuelle Stand der Technik für Graphdatenbanken, Wissens- und Kompetenzontologien soll ermittelt werden. Dies beinhaltet die Analyse bestehender Systeme zur Expertensuche (in akademischen Netzwerken) und deren Technologien.
- Datensammlung und -verarbeitung: Dies umfasst das systematische Sammeln von Daten aus den Websites der Technischen Hochschule Lübeck und der assoziierten Einrichtungen mit Hilfe von Web-Crawlern sowie das Extrahieren relevanter Texte und Profilinformationen, die für eine Expertensuche mit Hilfe von Large Language Models (LLM) nützlich sein könnten.
- Untersuchung dreier denkbarer Ansätze:
- (A) Untersuchung von Ontologien: Es soll untersucht werden, ob die Generierung von strukturierten Expertise-Profilen durch den Einsatz von Ontologien (wie z.B. SKOS oder ESCO) optimiert werden kann.
- (B) Untersuchung von Expertise-Graphen: Es soll untersucht werden, ob die Erstellung eines Expertise-Graphen, der die extrahierten Profile und deren Beziehungen dauerhaft abbildet, das Retrieval von Expertisen optimieren kann. Dabei sollen die Erkenntnisse aus (A - Ontologien) berücksichtigt werden.
- (C) Untersuchung von Use Case-spezifischen Profilen: Es soll untersucht werden, ob der Einsatz eines Large Language Models zur flexiblen Generierung und Aktualisierung von Profilen (z.B. Personen, Fachgruppen, Institute) basierend auf Web-Crawling-Daten die Expertensuche optimiert. Hierbei ist zu analysieren, ob diese für spezifische Such-Use Cases generierten Profile, im Vergleich zu traditionellen Ontologien (A) und Graphen (B), verbesserte Suchergebnisse und Relevanz bieten.
- Analyse und Bewertung: Die drei genannten Ansätze (A/B/C) sollen prototypisch realisiert und hinsichtlich ihrer Leistungsfähigkeit bei der Erstellung von Profilen und der Suche nach Expertiseträger:innen verglichen werden. Die Auswertung der Suchergebnisse soll automatisiert erfolgen. Die Vor- und Nachteile der Ansätze hinsichtlich Effizienz, Flexibilität, Benutzerfreundlichkeit und Usability sind anhand geeigneter Metriken zu analysieren und zu bewerten. Als Baseline für die Evaluierung soll ein einfacher und rein textbasierter Retrieval Augmented Generation Ansatz dienen, der auf der in Punkt 2) erstellten Datenbasis aufbaut.
- Lessons Learned: Aus den gewonnenen Erkenntnissen sollen Empfehlungen für einen zu verfolgenden Ansatz (A, B oder C) und ein langfristiges Monitoring zur kontinuierlichen Verbesserung des Systems abgeleitet werden. Dies beinhaltet die konzeptionelle Berücksichtigung einer Nutzerbeteiligung zur Optimierung des Systems und zur Anpassung und Verbesserung der Expertenprofil- und Beziehungsdaten.
- Dokumentation und Abschlussarbeit: Alle Phasen der Recherche, Datenerhebung, Untersuchung, Analyse und Bewertung sowie Lessons Learned sollen in der Abschlussarbeit ergebnisorientiert dargestellt werden und sowohl die technischen Details und Hintergründe als auch eine kritische Bewertung der Eignung der untersuchten Ansätze darstellen.