Doktorand*in Embedded AI Systems: Laufzeitoptimierung für Transformer-Modelle
Stellendetails zu: Doktorand*in Embedded AI Systems: Laufzeitoptimierung für Transformer-Modelle
Angebotsart: Arbeit
Arbeitgeber: Fraunhofer-Gesellschaft e.V. Zentrale München
Beginn ab
Anstellungsart
Vollzeit
Stellenbeschreibung
Die Fraunhofer-Gesellschaft ( ) ist eine der weltweit führenden Organisationen für anwendungsorientierte Forschung. 75 Institute entwickeln wegweisende Technologien für unsere Wirtschaft und Gesellschaft - genauer: 32 000 Menschen aus Technik, Wissenschaft, Verwaltung und IT. Sie wissen: Wer zu Fraunhofer kommt, will und kann etwas verändern. Für sich, für uns und die Märkte von heute und morgen.
Unsere Forschungsgruppe „Smart Embedded Systems" entwickelt ressourceneffiziente KI-Systeme für eingebettete/Edge-Systeme und kooperiert dabei eng mit der Universität Duisburg‑Essen (Lehrstuhl Elektronische Bauelemente und Schaltungen). Wir optimieren KI-Modelle und -Software für den Einsatz in eingebetteten und Edge-Systemen. In diesem Umfeld entwickeln wir innovative Laufzeitsysteme und Scheduling‑Verfahren, die Large Language Models (LLMs) adaptiv und energieeffizient auf Edge‑Geräten ausführen. Unsere Anwendungsfelder umfassen Smart Health, Robotik und sichere Mensch‑Maschine‑Interaktion: Domänen, in denen Datenschutz, niedrige Latenz und begrenzter Energieverbrauch entscheidend sind.
Ihre Mission: Im deutsch‑taiwanesischen Forschungsprojekt STICAM (Secure Transformers in Cache Memory) entwickeln Sie eine neue Generation adaptiver Scheduling‑Algorithmen, die entscheiden, wie begrenzte Hardware‑Ressourcen zur Laufzeit optimal zwischen Inferenzphasen, Nutzersessions und Sicherheitsmechanismen aufgeteilt werden. Ihr Ziel: Große Sprachmodelle (LLMs) laufen mit minimaler Latenz und maximalem Datenschutz direkt auf dem Endgerät ohne Cloud. Die Anwendungen reichen von intelligenten Gesundheitssystemen über autonome Robotik bis zur sicheren Mensch‑Maschine‑Interaktion.
Verantwortlichkeiten
- Sie erarbeiten den Stand der Wissenschaft zu Scheduling von KI-Operationen, Online-Optimierung, lernbasierter Ressourcenallokation und Echtzeitsystemen im Kontext heterogener Rechensysteme. Daraus identifizieren Sie offene Forschungsfragen und positionieren Ihre Dissertation.
- Sie formalisiere das Problem der Laufzeit‑Orchestrierung (Zuweisung begrenzter Rechen‑/Speicherressourcen auf konkurrierende Aufgaben) als Optimierungsproblem. Sie analysieren dessen Komplexität, identifizieren nutzbare Strukturen und entwickeln neuartige Algorithmen – von mathematisch fundierten Heuristiken bis zu lernbasierten Ansätzen (z. B. Reinforcement Learning). Dabei nutzen Sie Python für Prototyping und Simulation sowie C/C++ für performancekritische Implementierungen.
- Sie untersuchen, ob und wann trainierte Policies (z. B. via Reinforcement Learning) statische Heuristiken übertreffen und unter welchen Bedingungen diese auf eingebetteter Hardware in Echtzeit ausführbar sind. Sie analysieren die Wechselwirkung zwischen Scheduling‑Entscheidungen und Sicherheitsmechanismen (z. B. Memory‑Isolation).
- Sie implementieren Ihre Verfahren als Teil eines Laufzeitsystems auf eingebetteter Hardware z. B. RISC‑V‑SoC, ARM Cortex‑A/M, FPGA‑basierte Systeme und evaluieren sie mit realen KI‑Workloads (Transformer‑Inference). Sie erheben quantitative Messdaten zu Latenz, Durchsatz und Energieeffizienz.
- In regelmäßigen Projektmeetings und bei Forschungsaufenthalten in Taiwan stimmen Sie sich mit Hardware‑Teams ab und integrieren Ihr Laufzeitsystem in die Gesamtarchitektur.
- Sie veröffentlichen auf internationalen Konferenzen (z. B. MLSys, ASPLOS, RTAS, NeurIPS Systems Track, DATE) und in Fachjournals. Sie betreuen Bachelor‑/Masterarbeiten und studentische Hilfskräfte zu Teilaspekten Ihres Themas.
Ihr Profil
Mindestqualifikation:
- Sehr gut abgeschlossenes wissenschaftliches Studium (Master/Uni‑Diplom) in Elektrotechnik, Informatik, Technischer Informatik, Physik, Mathematik oder vergleichbar
- Fundierte Programmierkenntnisse in C/C++ und Python
- Erfahrung mit maschinellem Lernen, idealerweise Transformer‑Architekturen
- Strukturierte Arbeitsweise, um sich in neue wissenschaftliche Themen einzuarbeiten sowie Spaß an kollaborativer Arbeit in einem interdisziplinären und internationalen Team, das von frischen Ideen lebt
- Sehr gute Deutsch- und Englischkenntnisse für die Zusammenarbeit in einem internationalen Umfeld
Wünschenswerte Qualifikationen:
- Erfahrung mit Reinforcement Learning und/oder numerischer Optimierung
- Kenntnisse in KI‑Frameworks (PyTorch, Jax, ONNX, Huggingface Transformers u.ä.)
- Erste Erfahrung mit eingebetteter Softwareentwicklung
Benefits
- Promovieren Sie innerhalb von 3 Jahren in einem anwendungsorientierten Thema an der Schnittstelle von algorithmischer Optimierung, KI‑Systemen und Edge‑Computing. Als Doktorarbeit wird Ihnen die Universität Duisburg‑Essen die Promotion verleihen. Sie können für Ihre praktischen Arbeiten auf institutuigene Elektronik‑Labore, Recheninfrastruktur und EDA‑Toolchains zugreifen. Lehrverpflichtungen werden Ihnen nicht übertragen.
- Im Rahmen des internationalen STICAM‑Projekts nehmen Sie an mehrwöchigen Forschungsaufenthalten bei den taiwanesischen Partnerinstitutionen teil und veröffentlichen auf internationalen Konferenzen.
- Regelmäßiger organisierter Austausch über den wissenschaftlichen Stand Ihrer Arbeit im Rahmen eines Doktormütter‑/vätergremiums.
- Begleitende Angebote unterstützen Sie während der Promotionszeit: Promovenden‑Coaching und Projektmanagementmethoden.
- Bei fristgerechter Einreichung der Dissertation gibt es die Option, Forschungsarbeiten weiter zu vertiefen bzw. in andere Bereiche zu wechseln. Die Vollzeitstelle als Doktorand*in mit halber Vergütung bietet 50 % der Zeit für Ihre Promotion sowie 50 % für die Mitarbeit in Forschungsprojekten als wissenschaftliche*r Mitarbeiter*in.
- Flexible Arbeitszeiten (Gleitzeit mit integrierter Kernarbeitszeit von 9.30 - 15.00 Uhr, Freitag von 9.30 - 13.00 Uhr) und mobiles Arbeiten an bis zu zwei Tagen pro Woche.
- Betriebliche Altersvorsorge (VBL) und Zuschuss zum Deutschland‑Ticket Job.
- Sehr gute Verkehrsanbindung mit ÖPNV/Auto sowie kostenlose Parkplätze und Fahrradstellplätze für Mitarbeitende.
- Unterstützungsangebote zur Vereinbarkeit von Familie und Beruf: Mit‑Kind‑Büro, Kindernotbetreuung und Beratungsleistungen zu Homecare‑Eldercare in Kooperation mit dem pme Familienservice.
- Corporate Benefits: Vergünstigte Angebote namhafter Hersteller und Marken.
EEO Statement
Wir wertschätzen und fördern die Vielfalt der Kompetenzen unserer Mitarbeitenden und begrüßen daher alle Bewerbungen – unabhängig von Alter, Geschlecht, Nationalität, ethnischer und sozialer Herkunft, Religion, Weltanschauung, Behinderung sowie sexueller Orientierung und Identität. Schwerbehinderte Menschen werden bei gleicher Eignung bevorzugt eingestellt. Für Bewerber*innen mit Behinderung finden wir gemeinsam Lösungen, die ihre Fähigkeiten optimal fördern.
Weitere Informationen
Die Stelle ist auf 3 Jahre befristet. Die wöchentliche Arbeitszeit beträgt 39 Stunden. Anstellung, Vergütung und Sozialleistungen basieren auf dem Tarifvertrag für den öffentlichen Dienst (TVöD). Zusätzlich kann Fraunhofer leistungs‑ und erfolgsabhängige variable Vergütungsbestandteile gewähren.
#J-18808-Ljbffr