(Junior) AI Application Engineer | AI Products LLM & RAG (m/w/d)

Stellenbeschreibung:

Aufgaben

  • Konzeption und Entwicklung von KI-Anwendungen wie Enterprise-Assistenten, Copiloten, semantischen Suchplattformen und Automatisierungssystemen
  • Unterstützung bei der Entwicklung von LLM-basierten Lösungen (inkl. RAG) sowie End-to-End-KI-Produkten unter Integration von APIs, Unternehmensdaten und Backend-Services
  • Aufbau skalierbarer KI-Microservices, APIs sowie Vektorsuche-, Embedding- und Retrieval-Systeme
  • Schnelles Prototyping von KI-Features und deren Weiterentwicklung zu produktiven Systemen
  • Enge Zusammenarbeit mit Produktmanagern, Designern, KI-Ingenieuren und Kunden zur Entwicklung wirkungsvoller Lösungen
  • Deployment von KI-Systemen in Cloud- und Produktionsumgebungen unter Nutzung moderner DevOps-Praktiken
  • Sicherstellung von Zuverlässigkeit, Skalierbarkeit und Observability durch CI/CD, Monitoring und containerisierte Deployments

Benefits

  • Regelmäßige und systematische (externe und interne) Weiterbildungsmöglichkeiten in den Bereichen Generative AI, LLM-Entwicklung, Cloud-Architektur und Data Science
  • Arbeit in einer offenen, flachen Umgebung , innerhalb eines breiten Reply-Netzwerks zum Wissensaustausch
  • Preisgekrönte Büroräume in der Münchner Innenstadt mit Zugang zur Stammstrecke
  • Fahrkarte für öffentliche Verkehrsmittel mit Deutschlandticket
  • Beteiligung an deinen sportlichen Aktivitäten über den EGYM Wellpass und weitere Benefits der Reply Gruppe
  • Flexible Arbeitsumgebung zwischen Kunden, Reply-Büro und Remote-Arbeit

Qualifikationen

  • Abgeschlossenes Studium in Informatik, Software Engineering, Data Science oder einem vergleichbaren technischen Bereich
  • Programmierkenntnisse in Python und modernen Backend-Frameworks sowie Erfahrung mit KI-, Machine-Learning- und generativen KI-Anwendungen
  • Erste Erfahrung in der Entwicklung skalierbarer Backend-Systeme, APIs und Microservices sowie Kenntnisse in RAG , Vektordatenbanken und Retrieval-Technologien
  • Praxis in Containerisierung und DevOps (z. B. Docker, CI/CD, Kubernetes) sowie Deployment von KI-Services in Cloud-Umgebungen (AWS, Azure, GCP)
  • Berührungspunkte mit relevanten Frameworks (z. B. LangChain, LlamaIndex, Hugging Face)
  • Kenntnisse in Monitoring, Observability sowie Evaluation und Optimierung von LLM-Systemen
  • Sehr gute Deutsch- und Englischkenntnisse für Workshops und Kommunikation

#J-18808-Ljbffr
NOTE / HINWEIS:
EnglishEN: Please refer to Fuchsjobs for the source of your application
DeutschDE: Bitte erwähne Fuchsjobs, als Quelle Deiner Bewerbung

Stelleninformationen

  • Veröffentlichungsdatum:

    05 Mai 2026
  • Standort:

    München

    Einsatzort:

    Deutschland
  • Typ:

    Vollzeit
  • Arbeitsmodell:

    Vor Ort
  • Kategorie:

  • Erfahrung:

    2+ years
  • Arbeitsverhältnis:

    Angestellt

KI Suchagent

AI job search

Möchtest über ähnliche Jobs informiert werden? Dann beauftrage jetzt den Fuchsjobs KI Suchagenten!

Diese Jobs passen zu Deiner Suche: