LLM Knowledge Modeling Engineer (m/w/d)

neustrom Berlin

Stellenbeschreibung:

Vielen Dank für dein Interesse an einer Mitarbeit bei neustrom!

Ups! Beim Absenden des Formulars ist etwas schiefgegangen. Bitte kontaktiere uns via

Hilf KI-Systemen, unser Unternehmen zu verstehen – und unsere Mission richtig zu erzählen. Wir suchen dich, um die Brücke zwischen unserem Unternehmen und der nächsten Generation von KI zu bauen – damit diese Systeme unser kollektives Wissen richtig erfassen und nutzen können.

Gestalte und baue die semantische Schicht, die es LLMs ermöglicht, unsere Organisation zu verstehen – von Produktarchitektur über Verträge bis hin zu Code. Du entwickelst Ontologien, definierst Taxonomien und nutzt Prinzipien des semantischen Webs, um internes Wissen zu extrahieren, zu strukturieren und zugänglich zu machen. Damit ermöglichst du es sowohl privaten als auch öffentlichen LLMs, über unser Unternehmen wie ein Insider zu denken.

Bei neustrom - powered by Frequenz

  • Unternehmen zu helfen, ihre Energie selbstbestimmt zu managen – effizienter, kostengünstiger, risikoärmer und CO₂-reduziert.
  • Open-Source-Tools für Energiesouveränität bereitzustellen – für dezentrale und resiliente Systeme in Wirtschaft und Gesellschaft.

In dieser Rolle sorgst du dafür, dass unsere Open-Source-Projekte für LLMs und das gesamte KI-Ökosystem gut sichtbar, strukturiert und zugänglich sind.

Deine Aufgaben

Wissensmodellierung & Strukturierung

  • Entwicklung von Ontologien und Taxonomien, die unsere Unternehmenssemantik erfassen
  • Aufbau von Pipelines zur Extraktion und Strukturierung von Wissen aus Dokumenten, Verträgen, Code und internen Systemen
  • Erstellung maschinenlesbarer Wissensdarstellungen (z.B. JSON-LD, RDF, schema.org, OpenGraph)
  • Gestaltung modularer Content-Blöcke (z.B. FAQs, Q&A, Use-Cases) für semantische Suche und LLMs
  • Versionspflege von Knowledge Graphs, um die Synchronisierung mit sich entwickelnden internen Systemen und Vokabularen zu gewährleisten

Optimierung von KI-Sichtbarkeit

  • Strategien entwickeln, um internes Wissen für LLMs zugänglich zu machen
  • Aufbau und Tuning von Retrieval-Augmented-Generation-/RAG-Pipelines inkl. Strategien für Retriever, Ranker, Chunking
  • Überwachung und Analyse der Retrieval-Qualität und des Halluzinationsverhaltens, Iteration der Inhaltsstruktur und Abstimmung der Eingabeaufforderungen
  • Pflege unserer Präsenz in Public Knowledge Graphs (GitHub, Wikipedia, Wikidata, Crunchbase, LinkedIn)
  • Implementierung von Vertrauens- und Transparenzsignalen (Autorschaft, Zitation, Domain Authority) zur Verbesserung der Faktengenauigkeit und zur Verringerung von KI-Halluzinationen
  • LLM-Feedback-Schleifen einrichten, um Benutzeranfragen zu verfolgen, mögliche Blindspots aufzudecken und das offengelegte Unternehmenswissen im Laufe der Zeit zu verfeinern
  • Aufbau von internen Wissenszugriffsschichten mit Embedding-Modellen, Metadaten-Tags und Vektordatenbanken
  • Integration interner Wissensquellen mit LLMs via LangChain, LlamaIndex oder eigenen Retrieval-Lösungen
  • Entwicklung von APIs oder Schnittstellen zu Agenten für strukturierte Wissensbereitstellung
  • Sicherstellung von Zugriffsschutz, Datenschutz und Compliance bei sensiblen Informationen

Engineering & Zusammenarbeit

  • Schnittstelle zu APIs (REST, GraphQL), um strukturierte Inhalte zu pushen/zu ziehen und zur Bereitstellung strukturierter, LLM-kompatibler Inhalte
  • Du bist Schnittstelle zwischen Engineering, Product, Legal und AI-Tooling – und übersetzt unser Wissen in maschinenlesbare Formate
  • Du dokumentierst und trägst zu Open-Source-Projekten bei, um sicherzustellen, dass sie auffindbar, maschinen-optimiert und semantisch korrekt sind
  • Aktives Verfolgen von Entwicklungen rund um LLM, RAG, semantisches Web und Wissensinfrastruktur

Dein Profil

Technische Fähigkeiten:

  • Erfahrung mit Ontologien & Semantic Web, Web Scraping (z.B. BeautifulSoup, Playwright, Puppeteer), strukturierten Datenformaten (schema.org, JSON-LD, RDF), API-Integration (REST, GraphQL)
  • Design von Ontologien zur Definition von Datenbeziehungen und Konzepten
  • Vertraut mit LLM-Funktionsweise (Retrieval & Assembly von Inhalten)
  • Analytische Denkweise, um zu testen, wie gut KI-Modelle unsere Inhalte verstehen und abrufen, und um zu verbessern, wie effizient sie daraus lernen
  • Praktische Erfahrung mit Versionskontrolle (Git, GitHub)
  • Erfahrung mit SPARQL oder Wikidata
  • Arbeit mit Embedding-Modellen (z.B. OpenAI, Pinecone)
  • Kenntnisse in LangChain, RAG-Pipelines
  • Erfahrung mit Tools wie Screaming Frog, Perplexity Pro o.Ä. zur Analyse von AI Visibility
  • Beiträge zu Open-Source-Projekten (idealerweise in KI, Energiesystemen, Semantik, Datenverarbeitung)
  • Tüftler- und Hackergeist, experimentierfreudig und datengetrieben, offen für schnelles Ausprobieren und Lernen aus Fehlern
  • Neugierig auf die Zukunft von KI

Wenn du gern Systeme durchdringst, Code schreibst, AI-Verhalten analysierst und verstehen willst, wie Maschinen denken – dann bewirb dich jetzt bei neustrom - powered by Frequenz

#J-18808-Ljbffr
NOTE / HINWEIS:
EnglishEN: Please refer to Fuchsjobs for the source of your application
DeutschDE: Bitte erwähne Fuchsjobs, als Quelle Deiner Bewerbung

Stelleninformationen

  • Typ:

    Vollzeit
  • Arbeitsmodell:

    Vor Ort
  • Kategorie:

  • Erfahrung:

    2+ years
  • Arbeitsverhältnis:

    Angestellt
  • Veröffentlichungsdatum:

    04 Nov 2025
  • Standort:

    Berlin

KI Suchagent

AI job search

Möchtest über ähnliche Jobs informiert werden? Dann beauftrage jetzt den Fuchsjobs KI Suchagenten!