Inhaltsverzeichnis
Wenn Sie die ersten beiden Teile unserer Reihe „KI-Basics einfach erklärt“ gelesen haben, dann sind Sie vertraut mit großen und kleinen Sprachmodellen (LLM vs. SLM) und dem Thema Prompting. In diesem Teil geht es um das Erweitern der Leistungsfähigkeit von Sprachmodellen ohne aufwendiges und teures Training. Dabei klären wir, was Agenten mit KI zu tun haben, was ein Knowledge-Graph ist und was man unter Retrieval-Augmented Generation versteht.
Sprachmodelle erweitern ohne Training
Die Kosten für das Pre-Training großer Sprachmodelle (LLMs) können im zwei- bis dreistelligen Millionenbereich liegen. Auch das Fine-Tuning von Modellen kann unter Umständen hohe Kosten verursachen. Wäre es da nicht schön, wenn es ressourcenschonendere Möglichkeiten gäbe, die Leistung von Sprachmodellen zu erweitern? Die gibt es zum Glück:
- Knowledge Graphs
- Retrieval-Augmented Generation (RAG)
Wir schauen uns beide Konzepte jetzt genauer an.
Knowledge Graphs: Strukturierte Wissensspeicher für KI
Ein Knowledge Graph ist eine semantische Datenbank, die Informationen in Form von Knoten (Entitäten) und Kanten (Beziehungen) speichert. Sie speichern Wissen als Netzwerk von miteinander verbundenen Datenpunkten – ähnlich wie unser Gehirn Informationen verknüpft. Anders als herkömmliche Datenbanken, die oft nur Listen oder Tabellen enthalten, zeigen Knowledge Graphs also, wie verschiedene Konzepte miteinander verknüpft sind. Mit Knowledge Graphs kann eine KI auf strukturiertes Wissen zugreifen, Informationen besser interpretieren und präzisere Antworten liefern.
Wenn Sie jetzt beim Lesen an iiRDS denken, dann liegen Sie genau richtig. Der iiRDS-Standard wurde entwickelt, um technische Dokumentation und Informationen intelligent zu strukturieren, auszutauschen und zu verknüpfen. Er definiert ein einheitliches Metadatenmodell für technische Dokumentation und verwendet RDF (Resource Description Framework) als Grundlage – dieselbe Technologie, die auch für Knowledge Graphs verwendet wird. iiRDS stellt eine Ontologie für die Technische Dokumentation bereit, die in Knowledge Graphs integriert werden kann. Die iiRDS-Metadaten schaffen semantische Beziehungen zwischen Dokumentationselementen, was eine Knowledge-Graph-ähnliche Struktur schafft.
Knowledge Graphs sind also auch auf die Inhalte der Technischen Dokumentation anwendbar. In der Technischen Redaktion werden große Mengen an Produktinformationen, Handbüchern und Anleitungen verwaltet. Ein Knowledge Graph kann hier helfen, dieses Wissen strukturiert zu organisieren und dann effizient für Support-Systeme oder Chatbots nutzbar zu machen.
Retrieval-Augmented Generation (RAG): Mehr Infos für die KI
Retrieval-Augmented Generation (RAG) kombiniert zwei KI-Techniken: Informationsabruf (Retrieval) und Textgenerierung (Generation). Statt nur auf bereits gelerntem Wissen zu basieren, kann eine KI zusätzliche Informationen aus externen Datenquellen abrufen und in ihre Antworten einfließen lassen.
In der Abrufphase stellt ein User eine Anfrage (Prompt) und die KI durchsucht eine Wissensbasis (z. B. Datenbanken, technische Dokumentationen, Produktbeschreibungen oder Handbücher) nach relevanten Informationen (Kontext).
Das Sprachmodell erhält sowohl die ursprüngliche Anfrage als auch die abgerufenen Kontextinformationen, um eine fundierte Antwort zu generieren. Das Modell integriert das abgerufene Wissen mit seinen eigenen Parametern, um eine kohärente, faktenbasierte Antwort zu erstellen, die sowohl auf externem Wissen als auch auf seinen trainierten Fähigkeiten basiert.

Retrieval-Augmented-Generation (RAG)
KI-Agenten: KI mit Entscheidungsfähigkeit
Ein KI-Agent ist ein System, das autonom agiert, Entscheidungen trifft und Handlungen ausführt. Der Agent kann aktiv mit anderen Systemen interagieren, Aufgaben bearbeiten und externe Tools oder Dienste nutzen. Agentisches Verhalten lässt sich auch mit RAG kombinieren, wobei der KI-Agent dann nicht nur aktuelle Wissensbestände durchforsten und dadurch bessere Antworten generieren kann, sondern auch Bearbeitungen an der Wissensbasis vornehmen kann.
Wichtige Konzepte sind dabei
- „Wahrnehmung“ und Umgebung: Beispielsweise Usereingaben und berücksichtigen einer Wissensbasis (siehe RAG)
- Entscheidungsfindung: Auf Basis der erfassten Informationen eigenständig entscheiden, welche Aktion als Nächstes erforderlich ist
- Handlungsfähigkeit: Der Agent kann die Entscheidung nicht nur treffen, sondern auch selbstständig ausführen, etwa durch sogenanntes Function Calling, das Aufrufen von Funktionen externer Dienste oder des eigenen Programmcodes.
Wie kann das in der Praxis aussehen? Eine Technische Redakteurin fragt einen KI-Agenten: „Welche Änderungen gibt es in der neuesten Version der Dokumentation?“
- Der Agent erkennt, dass er die Versionshistorie abrufen muss und nutzt Function Calling, um das Dokumentationssystem zu durchsuchen.
- Die neuesten Änderungen werden extrahiert und zusammengefasst.
- Der Agent formuliert eine verständliche Antwort: „In der neuesten Version wurden die Kapitel zur Wartung aktualisiert und ein neuer Abschnitt zur Fehlerbehebung hinzugefügt.“
Recap & Ausblick
In diesem Teil haben wir gesehen, wie sich die Leistungsfähigkeit von Sprachmodellen ohne zusätzliches Training verbessern lässt, indem das Modell eine eigene Wissensbasis in seine Antworten einbezieht. Manchmal reicht das aber nicht und man möchte das Modell auf bestimmte Aufgaben oder eine bestimmte technische Domäne „trimmen“. Das geschieht durch sogenanntes Fine-Tuning, mit dem wir uns im vierten und letzten Teil unserer Serie befassen.