Inhaltsverzeichnis
In der Welt der Technischen Dokumentation müssen große Mengen an Inhalten und Informationen organisiert werden. Eine zentrale Rolle spielen dabei Taxonomien, die Informationen in einer Art Baumstruktur hierarchisch ordnen. Ontologien ermöglichen darüber hinaus, komplexe Netzwerke und verschiedene Arten von Beziehungen abzubilden. Wie kann nun KI beim Aufbau dieser Strukturen unterstützen?
Das Zusammenspiel von KI und Taxonomien bzw. Ontologien ist sehr spannend: Zum einen kann KI uns beim Aufbau dieser Strukturen unterstützen. Umgekehrt profitieren KI-Anwendungen von einer sinnvollen Strukturierung von Inhalten. Grund genug, sich einmal mit diesem Wechselspiel zu befassen. Ich habe dazu meine Kolleg:innen Daniel, Lena und Franzi befragt.
Wie kann KI beim Aufbau von Taxonomien helfen?
Daniel: Beim Aufbau von Taxonomien kann man sehr gut Large Language Models (LLMs) einsetzen. Dabei ist es auch nicht notwendig, die Sprachmodelle weiter zu trainieren. Es reicht aus, sie durch detaillierte Anweisungen in einem Prompt für die Aufgabe zu instruieren. Das zeige ich z. B. auch in unserem Powerwebinar „Prompt Engineering für die Technische Redaktion“.
Der Prompt sollte unter anderem die Beschreibung der zu erstellenden Taxonomie enthalten. Handelt es sich beispielsweise um eine Taxonomie zur Produktwelt des Unternehmens oder zu dessen Vertriebsregionen? Außerdem ist es hilfreich, im Prompt zu definieren, wie die Hierarchie genau aussehen soll. Dazu ein Beispiel aus der Produktwelt: Sollen nur Produktgruppen oder auf einer niedrigeren Hierarchieebene auch Produktserien und zugehörige Produktvarianten berücksichtigt werden? Wenn bereits Metadaten vorhanden sind, können diese zusätzlich zum Content genutzt werden, um bessere Ergebnisse zu erzielen. So können etwa technische Merkmale oder Beschreibungen dem Sprachmodell beim Aufbau einer Produkttaxonomie dabei helfen, die Produkte genauer zu verstehen.
Des Weiteren können LLMs aufgrund ihres umfangreichen Sprach- und Weltwissens nicht nur Taxonomieeinträge aus Inhalten und Metadaten extrahieren, sondern auch selbst übergeordnete Hierarchieebenen ableiten. Produkte können so etwa unter einer Baugruppe gruppiert werden, ohne dass die Baugruppe explizit im Text erwähnt wird.
Lena: Eine gut strukturierte Taxonomie, bzw. auch darüber hinaus eine gut strukturierte Klassifikation, hilft uns dabei, intelligenten Content zu erstellen, der standardisiert und so weit wie möglich wiederverwendbar ist. Varianten innerhalb des Contents sollten nur dort verwendet werden, wo es wirklich notwendig ist. Voraussetzungen für Wiederverwendung sind die Verwendung einer einheitlichen Terminologie und die Anwendung von regelbasiertem Schreiben. Ziel ist es, die Content-Erstellung auf Effizienz zu optimieren, um regelmäßig wiederkehrende Tätigkeiten im Prozess zu automatisieren und um den Anwender:innen die Informationen in ihrer Arbeitsumgebung in einem für sie notwendigen Umfang zu übermitteln – Content Delivery also.
Für all diese Aspekte brauchen wir eine logisch aufgebaute Klassifikation. Daher ist es umso wichtiger, den KI-Output sehr kritisch zu hinterfragen – immerhin sind die Ausgangsdaten in den meisten Fällen nicht fehlerfrei. Wer mehr darüber erfahren möchte, was eine logische Taxonomie ausmacht, kann sich in unserer Webinaraufzeichnung „Taxonomien in SCHEMA ST4 – Back to the Basics“ informieren.
Franzi: Die Basis für den Aufbau einer Taxonomie ist unter anderem eine gut gepflegte Terminologiedatenbank. Mit den darin enthaltenen Vorzugsbenennungen für die Begriffe, deren Definitionen und weiteren Daten kann die KI die Hierarchien besser definieren. Wichtig ist jedoch, dass die Definitionen eines Begriffs qualitativ hochwertig sind, den Oberbegriff nennen und nur bevorzugte Benennungen enthalten. Tools wie Coreon unterstützen bei der Strukturierung der Terminologiedaten, indem u.a. Begriffe hierarchisch geordnet werden.
Wie können Taxonomien für KI-Anwendungen genutzt werden?
Daniel: Taxonomien können grundsätzlich zwei Arten von KI-Anwendungen unterstützen, nämlich Klassifikatoren und Chatbots. Tools wie der AI Jetpack in ST4 ermöglichen die automatische Klassifizierung von Inhalten anhand zuvor hinterlegter Taxonomien. Die Klassifikation stellt einen wesentlichen Schritt auf dem Weg zu intelligentem Content dar und ist Bestandteil unseres Reifegradmodells für die Digitalisierung.
Mithilfe von klassifiziertem Content und Taxonomien können KI-Chatbots viel präzisere Antworten geben. Wenn ein Nutzer wissen möchte, zu welcher Baugruppe ein Produkt gehört oder welche Vertriebsregion für dieses Produkt zuständig ist, kann der Chatbot die Anfrage dank der zugrunde liegenden Klassifikation und Taxonomie spezifischer beantworten.
Lena: Ein weiterer Anwendungsbereich wäre dann auch die KI-gestützte Prüfung von Content hinsichtlich der für den jeweiligen Informationstyp erforderlichen Anforderungen. Denn beispielsweise können für Bedienungsanleitungen andere Formulierungsregeln oder formal-strukturelle Regeln gelten als für Konformitätserklärungen oder technische Datenblätter. Wenn diese Regeln mit der Klassifikation verknüpft sind, kann die KI diese Regeln anwenden.
Und geht da noch mehr?
Franzi: Für weitergehende KI-Anwendungen lohnt es sich, auch Ontologien zu betrachten, da diese ja nicht nur hierarchische, sondern auch andere Beziehungstypen abbilden können. Mit Ontologien können ganz neue Beziehungen und Konzepte identifiziert werden, wie etwa Abhängigkeiten zwischen Komponenten, Vertriebsregionen untereinander oder die Beziehungen von Produktvarianten mit bestimmten Eigenschaften und Konfigurationen. Da ist viel vorstellbar!
Wir können also in beide Richtungen profitieren: KI kann uns beim Aufbau von Taxonomien und anderen Wissensnetzen unterstützen, und umgekehrt können wir mit Taxonomien im Hintergrund den Einsatz von KI gezielter ausbauen und die KI noch passgenauer für spezifische Anwendungsfälle nutzen. Und damit ist das Potenzial sicher noch nicht ausgeschöpft.