Die Navigationskarte für generative künstliche Intelligenz
3.0.1
Generative KI (auf Englisch Generative Artifical Intelligence, kurz GenAI) ist ein Teilbereich der Künstlichen Intelligenz, der darauf spezialisiert ist, neue Inhalte wie Texte, Bilder, Musik oder Code zu erschaffen, indem er aus großen Datenmengen lernt und daraus eigenständig neue, ähnliche Muster generiert. Während der Oberbegriff Künstliche Intelligenz alle Systeme umfasst, die menschenähnliche Intelligenzleistungen erbringen können - wie etwa Sprache verstehen, logische Schlüsse ziehen oder Muster erkennen - konzentriert sich generative KI speziell auf den kreativen Aspekt der Inhaltserstellung.
KI-Modelle
Generative KI-Modelle lassen sich grob in zwei Kategorien einteilen: Unimodale Modelle, die auf eine bestimmte Art von Eingaben spezialisiert sind (wie reine Sprachmodelle für Text oder spezialisierte Bildgenerierungsmodelle), und multimodale Modelle, die mehrere Arten von Eingaben gleichzeitig verarbeiten können (Text, Bilder, Audio oder Video). Der Trend in der Entwicklung geht dabei stark in Richtung multimodaler Modelle, da diese vielseitiger einsetzbar sind und näher an der menschlichen Art der Informationsverarbeitung liegen, indem sie verschiedene Eingabeformen verstehen und miteinander in Beziehung setzen können. Mittlerweile ist das Angebot von KI-Modellen förmlich explodiert und unüberschaubar geworden. Deshalb werden hier nur die aus Sicht des Autors interessantesten Modelle aufgeführt.
Tools/Frameworks/Formate für KI-Modelle
IT-Entwicklungswerkzeuge im Kontext von KI
KI-Assistenten/-Agenten
Die Grenzen zwischen KI‑Assistenten und KI‑Agenten verschwimmen zunehmend, auch wenn grundlegende Unterschiede bestehen bleiben. Während klassische Assistenten primär auf Nutzer‑Eingaben reagieren, entwickeln sich moderne Systeme zu hybriden Lösungen, die sowohl reaktive als auch autonome Funktionen kombinieren.Ein anschauliches Beispiel ist der ChatGPT Agent von OpenAI, der am 17. Juli 2025 eingeführt wurde. Er vereint klassische Chatbot‑Funktionen mit der Fähigkeit, eigenständig Aktionen auf einem virtuellen Computer auszuführen und komplexe Aufgaben zu erledigen, während Nutzer jederzeit eingreifen können. Auch Anthropic treibt diesen Ansatz weiter voran – mit Claude Code, einem agentischen Kodier‑Assistenztool, das direkt im Terminal arbeitet und Entwicklern erlaubt, Aufgaben eigenständig durchführen zu lassen, etwa Funktionen zu implementieren, Bugs zu beheben oder Commit‑Aktionen auszuführen.Die grundlegende Unterscheidung bleibt klar: Assistenten reagieren primär auf definierte Nutzereingaben und unterstützen bei klar umrissenen Aufgaben, während Agenten proaktiv handeln und eigenständig Entscheidungen und Aktionen übernehmen können.Dem Branchentrend zufolge wird erwartet, dass bis 2028 etwa 15 % der täglichen Arbeitsentscheidungen von autonomen KI‑Systemen übernommen werden.
Ranking, Evaluation und
Benchmarking von KI-Modellen
Anwendungsgebiete
Generative Künstliche Intelligenz (GenAI) findet Anwendung in vielfältigen Bereichen wie der Erstellung kreativer Inhalte (Bilder, Musik, Texte) sowie in der Medizin, etwa bei der Entwicklung neuer Medikamente oder der Verbesserung medizinischer Bildgebung. In der Wirtschaft wird sie zur Marktanalyse, Produktdesign und Prozessoptimierung genutzt, während sie in der Robotik Bewegungsplanung und Umgebungsinteraktion ermöglicht. GenAI unterstützt die Bildung durch personalisierte Lernmaterialien und Simulationen und spielt eine zentrale Rolle in der Unterhaltung bei der Generierung von Charakteren, Levels oder visuellen Effekten. Weitere Anwendungen umfassen die Automatisierung von Rechtsdokumenten, die Simulation von Umweltmodellen und die Erstellung von Werbe- und Marketingkampagnen. Durch ihre Vielseitigkeit hat GenAI sowohl aktuelle als auch zukünftige Potenziale in nahezu allen Branchen.
KI-Initiativen
Wichtige Veröffentlichungen
Ausblick/Zukunft der KI
KI und IT
Grundlagen für LLMs
- Machine Learning
Machine Learning ist ein Teilgebiet der künstlichen Intelligenz, bei dem Computersysteme die Fähigkeit erhalten, aus Erfahrungen zu lernen und sich zu verbessern, ohne explizit programmiert zu werden. Statt feste Regeln zu befolgen, erkennen Machine Learning Algorithmen Muster in Daten und entwickeln Modelle, die Vorhersagen treffen oder Entscheidungen ohne menschliches Eingreifen fällen können. Diese datengetriebene Herangehensweise ermöglicht es Systemen, komplexe Aufgaben wie Bilderkennung, Sprachverarbeitung oder Empfehlungssysteme zu bewältigen, indem sie aus Beispielen lernen und ihre Leistung mit mehr Daten kontinuierlich verbessern.
Der "Open"-Begriff bei KI-Modellen
Die Philosophie der Offenheit bei KI-Modellen umfasst mehrere komplementäre Dimensionen: Open Source gibt Einblick in den Code und die Algorithmen der KI-Systeme, Open Weights macht die trainierten Modellparameter zugänglich, Open Data ermöglicht den Zugang zu den Trainingsdaten, und Open Science sorgt für Transparenz in den Forschungsmethoden und -ergebnissen. Diese vier Aspekte der Offenheit bilden zusammen ein Ökosystem, in dem KI-Systeme umfassend geprüft, verstanden und kollaborativ weiterentwickelt werden können. Die heutigen KI-Modelle setzen diese Philosophie in unterschiedlichem Maße um – einige veröffentlichen nur ihre Modellgewichte, während andere auch Trainingsdaten oder Forschungsmethoden teilen, was zu unterschiedlichen Graden von Transparenz und Nachvollziehbarkeit führt. Die Kombination von Open Source, Open Weights, Open Data und Open Science schafft ein Fundament für Wissensaustausch und gemeinschaftliche Innovation im Bereich der künstlichen Intelligenz.
Probleme und Herausforderungen bei der
Erstellung und Nutzung von KI-Modellen
Recht und Regulatorik
Recht umfasst verbindliche gesetzliche Regelungen, die von staatlichen oder supranationalen Institutionen erlassen und von Gerichten durchgesetzt werden, beispielsweise im Strafrecht, Zivilrecht oder Datenschutzrecht. Regulatorik hingegen bezeichnet spezifische Vorschriften und Maßnahmen, die von Aufsichtsbehörden oder Regulierungsstellen entwickelt werden, um gesetzliche Rahmenbedingungen praxisnah und branchenspezifisch umzusetzen, etwa in der Finanz- oder Technologieregulierung. Während Recht eine statische Grundordnung vorgibt, ermöglicht Regulatorik eine flexible Anpassung an wirtschaftliche und technologische Entwicklungen.
Standards und Leitlinien
Anbei eine Liste der wichtigsten Standards und Standardisierungsinitiativen im AI-Bereich. Viele dieser Standards sind noch in Entwicklung, da sich das Feld schnell weiterentwickelt und neue Herausforderungen entstehen.
Enterprise-Governance-Disziplinen
Eine Enterprise-Governance-Disziplin ist ein strukturierter Ansatz zur Festlegung von Richtlinien, Prozessen und Verantwortlichkeiten, der eine verantwortungsvolle, effiziente und konforme Steuerung bestimmter Unternehmensbereiche sicherstellt. Sie kombiniert Fachwissen, Methoden, Prinzipien und Kontrollmechanismen, um klare Leitlinien für Entscheidungsfindung, Risikomanagement und Rechenschaftspflicht zu schaffen. Im Kontext von KI erweisen sich drei zentrale Governance-Disziplinen als besonders relevant: IT-Governance, Data-Governance und AI-Governance. Diese drei Disziplinen bilden ein komplementäres Rahmenwerk, das die verschiedenen Aspekte der KI-Entwicklung und -Nutzung abdeckt. Ihre Stärke liegt in der gegenseitigen Ergänzung, wobei bestimmte Themenbereiche an den Schnittstellen liegen und somit von mehreren Disziplinen gleichzeitig adressiert werden.
