Die Navigationskarte für Generative Künstliche Intelligenz
v2.1.0
Generative KI (auf Englisch Generative Artifical Intelligence, kurz GenAI) ist ein Teilbereich der Künstlichen Intelligenz, der darauf spezialisiert ist, neue Inhalte wie Texte, Bilder, Musik oder Code zu erschaffen, indem er aus großen Datenmengen lernt und daraus eigenständig neue, ähnliche Muster generiert. Während der Oberbegriff Künstliche Intelligenz alle Systeme umfasst, die menschenähnliche Intelligenzleistungen erbringen können - wie etwa Sprache verstehen, logische Schlüsse ziehen oder Muster erkennen - konzentriert sich generative KI speziell auf den kreativen Aspekt der Inhaltserstellung.
KI-Modelle
Generative KI-Modelle lassen sich grob in zwei Kategorien einteilen: Unimodale Modelle, die auf eine bestimmte Art von Eingaben spezialisiert sind (wie reine Sprachmodelle für Text oder spezialisierte Bildgenerierungsmodelle), und multimodale Modelle, die mehrere Arten von Eingaben gleichzeitig verarbeiten können (Text, Bilder, Audio oder Video). Der Trend in der Entwicklung geht dabei stark in Richtung multimodaler Modelle, da diese vielseitiger einsetzbar sind und näher an der menschlichen Art der Informationsverarbeitung liegen, indem sie verschiedene Eingabeformen verstehen und miteinander in Beziehung setzen können. Mittlerweile ist das Angebot von KI-Modellen förmlich explodiert und unüberschaubar geworden. Deshalb werden hier nur die aus Sicht des Autors interessantesten Modelle aufgeführt.
Tools/Frameworks für KI-Modelle
IT-Entwicklungswerkzeuge im Kontext von KI
KI-gestützte Assistenten
KI-Agenten
Ein KI-Agent ist ein System, das selbstständig in einer Umgebung agiert, Informationen aus dieser aufnimmt, Entscheidungen trifft und Aktionen ausführt, um bestimmte Ziele zu erreichen. Die Besonderheit eines KI-Agenten liegt in seiner Autonomie und der Fähigkeit, aus der Interaktion mit seiner Umgebung zu lernen und sein Verhalten entsprechend anzupassen, wobei er verschiedene KI-Techniken wie maschinelles Lernen, Planung und Optimierung nutzen kann. KI-Agenten werden in verschiedenen Bereichen eingesetzt, von virtuellen Assistenten über Robotik bis hin zu automatisierten Handelssystemen, wobei ihre Komplexität und Autonomie je nach Anwendungsfall stark variieren kann.
Ranking, Evaluation und
Benchmarking von KI-Modellen
Anwendungsgebiete
Generative Künstliche Intelligenz (GenAI) findet Anwendung in vielfältigen Bereichen wie der Erstellung kreativer Inhalte (Bilder, Musik, Texte) sowie in der Medizin, etwa bei der Entwicklung neuer Medikamente oder der Verbesserung medizinischer Bildgebung. In der Wirtschaft wird sie zur Marktanalyse, Produktdesign und Prozessoptimierung genutzt, während sie in der Robotik Bewegungsplanung und Umgebungsinteraktion ermöglicht. GenAI unterstützt die Bildung durch personalisierte Lernmaterialien und Simulationen und spielt eine zentrale Rolle in der Unterhaltung bei der Generierung von Charakteren, Levels oder visuellen Effekten. Weitere Anwendungen umfassen die Automatisierung von Rechtsdokumenten, die Simulation von Umweltmodellen und die Erstellung von Werbe- und Marketingkampagnen. Durch ihre Vielseitigkeit hat GenAI sowohl aktuelle als auch zukünftige Potenziale in nahezu allen Branchen.
KI-Initiativen
Wichtige Veröffentlichungen
Ausblick/Zukunft der KI
KI-Infrastruktur
Die Infrastruktur ist von entscheidender Bedeutung für KI, da sie die Grundlage für das Training, die Bereitstellung und den Betrieb komplexer Modelle bildet. Hochleistungsfähige Hardware wie GPUs, skalierbare Cloud-Dienste und optimierte Datenpipelines ermöglichen es, die enormen Rechenanforderungen und Datenmengen moderner KI-Anwendungen effizient zu bewältigen. Ohne eine robuste und skalierbare Infrastruktur wäre die Entwicklung und Nutzung leistungsfähiger KI-Modelle in großem Maßstab nicht möglich.
Grundlagen für LLMs
- Machine Learning
Machine Learning ist ein Teilgebiet der künstlichen Intelligenz, bei dem Computersysteme die Fähigkeit erhalten, aus Erfahrungen zu lernen und sich zu verbessern, ohne explizit programmiert zu werden. Statt feste Regeln zu befolgen, erkennen Machine Learning Algorithmen Muster in Daten und entwickeln Modelle, die Vorhersagen treffen oder Entscheidungen ohne menschliches Eingreifen fällen können. Diese datengetriebene Herangehensweise ermöglicht es Systemen, komplexe Aufgaben wie Bilderkennung, Sprachverarbeitung oder Empfehlungssysteme zu bewältigen, indem sie aus Beispielen lernen und ihre Leistung mit mehr Daten kontinuierlich verbessern.
Der "Open"-Begriff bei KI-Modellen
Die Philosophie der Offenheit bei KI-Modellen umfasst mehrere komplementäre Dimensionen: Open Source gibt Einblick in den Code und die Algorithmen der KI-Systeme, Open Weights macht die trainierten Modellparameter zugänglich, Open Data ermöglicht den Zugang zu den Trainingsdaten, und Open Science sorgt für Transparenz in den Forschungsmethoden und -ergebnissen. Diese vier Aspekte der Offenheit bilden zusammen ein Ökosystem, in dem KI-Systeme umfassend geprüft, verstanden und kollaborativ weiterentwickelt werden können. Die heutigen KI-Modelle setzen diese Philosophie in unterschiedlichem Maße um – einige veröffentlichen nur ihre Modellgewichte, während andere auch Trainingsdaten oder Forschungsmethoden teilen, was zu unterschiedlichen Graden von Transparenz und Nachvollziehbarkeit führt. Die Kombination von Open Source, Open Weights, Open Data und Open Science schafft ein Fundament für Wissensaustausch und gemeinschaftliche Innovation im Bereich der künstlichen Intelligenz.
Probleme und Herausforderungen bei der
Erstellung und Nutzung von KI-Modellen
Recht und Regulatorik
Recht umfasst verbindliche gesetzliche Regelungen, die von staatlichen oder supranationalen Institutionen erlassen und von Gerichten durchgesetzt werden, beispielsweise im Strafrecht, Zivilrecht oder Datenschutzrecht. Regulatorik hingegen bezeichnet spezifische Vorschriften und Maßnahmen, die von Aufsichtsbehörden oder Regulierungsstellen entwickelt werden, um gesetzliche Rahmenbedingungen praxisnah und branchenspezifisch umzusetzen, etwa in der Finanz- oder Technologieregulierung. Während Recht eine statische Grundordnung vorgibt, ermöglicht Regulatorik eine flexible Anpassung an wirtschaftliche und technologische Entwicklungen.
Standards und Leitlinien
Anbei eine Liste der wichtigsten Standards und Standardisierungsinitiativen im AI-Bereich. Viele dieser Standards sind noch in Entwicklung, da sich das Feld schnell weiterentwickelt und neue Herausforderungen entstehen.
Enterprise-Governance-Disziplinen
Eine Enterprise-Governance-Disziplin ist ein strukturierter Ansatz zur Festlegung von Richtlinien, Prozessen und Verantwortlichkeiten, der eine verantwortungsvolle, effiziente und konforme Steuerung bestimmter Unternehmensbereiche sicherstellt. Sie kombiniert Fachwissen, Methoden, Prinzipien und Kontrollmechanismen, um klare Leitlinien für Entscheidungsfindung, Risikomanagement und Rechenschaftspflicht zu schaffen. Im Kontext von KI erweisen sich drei zentrale Governance-Disziplinen als besonders relevant: IT-Governance, Data-Governance und AI-Governance. Diese drei Disziplinen bilden ein komplementäres Rahmenwerk, das die verschiedenen Aspekte der KI-Entwicklung und -Nutzung abdeckt. Ihre Stärke liegt in der gegenseitigen Ergänzung, wobei bestimmte Themenbereiche an den Schnittstellen liegen und somit von mehreren Disziplinen gleichzeitig adressiert werden.