Generative AI: Potenziale & Grenzen

Generative AI: Potenziale & Grenzen
2
Jan

Porträtfotos, die leicht surreal wirken, wie animierte Charaktere in einem lebensechten Computerspiel. So oder so ähnlich wirkten viele auf Instagram und TikTok gepostete Bilder in den letzten Wochen. Die Abgebildeten – meist die Profilinhaber*innen selbst – waren klar zu erkennen. Und dennoch hatten die Bilder den Uncanny-Valley-Effekt, der von Computeranimationen bekannt ist: Sie erscheinen vertraut, doch gleichzeitig stimmt etwas nicht. Eine leichte Irritation stellt sich ein. Ganz unabhängig davon, dass sich die Abgebildeten häufig in bzw. vor surrealen Bildwelten befanden.

Doch woher kamen all diese Bilder auf einmal? Die Antwort ist erst einmal unspektakulär: von einer App. Das amerikanische Unternehmen Prisma Labs steckt hinter der kostenpflichtigen „Lensa AI“ App, die sich in den App-Stores von Google und Apple großer Beliebtheit erfreut. Die Anwendung verwendet künstliche Intelligenz, um aus zehn bis zwanzig hochgeladenen Fotos digitale Avatare zu erschaffen. Und denkt dabei konsequent die Verheißungen des Metaverse weiter.

Was ist generative AI?

Lensa AI ist ein Beispiel für generative AI. Der folgende Text ist ein weiteres:
„Generative AI ist ein Bereich der künstlichen Intelligenz, der sich mit dem Erstellen von Inhalten oder Ergebnissen beschäftigt, die von einem Algorithmus erstellt wurden, anstatt von Menschen. Ein Beispiel für generative AI ist ein Programm, das in der Lage ist, Texte zu schreiben, Musik zu komponieren oder Bilder zu erstellen.

Diese Programme werden oft mit maschinellem Lernen trainiert, indem sie auf großen Datensätzen lernen und dann in der Lage sind, neue Inhalte auf der Grundlage dessen zu erstellen, was sie gelernt haben. Generative AI kann dazu beitragen, kreative Prozesse zu beschleunigen und zu vereinfachen und kann in vielen verschiedenen Bereichen wie der Kunst, der Wissenschaft und der Industrie eingesetzt werden.“

Was sich liest, wie eine ziemlich gute Definition von generativer Künstlicher Intelligenz wurde von ebensolcher generiert. Inklusive Zeichensetzung, Nebensätzen, Groß- und Kleinschreibung und Recherche. Lediglich die oben genannte Frage „Was ist generative AI?“ war notwendig, um diesen Text zu generieren. Sie wurde in das Eingabefeld der Anwendung ChatGPT geschrieben.

Mit ChatGPT Suchmaschine und Texterstellung kombinieren

ChatGPT ist ein Prototyp eines dialogbasierten Chatbots des US-amerikanischen Unternehmens OpenAI, der als Betaversion im November 2022 an den Start ging. Open AI beschäftigt sich mit der Erforschung von künstlicher Intelligenz. Das Unternehmen ist ein Non-Profit, hat aber auch eine gewinnorientierte Tochter-Gesellschaft. Bisher wird OpenAI vor allem durch Spenden finanziert. Hauptgeldgeber sind Elon Musk und Microsoft. Und damit ein gewinnorientiertes Unternehmen und ein erratischer Milliardär, dessen bizarres Geschäftsgebaren mitunter gefährliche Züge annimmt. Dies gilt es im Hinterkopf zu behalten.

Doch was macht ChatGPT so besonders? Woher kommt der Hype um die Anwendung, der zu zahlreichen Artikeln und Meinungsstücken geführt hat? Zwar gab es auch in der Vergangenheit schon KI-betriebene Chatbots, die mit Hilfe von Machine Learning präzise Antworten geben konnten. Inzwischen werden sie häufig als Unterstützung im digitalen Kundenservice verwendet. ChatGPT geht indes einige Schritte weitere. Das Tool beantwortet nicht nur Fragen, es gibt zum Beispiel auch zu, wenn es einen Fehler gemacht hat.

Darüber hinaus sitzt ChatGPT an der Schnittstelle von altbekannten Suchmaschinendiensten wie Google und digitalen Tools zur Texterstellung. User*innen bekommen ihre Fragen direkt beantwortet, ohne sich verschiedene Webseiten anschauen zu müssen. Gefällt einem*einer User*in die Antwort von ChatGPT nicht, haben sie die Möglichkeit, mit Klick auf den „Regenerate response“ Button den Text verfeinern zu lassen. Jede Frage und jeder Klick führen wiederum dazu, dass ChatGPT präziser werden kann.

Die Frage nach dem Urheberrecht

ChatGPT und Lensa AI sind nur zwei Beispiele von generativer AI. Weitere Anwendungen, die etwa Texte in Bilder umwandeln, stehen zur Verfügung oder sind in der Entwicklung. Daraus ergeben sich neben technischen auch kulturelle, rechtliche und didaktische Fragen. Können etwa von generativer AI erstellte Bilder oder Texte als Kunst gelten? Wer verwendet die Ergebnisse und in welchen Kontexten? Wie lässt sich deren Richtigkeit überprüfen?

Wie können Lehrende etwa identifizieren, ob ein Text ihrer Schüler*innen von ChatGPT stammt? Und vielleicht eine der drängendsten Fragen: Wie sieht es eigentlich mit dem Copyright aus?

„Wie die meisten Programme für maschinelles Lernen arbeiten sie [Generative-AI-Anwendungen] mit der Erkennung und Replikation von Mustern in Daten. Da diese Programme jedoch dazu verwendet werden, Code, Text, Musik und Kunst zu generieren, sind diese Daten selbst von Menschen erstellt, aus dem Internet zusammengetragen und auf die eine oder andere Weise urheberrechtlich geschützt.“

Der obige Absatz verdeutlicht die zentrale urheberrechtliche Fragestellung. Und er ist selbst ein Zitat aus einem sehr lesenswerten Artikel des US-amerikanischen Journalisten James Vincent, der im November 2022 bei The Verve veröffentlicht wurde. Der Clou: Für die Übersetzung dieses Zitats wurde ebenfalls auf eine KI-Anwendung zurückgegriffen. Genauer gesagt auf DeepL, den laut Eigenbeschreibung „präzisesten Übersetzer der Welt“.

Ob DeepL eine generative AI ist oder nicht, ist streitbar. Zum einen ließe sich argumentieren, dass DeepL bestehenden Text in eine andere Sprache überführt, also nichts „Neues“ erschafft. Diese Sichtweise würde allerdings allen Übersetzer*innen den kreativen Aspekt ihrer Arbeit absprechen. Denn ist nicht jede Übersetzung auch eine generativer Prozess?

Die Metaperspektive einnehmen

Eine Frage, die sich im Rahmen dieses Textes nicht beantworten lässt, die zu stellen sich aber lohnt, um eine Metaperspektive einzunehmen. Gerade Sprachlehrende müssen sich seit einiger Zeit mit KI-gestützten Übersetzungstools auseinandersetzen. Neben der Frage, ob Lernende diese zum Betrügen nützen, adressieren sie auch andere Spracherwerbsaspekte. Denn sowohl bei der Übersetzung als auch beim Sprechen einer Fremdsprache gibt es nicht nur richtig und falsch. Von Soziolekten über Dialekte, regionale Akzente, Metaphern etc. – die Sprachwissenschaften können ein Lied von den Feinheiten dieses Prozesses singen (oder als Text-zu-Musik-Anwendung erstellen).

Wie sieht es da konkret mit künstlerischen Stilen aus, um zurück auf die Urheberrechtsproblematik zu kommen? Füttere ich eine generative Text-AI mit Zitaten und Auszügen eines Buches oder Artikels eines*einer bestimmten Autor*in, hat diese*r dann nicht einen unmittelbaren Einfluss auf das Ergebnis? Missachte ich das geistige Eigentum, wenn ich in der Lensa AI-App zehn Bilder eines*einer bestimmten Fotograf*in hoch, auf deren Basis neue Bilder erstellt werden? Und vor allem: Wem gehört das Ergebnis? Zumal, wenn es sich beim Software-Anbieter um ein privatwirtschaftliches Unternehmen handelt?

Ein weiterer, vor allem aus informationswissenschaftlicher Sicht relevanter, Aspekt, den auch Vincent in seinem Artikel erläutert, ergibt sich konkret aus der Frage, wie privatwirtschaftliche Unternehmen Generative-AI-Anwendungen nutzen: Welche Daten werden zum Training der zugrundeliegenden Machine-Learning-Algorithmen verwendet? Nicht alle Unternehmen haben die Möglichkeit, die umfangreichen Datensätze, die hierfür vonnöten sind, selbst zu generieren. Im wissenschaftlichen Umfeld gibt es daher eine ganze Reihe an erprobten Datensätzen, die oft lizenzfrei zur Verfügung gestellt werden.

Neben in der Vergangenheit oft beleuchteten Problemen wie etwa Daten-Biasen, stellt sich im konkreten Fall die rechtliche Frage, was passiert, wenn ein gewinnorientiertes Unternehmen einen Trainingsdatensatz verwendet, der bspw. von einer Universität zur Verfügung gestellt wird?

Zeit zum Ausprobieren und Diskutieren

An vielen dieser Fragen wird derzeit fieberhaft gearbeitet. Einfache Antworten gibt es auf keine von ihnen. Gerade deswegen lohnen sie sich für intensive Debatten. Nicht zuletzt im Schulunterricht. Denn generative AIs tangieren nicht nur den Informatikunterricht. Ob Fremdsprachen, Deutsch, Ethik, Politik & Wirtschaft/Sozialkunde, die Auswirkungen sind und werden in vielen Bereichen spürbar.

Es gilt also, einen Umgang damit zu finden. Und das bedeutet auch, die Chancen dieser Technologie zu nutzen. Denn es kommt nicht nur auf das Warum, sondern auch auf das Wie an. Und dafür braucht es das Wissen um die Grenzen und Möglichkeiten, die Gefahren und Chancen dieser Anwendungen. Für Prognosen ist es daher noch zu früh. Fürs Ausprobieren und Diskutieren ist es indes genau die richtige Zeit.

Tobias Schiller