Wenn generative KI gegen die eigenen Werte verstößt

Hyperskalierte generative KI ist aus ethischer Sicht nicht vertretbar, weil sie auf nicht zugestimmten Trainingsdaten basiert, enorme ökologische Schäden verursacht und vollständig von kommerziellen Interessen weniger Konzerne abhängt. Kleine, domänenspezifische Modelle mit transparenten Trainingsdaten bieten dagegen stabilen Nutzen, ohne diese Probleme zu erzeugen.

Podcast Episode: Wenn generative KI gegen die eigenen Werte verstößt

Generative KI einfach nicht zu nutzen, weil sie den eigenen Werten widerspricht: das ist die Position, die Johannes Link konsequent vertritt. Mit ihm spreche ich darüber, warum er hyperskalierte Gen AI für ethisch nicht vertretbar hält und was ihn zu diesem Schluss gebracht hat. Wir reden über Trainingsdaten, die ohne Zustimmung der Urheber verwendet werden, über den massiven Energieverbrauch, über den Zerfall des freien Internets und darüber, was mit Studierenden passiert, die das Schreiben und Denken delegieren, bevor sie es je wirklich geübt haben. Johannes erklärt auch, was sich ändern müsste, damit er seine Meinung überdenken würde, und ob er diesen Wandel für realistisch hält.

„Ein statistisches Modell kennt weder richtig noch falsch, noch Wahrheit.” - Johannes Link

Johannes Link programmiert seit mehr als 40 Jahren, 30 davon im Beruf. Seit Ende des letzten Jahrhunderts stehen Extreme Programming und anderen auf den Menschen ausgerichtete Softwareentwicklungsansätze im Zentrum seiner Tätigkeit. Im beruflichen Fokus sind die (Um-)Gestaltung von Teams hinzu mehr Eigenverantwortung und Selbststeuerung. Die sinnvolle und ethische Gestaltung seines privaten und beruflichen Lebens treibt ihn seit Jahren um. Mit dem Thema GenAI beschäftigt er sich seit den frühen Tagen von OpenAI’s GPT-Sprachmodellen.

Highlights der Episode

Generative KI, die an US-amerikanische Hyperscaler ausgelagert wird, basiert auf Trainingsdaten, deren Urheber in den meisten Fällen nie zugestimmt haben, dass ihre Werke für das Modelltraining genutzt werden.
Der prognostizierte Anstieg des Stromverbrauchs durch KI-Rechenzentren in den USA von 4,4 Prozent auf 25 Prozent des Gesamtverbrauchs entspricht in etwa dem gesamten Zubau erneuerbarer Energien im selben Zeitraum.
Statistische Sprachmodelle können strukturell weder Wahrheit noch Falschheit unterscheiden, weshalb Halluzinationen kein Implementierungsfehler sind, sondern ein Grundmerkmal des Modelltyps.
Studierende, die Lernaufgaben vollständig an generative KI delegieren, erwerben die Kompetenzen nicht, die diese Aufgaben aufbauen sollen, und erste Absolventenjahrgänge mit vollständig KI-gestütztem Studium existieren bereits.
Kleine, domänenspezifische Modelle mit transparenten Trainingsdaten, etwa für Sprachanalyse oder Proteinstrukturvorhersage, liefern stabilen Nutzen, erhalten aber einen Bruchteil der Investitionen, die in große kommerzielle Modelle fließen.

Worum es geht: hyperskalierte generative KI, nicht KI im Allgemeinen

Die ethische Kritik richtet sich gegen eine sehr konkrete Variante künstlicher Intelligenz, nicht gegen das gesamte Feld. Gemeint ist generative KI, die an wenige große Anbieter ausgelagert wird, überwiegend in den USA. Diese Unterscheidung ist die Grundlage jeder sinnvollen Bewertung.

Der Sammelbegriff “KI” verschleiert diese Trennung. Wer “KI” sagt, kann alle möglichen guten Anwendungen ins Feld führen und damit ablenken. Viele erfolgreiche KI-Anwendungen sind aber gar keine generative KI, oder zumindest keine hyperskalierte.

Johannes Link bewertet die heutige hyperskalierte generative KI in ihrer jetzigen Form als ethisch nicht verwendbar. Das ist eine persönliche Bewertung, die an persönlichen Werten hängt. Genau so gehört Ethik gedacht: als individuelle Entscheidung darüber, was man tun will und was nicht.

Warum die Modelle auf entwendeten Daten basieren

Die Trainingsdaten stammen aus Werken, deren Urheber der Nutzung nie zugestimmt haben. Das Wort Diebstahl ist hier moralisch gemeint, nicht juristisch. Ob die Lizenzen das decken, werden irgendwann Juristen entscheiden, doch dann ist es zu spät.

Das Problem ist konkret und betrifft jeden, der je etwas veröffentlicht hat. Open-Source-Software, Vorträge, Artikel: All das landet in Trainingsdaten, ohne dass je zur Debatte stand, dass damit ein Modell trainiert wird.

Datenqualität lässt sich dabei nicht in den Griff bekommen, weil das Fundament ein statistisches Modell ist. Ein statistisches Modell kennt weder richtig noch falsch noch Wahrheit. Alles, was herauskommt, bleibt eine Statistik.

Egal wie gut die Trainingsdaten sind, wir werden immer Halluzinationen bekommen, weil das die Grundlage dieses Modells ist: dass ich auch dort, wo ich keinen Parameter in den Trainingsdaten habe, trotzdem etwas herausbekomme. Johannes Link

Der ökologische Preis frisst den Fortschritt bei erneuerbaren Energien

Der projizierte Stromverbrauch von Rechenzentren steigt laut den genannten Projektionen von 4,4 Prozent des gesamten US-Stromverbrauchs auf 25 Prozent innerhalb von vier Jahren. Das entspricht ungefähr dem, was in diesem Zeitraum an erneuerbaren Energien zugebaut wird. Der komplette Zubau wird also vom KI-Hype geschluckt.

Dazu kommt Wasser für die Kühlung, die bei diesen Rechenzentren nicht leicht ist. Und es kommt Elektroschrott. Die Rohstoffe für die GPUs könnten teilweise im globalen Norden abgebaut werden, werden es aber nicht, um die eigenen Böden nicht zu vergiften. Abbau und Entsorgung wandern dorthin, wo auch die Rohstoffe herkommen.

Der Hardware-Zyklus verschärft das Problem. Eine GPU hält in diesem Betrieb etwa anderthalb bis zwei Jahre. Die Rechenzentren laufen praktisch immer unter Volllast, weil man sie nicht in kleinen Schritten hoch- und runterfahren kann, sondern nur in großen Blöcken zu- oder abschaltet. Nach etwa fünf Jahren muss die komplette Infrastruktur des Rechenzentrums ausgetauscht werden, etwas, das traditionelle Rechenzentren so nicht kennen.

Generative KI hat starkes Potenzial zur Zerstörung des Bildungssystems

Das Bildungssystem ruft nach KI, weil es unterfinanziert ist. Lehrende sind überlastet, Studierende sind überlastet. Genau dort wirkt das Versprechen, eine Maschine könne die Lücke füllen, besonders verführerisch.

Das Problem liegt im delegierten Lernen. Studierende geben Aufgaben ab, die ihnen eigentlich beim Kompetenz- und Wissenserwerb helfen sollen. Damit schrumpft der Kompetenzerwerb, wenn er überhaupt noch stattfindet. Es gibt neurologische Studien dazu, was das mit der Problemlösungsfähigkeit im Gehirn macht.

Der Effekt kommt schnell. Ein Bachelorstudium dauert drei Jahre. Die ersten Studierenden haben ihr gesamtes Studium mit diesen Werkzeugen verbracht. Innerhalb kürzester Zeit gibt es Absolventen, die Kompetenzen nicht mehr haben, die sie haben sollten.

Dasselbe gilt für jeden, der Texte generieren lässt, statt sie selbst zu schreiben. Der Sinn des Schreibens liegt im Auseinandersetzen mit dem Thema, in der Reibung mit den eigenen Gedanken und der Recherche. Wenn du einen Text generieren kannst, kann ihn jeder andere auch generieren. Dann braucht ihn niemand mehr.

Das freie Internet trägt die Last, die andere verursachen

Gemeinnützige Projekte wie Wikipedia und OpenStreetMap stehen unter starker Last durch KI-Crawler. Diese Crawler greifen jeden erreichbaren Input ab. Die Infrastruktur dafür finanzieren aber genau jene Initiativen, die den Crawlern das Material liefern. Das ist Geld, das ihnen an anderer Stelle fehlt.

Gleichzeitig vergiftet sich der Datenbestand selbst. Geschätzt sind 50 bis 60 Prozent jedes neuen Inhalts schon teilweise generiert. Aus diesem Material lässt sich kaum noch etwas Neues schaffen. Die KI-Firmen reagieren bereits, indem sie Verträge mit Verlagen und Redaktionen schließen, um echten menschlichen Input zu sichern.

Filter lösen das Halluzinationsproblem nicht

Nachgelagerte und vorgelagerte Filter scheitern an derselben Stelle wie naive Textfilter gegen SQL-Injection. Wer per Regex davor und danach filtert, bekommt das Problem nicht in den Griff.

Der Grund liegt tiefer. In großen Sprachmodellen verschwimmt die Trennung zwischen Daten und Anweisung. Ein Prompt enthält beides zugleich. Wenn sich beides nicht trennen lässt, lässt sich auch nicht zuverlässig filtern.

Hinzu kommt eine kontraintuitive Eigenschaft großer Modelle. Je mehr Daten und Parameter, desto kleiner ist der Anteil gezielter Verschmutzung, den ein Angreifer treffen muss, um ein Modell in eine bestimmte Richtung zu lenken. Wer manipulieren will, weiß das. Und es passiert.

Was sich ändern müsste, damit der Einsatz vertretbar wird

Die Modelle müssten unter öffentlicher Kontrolle stehen. Offen heißt hier: nachvollziehbar, was hineingeht, ob Urheber zugestimmt haben, und überprüfbar durch die Öffentlichkeit. Nur so lässt sich Manipulation ausschließen.

Derzeit hängt fast alles am Wohlwollen einiger amerikanischer Milliardäre. Im besten Fall suchen sie nur ihren Profit. Im schlechtesten Fall folgen sie menschenfeindlichen Ideologien und schrecken vor der Manipulation der Modelle nicht zurück. Davon müsste man wegkommen.

Auch der Ressourceneinsatz müsste vernünftig sein, was immer das im Einzelfall heißt. Die Bedingung dafür ist ein erster greifbarer, qualitativer Nutzen. Bisher dominieren Bequemlichkeit, Reibungsminderung und Profit. Schnellerer Java-Code zählt nicht als der Nutzen, der den Schaden aufwiegt.

Sinnvoll wäre eine Technologie, die beim Klima hilft oder dem Teil der Menschheit nützt, der in Armut lebt. In der aktuellen Rechnung tauchen solche Einsatzszenarien kaum auf, auch wenn sie so verkauft werden.

Kleine, offene Modelle sind der nützliche Teil

Echter Nutzen entsteht bei sehr kleinen Modellen, deren Trainingsdaten man tatsächlich einsehen kann. Klein heißt hier ein anderer Maßstab als heute üblich: einige Millionen Parameter statt hundert Milliarden. Solche Modelle kann auch eine mittelgroße Firma selbst trainieren.

Diese Modelle sind in engen Bereichen nicht nur nützlich, sondern stabil nützlich. Beispiele:

Sprachanalyse, oft auf eine einzelne Sprache reduziert und dadurch deutlich kleiner
Informationsextraktion aus Texten, ein Problem, das vor diesen Modellen nicht lösbar war
AlphaFold als Proteinfalter, ein generatives Modell, aber klein und nur auf seine Domäne trainiert

Die meisten heute verfügbaren kleinen Modelle sind allerdings nur Open-Weight und aus großen kommerziellen Modellen destilliert. In diesem Gebiet ließe sich viel machen. Die Milliarden fließen woanders hin.

Du musst Prompting nicht als Fertigkeit lernen

Die Sorge, ohne KI-Nutzung abgehängt zu werden, beruht auf einem Trugschluss. Wer diese Werkzeuge nicht einsetzt, erleidet keinen großen Fähigkeitsverlust. Die konkreten Prompts ändern sich mit jeder Modellgeneration ohnehin ständig.

Was beim Prompting wirklich gebraucht wird, ist die Fähigkeit, Dinge klar zu formulieren. Diese Fähigkeit haben die meisten Menschen mehr oder weniger gut, und sie lässt sich kurzfristig auffrischen, sobald man sie braucht.

Es bleiben zwei Szenarien. Entweder Softwareentwicklung wird nicht komplett ersetzt, dann lassen sich die konkreten Fertigkeiten bei Bedarf jederzeit lernen. Oder Softwareentwicklung wird komplett ersetzt, dann steht ohnehin etwas ganz anderes an.

Ein Zusammenbruch ist wahrscheinlich, das Ausmaß offen

Die finanzielle Blase ist groß, und das Interesse von Staaten und sehr großen Firmen, sie am Laufen zu halten, ist es ebenfalls. Irgendeine Form von Zusammenbruch wird kommen, schon wegen des Energiemangels an dieser Stelle. Wann und wie hart, lässt sich nicht vorhersagen.

Veränderung am Gesamtsystem braucht die politische Ebene. Wer politisch aktiv ist, kann das Thema unter die vielen anderen mischen und Mitstreiter dafür sensibilisieren. Es gibt eine digitale Ludistenbewegung, in Deutschland die Maschinenstürmer, fortschrittlicher als ihr Image vermuten lässt. Dort lässt sich engagieren.

Für den Einzelnen bleibt der erste Schritt, bei sich selbst zu prüfen, was man vertreten kann. Energieverbrauch, Chips und Rohstoffe wirken abstrakt, treffen am Ende aber alle, ähnlich wie das Klima und die gesellschaftlichen Umbrüche, die daran hängen. Die konkrete Frage lautet: Was heißt das für mich, und was kann ich in meinem Umfeld tun oder lassen?