Skynet-Szenario: Anthropic warnt vor KI, die sich selbst entwickelt

KI-Schmiede Anthropic hat sich für eine weltweite Verlangsamung der Forschung und Entwicklung von Künstlicher Intelligenz eingesetzt. „Wir glauben, es wäre gut für die Welt, die Möglichkeit zu haben, die Entwicklung von Frontier AI zu verlangsamen oder vorübergehend auszusetzen, damit gesellschaftliche Strukturen und die Forschung zur Ausrichtung mit dem technologischen Fortschritt Schritt halten können“, erklärten Anthropic-Mitgründer Jack Clark und Anthropic-Forscherin Marina Favaro in einem Blogbeitrag.

Dafür bräuchte es aber laut dem Autorenteam einen globalen Koordinierungsmechanismus, der eine glaubhafte Verlangsamung unter Staaten und Unternehmen sicherstellen könne. Ansonsten könnten weniger umsichtige Akteure ein solches Moratorium einfach zur technologischen Aufholjagd nutzen oder um sich einen Vorsprung zu sichern.

Anthropic begründet den Vorschlag mit den zunehmenden Fortschritten bei KI-Modellen und skizziert das Szenario, dass Menschen in deren Entwicklung immer weniger Anteil haben. Die KI werde möglicherweise irgendwann eigenständig neue KI-Modelle entwickeln können. Anthropic bezeichnet das als „rekursive Selbstoptimierung“. Eine solche KI, die sich selbst entwickelt, könne einen bedeutenden technologischen Fortschritt darstellen, berge aber auch die Gefahr, dass die Menschheit die Kontrolle verlöre.

Mit Zahlen aus dem eigenen Unternehmen will Anthropic Anzeichen für einen solchen Trend untermauern. Stand Mai 2026 stammten demnach 80 Prozent des Codes, den Anthropic in seine Codebasis einpflegt, vom Modell Claude. Im Februar 2025 habe dieser Anteil noch im niedrigen einstelligen Bereich gelegen. Die Entwickler bei Anthropic lieferten dank KI inzwischen pro Quartal im Schnitt achtmal so viel Code aus wie im Zeitraum von 2021 bis 2025.

Doch auch qualitativ beschleunige die KI, behauptet Anthropic: Die Häufigkeit, mit der Mitarbeiter Aufgaben von Claude korrigieren oder dabei selber Hand anlegen müssten, sei stetig gesunken – auch bei offen gestellten Aufgaben ohne klare Spezifikationen. Viele Anthropic-Mitarbeiter seien der Meinung, dass der von Claude geschriebene Code Ende 2025 qualitativ noch schlechter war als der von Menschen verfasste, inzwischen aber auf gleicher Höhe. „Wir erwarten, dass er im Laufe des Jahres besser sein wird“, schreiben Clark und Favaro.

Und fügen hinzu: „Sobald die Qualität von Code, der von Menschen und von KI geschrieben wurde, gleichauf ist, werden Menschen gar keinen Code mehr schreiben, sondern sich ausschließlich auf dessen Überprüfung konzentrieren. Wenn sie den Code jedoch nicht so schnell überprüfen können, wie Claude ihn generieren kann, wird die Überprüfung durch Menschen zum Engpass in der KI-Entwicklung.“ Allerdings gestehen sie ein, dass die KI ohne menschliche Urteils- und Entscheidungskraft bislang eher ein fähiger Helfer sei. Es bleibe unklar, ob die heutigen Trainingsmethoden und Architekturen dieses menschliche Potenzial erreichen können.

Der Zeitpunkt für Anthropics Forderung nach einem Moratorium irritiert. Das Unternehmen gilt als einer der global führenden Anbieter und hat erst am Montag mitgeteilt, bei der US-Finanzaufsichtsbehörde SEC vertraulich den Börsengang beantragt zu haben. Damit hat das Unternehmen gegenüber dem ebenfalls an die Börse drängenden Erzrivalen OpenAI die Nase vorn.

Andererseits passen solche Initiativen aber auch gut in das selber gepflegte Image des besonders verantwortungsbewussten Anbieters. Ebenso ist die Betonung der Gefährlichkeit der eigenen Technologie ein offenkundig aufmerksamkeitsstarker Teil der Produktkommunikation. Bei der Vorstellung von Claude Mythos etwa hatte Anthropic den Zugriff auf das Modell zunächst auf einen kleinen Kreis von US-Unternehmen und -Behörden beschränkt. Mythos sei einfach zu gut darin, Sicherheitslücken aufzuspüren, und könne deshalb noch nicht allgemein verfügbar gemacht werden, erklärte das Unternehmen. Inzwischen dürfen auch Institutionen aus Europa darauf zugreifen, Ende Juni will Anthropic einen Bericht über die mit Mythos entdeckten Lücken vorlegen.

Generell greift die KI-Branche in ihrer Kommunikation gern zu Superlativen, die im Nachhinein mitunter auch zurückgenommen werden. So revidierte etwa kürzlich OpenAI-Chef Sam Altman seine Prognose, dass KI auf breiter Front Menschen ersetzen und zu Massenentlassungen führen werde. Altman sagte, dass er die Auswirkungen auf den Arbeitsmarkt doch überschätzt habe.

Dass Anthropic in einem derart umkämpften und hochdynamischen Markt wie dem der KI-Modelle eine Bremsung erreicht, ist eher unwahrscheinlich. Es wäre auch nicht die erste Forderung dieser Art, die verpufft. Im März 2023 machte sich etwa ein offener Brief für eine Zwangspause bei der Entwicklung der mächtigsten KI-Modelle stark und warnte vor gravierenden Konsequenzen der Technologie für die Menschheit. Über 1000 Personen aus Forschung und Wirtschaft hatten unterzeichnet, darunter auch Tech-Prominenz wie Elon Musk und Steve Wozniak. Großen Einfluss auf die KI-Entwicklung der folgenden Jahre hatte der Brief offenkundig nicht.

Anthropic will jedenfalls in den kommenden Monaten Gesprächsrunden mit Vertretern aus Politik, Forschung, Zivilgesellschaft und von KI-Unternehmen organisieren, um die im Blogbeitrag aufgeworfenen Fragen zu diskutieren. Ebenfalls wolle das Unternehmen Forschung vorantreiben für mögliche Sicherungssysteme einer globalen KI-Bremse. „Wenn solche Systeme existierten, würden wir voraussichtlich verlangsamen oder vorübergehend pausieren“, heißt es im Blogbeitrag – aber auch nur dann, wenn andere Entwickler auf dem technologischen Stand es ebenfalls auf überprüfbare Weise täten.

Skynet-Szenario: Anthropic warnt vor KI, die sich selbst entwickelt

Die KI-Schmiede Anthropic warnt vor einer „rekursiven Selbstoptimierung“ von KI-Modellen und fordert eine globale Verlangsamung der Entwicklung.