ChatGPT — GPT‑5.4 Thinking

By OpenAI · Updated

Was es wirklich ist

Wenn die Geschichte der KI eine Rockband wäre, wäre ChatGPT die Beatles — nicht unbedingt zu jedem Zeitpunkt das technisch Ausgeklügeltste, aber dasjenige, das verändert hat, was alle von Musik erwarten. GPT-5.4 Thinking ist OpenAIs vereinheitlichtes Frontier-Modell und stellt einen echten Generationssprung dar: ein Modell, das Reasoning, Programmierung und agentische Ausführung in einer einzigen Denk-Engine vereint, die vorausdenkt, bevor sie handelt. Denken Sie an ein Upgrade von einem sehr klugen Assistenten zu einem sehr klugen Kollegen. GPT-5.4 beantwortet nicht nur Fragen — es denkt mehrstufige Probleme durch, nutzt Werkzeuge selbstständig, bedient bei Bedarf Ihren Computer und führt Aufgaben aus, die früher mehrere Modelle und manuelle Orchestrierung erforderten. Es liest, schreibt, generiert Bilder, durchsucht das Web, führt Code aus und tut das alles jetzt mit 33% weniger Halluzinationen und einem 1M-Token-Kontextfenster.

Zentrale Stärken

GDPval-Dominanz (83,0%): Getestet über 44 reale Berufe — von Rechtsanalyse bis Finanzmodellierung — übertrifft GPT-5.4 die 70,9% von GPT-5.2 um 12 Punkte. Dies ist kein im Labor entworfener Benchmark; er misst, ob das Modell Fachleuten tatsächlich bei ihrer Arbeit hilft.
Computer-Nutzung, die Menschen übertrifft: OSWorld-Verified-Score von 75,0%, verglichen mit der menschlichen Baseline von 72,4%. Das Modell kann Desktop-Anwendungen navigieren, Formulare ausfüllen und mehrstufige Workflows autonom ausführen.
Denken, das Geld spart: Ein neuer Tool-Such-Mechanismus reduziert den Token-Verbrauch um 47%, und das 1M-Kontextfenster bedeutet, dass Sie ganze Projekte eingeben können, ohne sie aufteilen zu müssen.
33% weniger Halluzinationen: OpenAIs bedeutendste Verbesserung der Zuverlässigkeit. Wenn GPT-5.4 etwas nicht weiß, ist es messbar wahrscheinlicher, dies zuzugeben, statt selbstsicher eine Antwort zu erfinden.
Ökosystem-Breite: Verfügbar auf Web, iOS, Android, Desktop-Apps und via API. Benutzerdefinierte GPTs, Plugin-Store und Codex-Integration erweitern es für Nischenaufgaben.

Ehrliche Einschränkungen

Preissprung: API-Kosten steigen auf 2,50$/M Input und 15$/M Output (GPT-5.2 war 1,75$/14$). Pro-Stufe kostet 30$/M Input / 180$/M Output. Die beste Leistung kostet wirklich mehr.
Long-Context-Genauigkeit sinkt: Bei 512K–1M Token fällt die Genauigkeit beim MRCR v2-Benchmark auf 36,6%. Das 1M-Kontextfenster existiert, aber vertrauen Sie ihm nicht blind am oberen Ende.
Cyber-Schutz-Fehlalarme: Verbesserte Sicherheitssysteme blockieren gelegentlich legitime sicherheitsbezogene Prompts. Wenn Sie in der Cybersicherheit arbeiten, erwarten Sie Reibung.
Schrittweiser Rollout: Noch nicht alles ist für alle verfügbar. GPT-5.2 wird planmäßig im Juni 2026 eingestellt — planen Sie Ihre Migration.

Das Fazit: Die Standardwahl, aufgerüstet. GPT-5.4 Thinking ändert ChatGPTs Charakter nicht — es ist immer noch das Schweizer Taschenmesser, das Sie kennen — aber es schärft jede Klinge. Der 12-Punkte-GDPval-Sprung und die menschenübertreffende Computer-Nutzung machen es zum klarsten Upgrade im alltäglichen KI-Bereich seit GPT-4. Wenn Sie nur ein KI-Tool abonnieren, bleibt dies die sichere, fähige Wahl — aber jetzt ist es eher ein Lexus als ein Toyota.