- AI Peanuts
- Posts
- OpenAI dreht auf: o3, o4-mini und die Jagd nach den besten Entwicklertools
OpenAI dreht auf: o3, o4-mini und die Jagd nach den besten Entwicklertools
Das große neue Reasoning-Modell von OpenAI ist da und kann auch von Plus-Usern genutzt werden. Während X (ehemals Twitter) zwar längst AGI postuliert, ist das beinahe nur noch Ansichtssache. Unsere große Diskussion dreht sich heute also komplett um die neuen Ankündigungen von OpenAI und was man damit anfangen kann. Los geht's!
Peanuts für heute:
🚀 OpenAI dreht auf: o3, o4-mini und die Jagd nach den besten Entwicklertools
🧠 DeepMind will bis 2030 eine AGI bauen und veröffentlicht Sicherheitsbericht
🧪 Mit KI experimentieren in Google’s AI Studio


Anzeige
KI im Unternehmen: Schluss mit Schatten-KI, Sicherheit geht vor!
Hast du dich schon einmal gefragt, wie du Künstliche Intelligenz sicher in deinem Unternehmen einsetzen kannst? Die rasante Entwicklung von KI-Technologien bringt nicht nur technische, sondern auch wichtige Datenschutz- und Sicherheitsfragen mit sich.
Ein oft unterschätztes Risiko: Was passiert mit den Informationen, die Mitarbeitende in KI-Tools eingeben, die privat “organisiert” wurden? Viele Anbieter nutzen diese Daten möglicherweise für das Training ihrer KI-Modelle – und das könnte sensible Firmeninformationen gefährden.
Doch es gibt Lösungen: Plattformen wie ChatGPT bieten in ihren Einstellungen die Möglichkeit, der Nutzung dieser Daten zu widersprechen.

Welche Datenschutzbestimmungen beim Einsatz von KI-Tools besonders relevant sind und worauf Unternehmen achten sollten, erfährst du ausführlich im Modul „Datenschutz & KI“ von unserem Partner Herdt. Dieses Modul ist für Unternehmen jeder Größe von Bedeutung. Wenn das für dich interessant klingt - schau doch mal rein:

🥜 Die größte Nuss:

🚀 OpenAI dreht auf: o3, o4-mini und die Jagd nach den besten Entwicklertools
Als OpenAI den Livestream für Mittwoch ankündigte, war klar was kommen würde. Sam Altman hatte bereits vor Wochen klargemacht, dass das nächste große Modell GPT-5 noch Zeit braucht – weil es „viel komplexer als gedacht“ sei, aber auch, weil sie es nochmal deutlich leistungsfähiger machen können. Und das braucht Zeit.
Stattdessen bringt OpenAI jetzt zwei neue Reasoning-Modelle – und ein Modell-Update-Chaos, das längst zum Running Gag geworden ist: Es gibt GPT-4o, o3, o4-mini... klingt ähnlich, sind aber komplett unterschiedliche Dinge.
Mit o3, o4-mini und dem neuen Entwickler-Tool Codex schnürt OpenAI ein starkes Gesamtpaket – und wenn sich der Kauf von Windsurf bewahrheitet, steht OpenAI endgültig vor dem Sprung vom Modellhersteller zur Plattform.
Was steckt in o3 und o4-mini?
Beide Modelle sind ab sofort für Plus-, Pro- und Team-User in ChatGPT verfügbar. Enterprise-Kunden folgen nächste Woche. OpenAI nennt sie „unsere besten Modelle aller Zeiten“. Und obwohl das wie typisches Silicon-Valley-Marketing klingt – es steckt wirklich was dahinter.
Die Modelle wurden komplett neu trainiert. Sie analysieren Texte, verstehen Bilder (inkl. winzige Schrift weit hinten im Bild versteckt), verarbeiten Tabellen und können eigenständig entscheiden, wann Tools wie Python, DALL·E oder die Websuche eingesetzt werden. Ein echter Schritt Richtung agentische KI.
Wir haben hier oft über Benchmarks gesprochen – und warum sie nicht viel aussagen. Viele Modelle performen in Benchmarks überragend, aber das lässt sich oft nicht auf Alltagsaufgaben übertragen. Trotzdem: o3 glänzt in harten Mathe-Benchmarks wie AIME 2025 fast fehlerfrei. Und bei Codeforces – einem echten Hardcore-Wettbewerb für Programmierer – erreicht es Werte auf dem Niveau der weltweiten Top 200.

Kurz: o3 und o4-mini sind keine „Schreib-KIs“. Sie denken strategisch, nutzen Tools wie ein Produktivitätsteam – und liefern in vielen Szenarien Ergebnisse, die uns vor zwei Jahren noch wie Science-Fiction vorkamen.
Ist das jetzt AGI?
Manche sagen ja. Auf X war „AGI is here“ wieder einer der beliebtesten Takes nach dem Release. Aber die Realität ist komplizierter.
o3 ist stark – keine Frage. Es meistert Reasoning-Aufgaben mit hoher Präzision, trifft eigenständige Entscheidungen und reduziert klassische Halluzinationen deutlich. OpenAI selbst spricht von 20 % weniger „Major Errors“ im Vergleich zu Vorgängermodellen. Das ist gut – aber weit entfernt von perfekt.
Die Debatte zeigt eher: Wir sind in einer neuen Ära, in der die Grenze zwischen „intelligentem Tool“ und „allgemeiner Intelligenz“ verschwimmt. Der Turing-Test ist faktisch erledigt. Ob o3 AGI ist? Ansichtssache.
o4-mini: kleiner, günstiger – und ziemlich stark
o4-mini ist nicht einfach ein Sparmodell. In vielen Benchmarks kommt es an Gemini 2.5 Pro ran, gerade im Coding-Bereich. Und das bei deutlich geringerem Ressourcenbedarf. Für API-Nutzer und Unternehmen, die auf Skalierbarkeit achten müssen, dürfte o4-mini oft die klügere Wahl sein. Performance gut, Kosten deutlich niedriger – das spricht für sich.
Codex & der 3 Mrd Dollar Powermove
Mit Codex bringt OpenAI ein Tool, das sich direkt an Entwickler richtet. Programmieren im Terminal, mit interaktivem Chat, visuellen Diagrammen, Git-Integration – und sicherer Ausführung. Große Empfehlung, auch als Nicht-Programmierer einfach mal auszuprobieren, sich das Ganze mit o3 erklären zu lassen und zu sehen, was man hinbekommt.
Codex ist Open Source!! – das „Open“ in OpenAI hält also doch noch Bedeutung. Es ist klar positioniert als Alternative (oder Angriff?) auf Cursor, Claude Code und GitHub Copilot. Das Beispielvideo von OpenAI gestern dazu ist ein must-watch!
Parallel wird berichtet, dass OpenAI an einer Übernahme von Windsurf arbeitet – einem Entwicklertool, ähnlich wie Cursor. Preis: 3 Milliarden Dollar. Umsatz: 40 Millionen. Klingt teuer? Ist es. Aber strategisch klug.
Windsurf ist tief in der Dev-Community verankert. Der Kauf würde OpenAI direkten Zugang zu Millionen Entwicklern verschaffen – und das Ziel, nicht nur Modellanbieter, sondern die zentrale Plattform für KI-gestützte Softwareentwicklung zu werden, ein großes Stück näher bringen.
Microsoft hat Copilot. Anthropic setzt auf Cursor. OpenAI will den gesamten Stack kontrollieren.
Fazit: Zwischen Hype und Realität
Wie immer gab’s zum Launch jede Menge Hype. Influencer bekamen wieder Early Access, was die Euphorie in der Tech-Bubble erklärt. Aber: Die Modelle sind nicht fehlerfrei. Sie sind beeindruckend – keine Frage. Aber sie sind nicht „allwissend“ oder „unfehlbar“. Noch nicht.
Dennoch: Wenn man bedenkt, dass GPT-3.5 vor gerade mal zwei Jahren rauskam, ist das alles unglaublich. Die Fortschritte sind massiv – und das Tempo steigt weiter. Der Begriff AGI fühlt sich immer weniger wie Zukunftsmusik und immer mehr wie eine Frage der Definition an.
Im Moment baut OpenAI neben seinem Kerngeschäft mit Modellen, auch einen eigenen Chip, einen humanoiden Roboter, eventuell eine Twitter-Konkurrenz und vielleicht sogar ein Hardware-Produkt. OpenAI macht deutlich, wohin die Reise geht: Weg vom reinen Modellanbieter – hin zur Plattform. o3 und o4-mini setzen neue Maßstäbe bei Reasoning und Tool-Nutzung. Codex ist ein cleverer Vorstoß in den Dev-Alltag. Und Windsurf könnte die nächste große Expansion einleiten.
Gleichzeitig sollten wir uns von AGI-Schlagzeilen nicht blenden lassen. Diese Tools sind stark – aber sie brauchen immer noch kluge Nutzer, die wissen, wie man sie einsetzt. Wir können nur empfehlen die neuen Modelle unbedingt auszuprobieren. Nicht nur o3, sondern auch das Google Topmodell Gemini 2.5 Pro. Denn wer o3 heute versteht, wird von GPT-5 nicht überrollt.

🛠️ Trai it out:
🧪 Mit KI experimentieren in Google’s AI Studio
Google gibt gerade wirklich Vollgas, was sowohl seine Sprachmodelle, als auch die Produkt-Experience um die LLMs herum betrifft. Erst letzte Woche hatten wir über Google’s neue “Vibe Coding”-Platform berichtet, heute werfen wir einen Blick in Google AI Studio, die Oberfläche, die sich vor allem auch an nicht-technische Nutzer wendet.
Denn: Hier gibt es aus unserer Sicht gerade zwei gute Updates. Beide erleichtern es, schneller zu verstehen, was die verschiedenen Modelle eigentlich können und geben einem Ideen für eigene Use Cases:
Prompt Gallery
Clickt man in einem neuen Chat auf prompt gallery, öffnet sich rechts ein Fenster mit vielen verschiedenen Prompting-Beispielen, die man anklicken kann. Diese enthalten teilweise sogar Bilder, und zeigen z.B. wie Gemini auf Basis eines Fotos von diversen Zutaten ein genaues Rezept ableitet. Natürlich gibt es auch deutlich komplexere Prompts.Starter Apps
Für alle, die sich dafür interessieren, wie die Gemini API als Intelligenz-Layer in Apps integriert werden kann, sind die Starter Apps spannend - hier kann man sich durch eine ganze Reihe von “Experimenten” klicken - kleine Apps, die jeweils KI nutzen, um diverse Fähigkeiten zu ermöglichen - so gibt es z.B. eine, die aus Youtube Links, interaktive Lern-Demos macht. Für alle technisch-interessierten lässt sich der Code anzeigen und sogar direkt editieren.
Zusammengefasst:
Google’s AI Studio wird immer mehr zu einem vollwertigen KI-Produkt
Die Prompt Gallery und Starter Apps bieten einen super Einstieg, um die Fähigkeiten von Gemini, oder einfach KI-Chat Assistenten im allgemeinen besser zu verstehen
Spannende Demos:
Kling 2.0 Text to video is wild🔥
I am really enjoying Kling, the image quality, the fluid motion, the precision and camera movement is insane
Video: Kling 2.0
SFX: Freepik
Music: Suno🧵Here are 12 new prompts 👇
🔖Bookmark for later
— MayorkingAI (@MayorKingAI)
8:33 PM • Apr 16, 2025
Tools kurz & knackig:

🍭🍬 Gemischte Tüte
🇪🇺 EU-News:
👩💻 Tech-News:
DeepMind will bis 2030 eine AGI bauen, die den Menschen übertrifft – und legt mit einem 145-seitigen Papier zur technischen Sicherheit nach. Im Report geht’s u.a. um Risiken wie Fehlverhalten und Missbrauch. Das Konzept: KI soll sich selbst einschätzen und durch Menschen überprüft werden. Link
Ein übersichtliches Preis-Leistungs-Diagramm zeigt, welche LLMs sich wirklich lohnen – Google landet auf dem "Pareto-Frontplatz". Link, Link
Microsoft erlaubt Copilot Studio jetzt, eigenständig mit deinem Computer zu interagieren – ein großer Schritt in Richtung echter KI-Agenten Link
OpenAI testet mit A-SWE einen neuen Coding-Agenten, der Apps komplett selbstständig erstellen kann – inklusive Code, Tests und Doku. Noch gibt’s aber Probleme mit ungenauen Abhängigkeiten und Halluzinationen. Link
Gemini Deep Research läuft jetzt auf dem 2.5 Pro Modell – das aktuell beste Google-Modell für komplexe Aufgaben. Die Qualität erinnert stark an ChatGPT Deep Research. Link
Claude Research, Anthropics Antwort auf Deep Research von OpenAI, durchsucht Web und Dokumente und liefert komplette Antworten – jetzt in den USA, Japan und Brasilien verfügbar Link
OpenAIs neuestes Modell „o3“ ist teurer als gedacht: Ein einziger ARC-AGI-Task kann bis zu 30.000 Dollar kosten – ursprünglich rechnete man mit 3.000. Trotz hoher Preise zahlen Unternehmen teils bis zu 20.000 Dollar pro Monat für spezialisierte KI-Agenten. Link
Apple hält an seinen Plänen fest, im Herbst ein neues, KI-gestütztes Siri zu releasen. Zeitgleich wird bekannt, dass das AI-Team schon 2023 bei der Chip-Freigabe gebremst wurde, weil der CFO keine weiteren NVIDIA-GPUs genehmigen wollte. Link
OpenAI hat ein spannendes neues Benchmark-Tool vorgestellt: „BrowseComp“ misst, wie gut KI-Agenten reale Webaufgaben erledigen – z. B. Infos suchen, buchen oder Preise vergleichen. Link
Gemini Code Assist bekommt ein Update und wird jetzt richtig nützlich: Der Assistent schreibt nicht nur Code, sondern übernimmt auch Reviews, Tests, Migrationen und Arbeitsplanung. Link
xAI beginnt mit dem Rollout einer Memory-Funktion für seinen Grok-Chatbot – ähnlich wie OpenAIs GPT-Funktion letzte Woche. Link
Allie K. Miller erklärt in einem wirklich hilfreichen X-Thread, wie genau das neue Memory-System in ChatGPT funktioniert – und worauf du achten solltest. Link
Meta’s Llama 4 (Maverick) ist auf LMArena aufgetaucht – und schneidet schlechter ab als Monate alte Modelle wie Claude oder Gemini. Link
NVIDIA beschleunigt Metas Llama 4-Modelle massiv – dank Blackwell B200 GPUs und TensorRT-LLM läuft die Inferenz jetzt mit über 40.000 Tokens pro Sekunde. Link
China setzt Quantentechnologie ein, um KI mit Milliarden Parametern zu trainieren – ein Schritt an der Grenze zwischen Physik und KI. Link
NVIDIA meldet einen Verlust von 5,5 Milliarden Dollar durch abgebrochene China-Chipverkäufe und betont seine Export-Gesetzestreue Link
AMD ist bereit, die Chipproduktion in der neuen TSMC-Fabrik in Arizona zu starten – Fokus auf Server für KI-Anwendungen Link
👷 Work & Future of Work:
Immer mehr CEOs (u. a. von PayPal, Shopify, UWM) setzen auf KI statt neue Leute einzustellen – was früher Tabu war, wird jetzt der Normalfall. Link
Gemini ist nun direkt in Google Sheets integriert – AI-gestützte Tabellenverarbeitung ist damit deutlich zugänglicher. Link
KPMG spart mit einem einfachen KI-Bot über 1.000 Stunden bei der Terminplanung – Interviewprozesse rund 60 % effizienter. Link
🆕 Neue Anwendungsfelder:
🔐 Cybersecurity & AI Safety:
Google hat 2024 über 39 Millionen Werbekonten gesperrt, 5 Milliarden betrügerische Anzeigen entfernt und mit KI einen massiven Rückgang bei Deepfake-Werbung erreicht Link
Jura-Professoren und der internationale Verlegerverband haben sich in einem KI-Urheberrechtsprozess auf die Seite von Autor*innen gestellt, die Meta wegen Training auf geschützten Texten verklagen. Link
Laut einer neuen Studie denkt ChatGPT erstaunlich oft wie ein Mensch – inklusive Denkfehlern wie übertriebene Selbstsicherheit. Link
Die US-Regierung hat neue Leitlinien zur Beschaffung und Nutzung von KI in Bundesbehörden veröffentlicht. Link
Studie zeigt: Menschen sind erschreckend schlecht darin, Deepfake-Stimmen zu erkennen Link
🏥 Health & Education:
🖼️ Kreativindustrie:
Canva bekommt ein Upgrade – der KI-Design-Assistent merkt sich deinen Stil und lässt sich per Textprompt steuern. Kreativarbeit wird damit noch schneller. Link
Runway bringt Gen-4 Turbo – generiert 10-Sekunden-Videos in nur 30 Sekunden. Link
ChatGPT bekommt eine eigene Bibliothek für deine KI-generierten Bilder – praktisch und übersichtlich. Link

AI Peanuts Workbook

Vollgepackt mit KI-Wissen, Tools & Tutorials!
Du hast angefangen, dich tiefer mit dem Thema KI zu beschäftigen und willst den nächsten Schritt machen? Dann ist unser offizielles AI Peanuts Workbook genau das Richtige für dich!
Das Workbook ist kein klassisches “Buch”, sondern ein praxisorientiertes, interaktives digitales Dokument. Gegliedert in 3 Teile:
Theorie — Der Textbuch-Teil des Workbooks, in dem wir das Thema KI und seine technischen Grundlagen erklären.
Praxis — Eine Reihe von praktischen Tutorials, mit denen du lernst, KI praktisch anzuwenden (z.B.: ChatGPT Masterprompts, HeyGen, NotebookLM, Midjourney…)
Daten — Datenbanken mit den besten KI-Tools und den spannendsten Firmen im KI-Umfeld.

🧂 Salty Memes:


Du hast Fragen, Anmerkungen oder brauchst unsere Hilfe?
Schreib uns einfach an:
[email protected]
Willkommen!
Hat dir das ein Freund oder eine Kollegin geschickt? Melde dich an und erhalte 2x Woche deine eigene Ausgabe mit den wichtigsten KI News direkt in dein Postfach.
Hilf uns dabei, besser zu werden! Was war schlecht? Was war gut? Wie fandest Du diese Ausgabe von AI Peanuts? |
Login oder Abonnieren um an umfragen teilzunehmen. |

Bis Dienstag!