In partnership with

WAS FÜR EINE WOCHE!!! Gestern Abend war es dann endlich so weit - OpenAI stellte in einem Livestream das lang ersehnte GPT-5 vor. Kann es auf den ersten Blick den sehr hohen Erwartungen entsprechen oder übertrifft es diese gar? Wir haben uns das für euch genauer angeschaut! Aber diese Woche ist vollgepackt mit Releases, die wir in den nächsten Wochen nach und nach für euch aufschlüsseln werden. OpenAI hat zwei unglaubliche Open-Source-Modelle veröffentlicht, Anthropic startet ein neues Opus-Modell, und Google zeigt Genie3, ein Tool, mit dem man ganze Welten erschaffen kann.

Peanuts für heute:

  • 🧠 Die Große Nuss: GPT-5 ist da - kann es die Erwartungen erfüllen?

  • 🛠️ Trai it Out: Shortcut - Dieser KI-Excel Assistent schlägt selbst Top-Consultants

  • 📊 Highlight: Mistral will $1Mrd an neuem Funding einsammeln


Heute unterstützt uns Attio als Werbepartner! Wir haben es als Tool bereits vorgestellt - Attio ist ein CRM, das von Grund auf mit KI durchdacht wurde. Extrem nutzerfreundlich und mit vielen praktischen KI-Features. Schaut es euch mal an:

Finally, a powerful CRM—made simple.

Attio is the AI-native CRM built to scale your company from seed stage to category leader. Powerful, flexible, and intuitive to use, Attio is the CRM for the next-generation of teams.

Sync your email and calendar, and Attio instantly builds your CRM—enriching every company, contact, and interaction with actionable insights in seconds.

With Attio, AI isn’t just a feature—it’s the foundation.

  • Instantly find and route leads with research agents

  • Get real-time AI insights during customer conversations

  • Build AI automations for your most complex workflows

  • Join fast growing teams like Flatfile, Replicate, Modal, and more.

🥜 Die größte Nuss:

GPT-5 ist da - kann es die Erwartungen erfüllen?

Gestern Abend war es so weit. Zweieinhalb Jahre nach dem ersten Release von GPT-4 wurde GPT-5 vorgestellt. Klar, seit GPT-4 ist viel passiert und es gab diverse Modell-Updates - von 4o und 4.1 bis zur o-Serie, die sich durch das Konzept des “Reasoning”, also langer Denkzeiten auszeichnete.

Die Erwartungen an OpenAI und GPT-5 waren und sind riesig. Das lag auch an den mal mehr oder weniger subtilen Tweets von OpenAI Gründer Sam Altman in den letzten Wochen, in denen er anklingen ließ, dass das neue Modell sehr sehr fähig sein würde.

Bringt GPT-5 Ordnung in den Modell Dschungel?

Eine klare Erwartung war auch, dass OpenAI endlich Licht in den Modell-Dschungel bringen würde. Denn selbst als Power-User war es in letzter Zeit kaum noch möglich genau zu verstehen, was die diversen Modelle unterscheidet und für welche Aufgaben welches genau am besten geeignet ist.

Die bisherige etwas unübersichtliche Modellauswahl

Diese Erwartung zumindest scheint bald erfüllt zu werden. Denn in ChatGPT werden bald alle Modelle einfach durch GPT-5 ersetzt. Dass das möglich ist sein wird, zeigt ein erstes wichtiges neues Feature des Modells: Es kann selbst entscheiden ob und wie viel "Reasoning”, also Denkaufwand für die Erfüllung einer Aufgabe nötig ist.

Das dürfte die Bedienung deutlich vereinfachen, vor allem für den Großteil der Durchschnitts- und Gelegenheitsnutzer. Was hier fast beleidigend klingt, soll das überhaupt nicht sein - im Gegenteil - auch wir AI Peanuts sind in unserem Alltag oft “normale Nutzer” von ChatGPT. Klar, wir nutzen KI Tools auch für komplexe Programmieraufgaben, zum Planen und Schreiben von Texten, für Automationen jeglicher Art; Aber die Magie in der Benutzung der Modelle liegt aus unserer Sicht ganz oft im Alltag: Wenn man ChatGPT eine super spezifische Frage zu einem Thema persönlichen Interesses fragt, die einem in den Kopf kommt, oder wenn man seinen Kindern bei den Hausaufgaben helfen will und selbst auf dem Schlauch steht, und so weiter.

Viele Nutzer haben bisher wahrscheinlich noch nie ein Reasoning Modell ausprobiert, dabei braucht es für viele Aufgaben längere “KI-Denk-Zeit” um zu guten Ergebnissen zu kommen. So simpel die Veränderung eines einheitlichen Modells also erscheint, so groß dürfte der wahrgenommene Einfluss auf die Antwortqualität für viele Nutzerinnen und Nutzer sein.

Wie nützlich ist GPT-5 im Alltag und für Pro-Nutzer?

Doch nicht nur das, auch die generelle Intelligenz des Modells scheint die bisherigen Modelle auf vielen Ebenen klar zu übertreffen. Liest man die Berichte von Beta-Testern, die GPT-5 schon länger testen durften, dann wird klar: Vor allem für die breite Masse an Nutzerinnen und Nutzern wird das Modell einen großen positiven Unterschied machen. Denn, und das ist hier erwähnenswert, GPT-5 wird allen zur Verfügung stehen - auch den kostenfreien Accounts. Der Rollout hat gestartet und spätestens in wenigen Tagen sollte das Modell für jeden zugänglich sein.

Die ersten Einschätzungen von Testern im professionellen Kontext sind etwas gemischter. Viele erste Demos sehen durchaus extrem vielversprechend aus. Gerade im “One-Shotting” also direkten Erzeugen von kleinen Programmen und Spielen ohne großes Prompt Hin-und-Her schneidet das Modell gut ab und liefert beeindruckende Ergebnisse:

Doch im agentischen Coden, in dem vor allem die Claude Modelle in den letzen Wochen für viele Stories sorgten, scheint GPT-5 nicht unbedingt überzeugend. So schreibt z.B. Kieran Klaassen von Every: “GPT-5 does what you tell it to do. It takes measured, small steps and wouldn't dream of straying off course—and that's my problem with it. It's good at coding, especially doing precise back-end tasks, but it isn't optimized to be agentic.”

Wir werden hierzu noch ausführlicher berichten, sobald wir selbst die Gelegenheit hatten das Modell intensiver zu testen. Aus unserer Sicht scheint es aber durchaus so zu sein: GPT-5 ist in diversen professionellen Aufgaben, auch im Coding, extrem fähig. Deutlich besser als seine Vorgänger-Modelle. Nur sind das eben Claude Opus 4.1 und Gemini 2.5 Pro auch - die Konkurrenz ist intensiv geworden und jedes Modell hat seinen eigenen “Charakter”. Vielleicht braucht es auch einfach ein bisschen, sich an den Stil von GPT-5 zu gewöhnen und oder es braucht auf Seiten von OpenAI noch weitere Feinschliffe.

Benchmarks, Halluzinationen und co.

Es wird noch ein paar Tage dauern, bis es unabhängige Benchmarks gibt, die das Modell klar mit der Konkurrenz vergleichen – und wie wir immer betonen – erzählen Benchmarks oft nur einen Teil der Geschichte, wie intelligent, oder nützlich ein Modell wirklich ist. In den in der Keynote vorgestellten Benchmarks schneidet GPT-5 zumindest im Vergleich zu den Vorgänger-Modellen sehr gut ab. Besonders interessant fanden wir bei der Präsentation die Benchmarks im Bereich Halluzination.

Laut OpenAIs eigener Aussage ist GPT-5 das bisher verlässlichste Modell, mit der geringsten Quote an Halluzinationen. Das ist nicht nur in Business-Anwendungen, sondern vor allem zum Beispiel im Bereich Gesundheitswesen wichtig - ein Bereich, den OpenAI in der Keynote ganz bewusst fokussierte.

Fazit

Zugegeben, wenige Stunden nach der Keynote und ohne die Chance, das Modell schon intensiv selbst getestet zu haben, ist zu früh um ein echtes Fazit zu ziehen. Und treue Leser wissen - wir AI Peanuts wollen weder die “Hype-Boys”, noch die ewigen Schlecht-Reder sein. Wir versuchen hier immer neutral, aber begeistert und mit Freude über die neuesten Entwicklungen zu schreiben.

Was wir bisher festhalten können: GPT-5 ist nicht AGI - aber das hat auch niemand ernsthaft erwartet. Das Modell bedeutet - vor allem für alle Alltagsnutzer - eine große Verbesserung der Fähigkeiten von ChatGPT, das finden wir großartig. Auch in diversen anderen Bereichen wie beim Coding und weitern professionellen Aufgaben schneidet das Modell in ersten Tests extrem gut ab und liefert Top-Ergebnisse und ist mindestens in der selben Liga wie viele der jüngsten Konkurrenz-Modelle von Anthropic und Google. Wie sich GPT-5 dann in der intensiven Benutzung schlägt, wird sich in den nächsten Tagen und Wochen zeigen und natürlich halten wir euch dazu auch weiter auf dem Laufenden!


Weitere Links:

🛠 Trai it out:

Shortcut - Dieser KI-Excel Assistent schlägt selbst Top-Consultants

Der Anwendungsfall, KI für Excel Analysen zu nutzen, liegt auf der Hand. Genau dafür gibt es ja auch schon den Microsoft Copilot oder KI-Features in Google Sheets. Doch während da manches nützlich ist, ersetzt es noch nicht viel manuellen menschlichen Input.

Genau das zu tun ist der Anspruch von Shortcut. Was auf den ersten Blick einfach aussieht wie Excel mit KI-Chat ist ein extrem fähiger KI-Assistent mit Top Skills für Datenanalyse und -aufbereitung. Shortcut schlägt in vielen Tests selbst Top Berater und Investment Banker Analysts, die tagtäglich mit komplexen Excel Sheets zu tun haben.

Was uns besonders gut gefällt: Shortcut macht das Überprüfen der von der KI erstellten Formeln und Anpassungen mit dem “Review Changes” Feature sehr transparent und einfach. Hier wurden die Ansätze der KI-Coding Tools übernommen. Und in den größeren Bezahl-Plänen agiert Shortcut sogar als Agent im Hintergrund - man schickt dem Tool z.B. einfach Aufgaben per E-Mail und erhält kurze Zeit später die gewünschten Excels zurück. Absolutes Must-Check-Out für alle, die viel mit Zahlen und Daten arbeiten!

Übersichtlich zusammengefasst sind die Features auch in diesem kurzen Video:

Tools kurz & knackig:

🍭🍬 Gemischte Tüte

📖 Must Reads:

Unsere Gemischte Tüte ist immer vollgepackt - in dieser Sektion kuratieren wir die aus unserer Sicht wichtigsten Links:

OpenAI veröffentlicht Open Weight KI-Modelle: Mit gpt-oss-120b und gpt-oss-20b bringt OpenAI zwei neue Sprachmodelle heraus, die jeder herunterladen, anpassen und in eigene Projekte integrieren darf – ein deutlicher Schritt zurück zu den Open-Source-Wurzeln des Unternehmens. „Open-weight“ unterscheidet sich von „Open-Source“: Ein Open-Source-Modell ermöglicht es Entwicklern, frei auf seine Gewichte zuzugreifen, also die Einstellungen, die steuern, wie es auf Fragen reagiert, sowie auf seinen Code und seine Trainingsdaten. Open-weight-Modelle erlauben es Entwicklern nur – ÜBERRASCHUNG – die Gewichte zuzugreifen. Die Modelle wurden speziell dafür entwickelt, leistungsfähige KI auch auf normaler Hardware nutzbar zu machen: Die kleinere Version läuft auf einem Standard-Laptop mit 16 GB RAM, die große auf einer einzigen High-End-GPU. Wir werden in den nächsten Ausgaben ausführlicher darüber schreiben! Link

Google DeepMind stellt mit Genie 3 ein KI-Modell vor, das begehbare virtuelle Welten erzeugt: Stell dir vor, du gibst einen Text ein – und die KI erschafft daraus eine frei begehbare Welt. Genau das macht Genie 3, Googles neuestes „World Model“: Aus einem einzigen Prompt erzeugt es nicht nur realistische Videos, sondern ganze Spielwelten, in denen man sich live bewegen und mit der Umgebung interagieren kann. Ob fotorealistische Landschaft, Sci-Fi-Stadt oder Fantasy-Wald – alles wird in Echtzeit in 720p bei 24 FPS gerendert, wobei jede Aktion des Nutzers die nächsten Frames beeinflusst. Das könnte in Zukunft Gaming, Simulation, Bildung und vieles mehr revolutionieren. Link

🇪🇺 EU-News:

  • Mistral AI will 1 Milliarde Dollar Funding bei 10 Milliarden Bewertung einsammeln – u. a. aus Abu Dhabi. Link

  • Die EU debattiert über mögliche Jobverluste durch KI – und überlegt, wie der AI Act angepasst werden kann, um Arbeitsplätze zu schützen. Link

  • Der schwedische Premierminister gibt zu, KI-Chatbots als „Zweitmeinung“ für politische Entscheidungen zu nutzen. Link

  • OpenAI hat eine neue Anleitung veröffentlicht, wie man ihre Open-Source-Modelle selbst finetunen kann – besonders spannend für Projekte in Europa. Link

👩‍💻 Tech-News:

  • Nach OpenAI und Perplexity startet jetzt auch Gemini sein Guided-Learning-Feature – ein Zeichen dafür, dass wir uns längst in der „Fast Fashion“-Phase von Software befinden. Link, Link

  • Anthropic veröffentlicht Claude Opus 4.1 – mit besseren Fähigkeiten bei agentenbasierten Aufgaben, Coding und komplexem Reasoning. Link

  • Neuer Lieblingspodcast? In dieser Episode spricht Anthropic-CEO Dario Amodei mit einem der Stripe-Gründer. Sehr hörenswert. Link

  • OpenAI investiert in ein „Excel-Agent“-Projekt, das automatisierte Modellierungen mit KI ermöglichen soll. Link

  • Apple entwickelt möglicherweise einen eigenen KI-„Answer Engine“-Dienst – also eine Suchmaschine mit LLM-Unterbau. Link

  • Google veröffentlicht Deep Think, ein KI-Modell mit Bronze-Medaillen-Niveau bei Mathe-Olympiaden. Link

  • OpenAIs Forschungschefs Mark Chen und Jakub Pachocki sprechen in einem Interview über langfristige Ziele – darunter echte Superintelligenz. Link

  • MIT stellt ein Tool vor, das unmögliche Objekte erkennt, visualisiert und manipuliert – zum Beispiel für Produktdesign oder Architektur. Link

  • Grok Imagine generiert mittlerweile 20 Millionen Bilder pro Tag – laut Elon Musk. Link

  • Aber Grok Imagine sorgt mit NSFW Inhalten auch mal wieder für reichlich Diskussionsstoff. Link

  • Cognition kauft Windsurf für dessen IP, feuert 30 Mitarbeitende und zwingt den Rest zu Buyouts oder härteren Konditionen. Link

  • Turing-Preisträger Jack Dongarra sieht Supercomputing und KI zunehmend zusammenwachsen – und erklärt, wie diese Systeme künftig aussehen könnten. Link

  • NotebookLM bekommt ein praktisches Update: Nutzer können nun mehrere URLs gleichzeitig hochladen – einfach durch Leerzeichen oder Zeilenumbruch trennen. Link

  • OpenAI testet ein mysteriöses CLI-Tool – ein Assistent, der deinen Laptop per Textbefehl steuern können soll. Link

🇨🇳 China & AI Race:

  • China wirft Nvidia vor, eine Backdoor in den für China bestimmten H20-KI-Chip eingebaut zu haben. Nvidia dementiert. Link

  • DeepMind-Chef Demis Hassabis glaubt: Die KI-Revolution wird zehnmal größer und schneller als die industrielle. Link

  • Letzte Woche flossen über 9,3 Milliarden Dollar in KI-Startups – allein in diesen sieben Tagen. Link

  • Laut Axios stützt sich das aktuelle US-Wirtschaftswachstum fast ausschließlich auf KI-Investitionen. Link

  • China präsentiert „Darwin Monkey“ – einen gehirninspirierten Supercomputer mit über 2 Milliarden künstlichen Neuronen. Link

👷 Work & Education:

  • Anthropic hat ein kostenloses, interaktives Prompt-Engineering-Tutorial veröffentlicht – eines der besten zurzeit. Link

  • Google investiert 1 Milliarde Dollar in KI-Ausbildung und Job-Programme in den USA. Link

  • OpenAI ermöglicht ChatGPT-Zugriff für alle US-Bundesbehörden – für 1 Dollar pro Jahr und Behörde. Link

🆕 Neue Anwendungsfelder:

  • Immer mehr ältere Menschen in den USA nutzen KI-Chatbots zur digitalen Gesellschaft. Link

  • Google Gemini kann jetzt personalisierte Gute-Nacht-Geschichten generieren – auf Basis einfacher Prompts. Link

  • DeepMind verbessert mit seiner Weather Lab KI die Vorhersage von tropischen Wirbelstürmen. Das neue Modell schlägt traditionelle Systeme in Genauigkeit. Link

🔐 AI Safety:

  • Carnegie Mellon demonstriert, wie LLMs autonom komplexe Cyberangriffe planen und ausführen können – gegen reale Netzwerke. Link

  • Cloudflare wirft Perplexity vor, mit versteckten Crawlern blockierte Webseiten zu durchsuchen – entgegen „robots.txt“. Link

  • Illinois verabschiedet als erster US-Bundesstaat ein Gesetz zur Regulierung von KI-gestützter Therapie. Link

  • ChatGPT bekommt neue Sicherheitsfunktionen für psychische Gesundheit – nach Berichten über problematische Interaktionen mit Nutzern in mentalen Krisen. Link

Hilf uns dabei, besser zu werden! Was war schlecht? Was war gut? Wie fandest Du diese Ausgabe von AI Peanuts?

Login or Subscribe to participate

🧂 Salty Memes:

Du hast Fragen, Anmerkungen oder brauchst unsere Hilfe?
Schreib uns einfach an:
[email protected]

Bis Dienstag!

Weitere Artikel

No posts found