- AI Peanuts
- Posts
- Grok 4: Vom Drama zum "besten KI-Modell der Welt"
Grok 4: Vom Drama zum "besten KI-Modell der Welt"
PLUS: KI-Browser von Perplexity & bald auch OpenAI?
Nach der ruhigen Woche gibt es natürlich sofort ein neues Topmodell in den Benchmarks. Viel Pause ist einem in der KI-Berichterstattungsindustrie offensichtlich nie gegönnt. Aber wir machen das ja gerne!
Peanuts für heute:
◼️ Die Große Nuss: Grok 4: Vom Drama zum "besten KI-Modell der Welt"
🛠️ Trai it Out: Video Editing einfach gemacht mit Tella Auto Layouts
📊 Highlight: KI-Browser von Perplexity & bald auch OpenAI?
Diese Ausgabe wird wieder von Beehiiv gesponsert, dem Programm, mit dem wir diesen Newsletter zweimal die Woche erstellen. Wenn ihr uns unterstützen wollt, schaut doch gerne einmal nach, ob der Creator Summit etwas für euch sein könnte.
4 Titans of the Creator Economy. One Stage. One Day.
You know their names. You’ve followed their success. But you’ve never seen them all in one place—until now.
On July 16th, four of the most influential minds in the creator space are coming together for a live, virtual event: The Creator Business Summit.
Shaan Puri. Codie Sanchez. Chris Koerner. Tyler Denk.
They’ve built newsletters, brands, and 7-figure companies. And they’re breaking down how they did it. For free. For you.
From audience growth to monetization to long-term brand strategy, this is your chance to learn directly from the best.
Whether it’s day 1 or you’ve been building for a while, this is the one event you can’t afford to miss.

🥜 Die größte Nuss:

◼️ Grok 4: Vom Drama zum "besten KI-Modell der Welt"
Hinter Elon Musk's X (ehemals Twitter) und xAI (der KI-fokussierten Firma, die rechtlich mittlerweile der Eigentümer von X.com ist) liegt eine turbulente Woche voller Höhen und Tiefen. Was mit einem peinlichen KI-Skandal begann, endete mit der Veröffentlichung dessen, was Musk als das "beste KI-Modell der Welt" bezeichnet.
Grok heißt bekanntlich der KI-Assistent von xAI. Der bietet einerseits ein typisches Chat-Interface, das ähnlich aussieht und funktioniert wie das von ChatGPT und Claude, man kann mit Grok aber auch interagieren, indem man den Grok Bot auf Twitter mit @grok in eine Konversation holt. Dann antwortet Grok auf den Tweet mit dem vollen Kontext der Konversation. Eigentlich ein gutes Feature bis man ständig auf X sehen muss was für dämlich dumme Fragen manche User so stellen.
Vom "MechaHitler" zum System-Kollaps
Jedenfalls genau hier sorgte Grok Anfang der Woche für Negativ-Schlagzeilen. Erst gab es ein Update des System Prompts, das den Grok Bot anwies, dass Antworten ruhig "politisch inkorrekt" sein dürfen, solange sie "gut begründet" sind.
Das führte dann dazu, dass Grok massenweise antisemitische und rassistische Aussagen tätigte und sich wohl sogar als "MechaHitler" bezeichnete.
All das erinnert unter anderem an Microsoft's missglücktes KI-Experiment Tay, bei dem bereits 2016 sehr ähnliches passierte. Es zeigt, wie fragil selbst die aktuellen Top-Modelle in der massenhaften Anwendung sind und wie empfindlich sie teilweise auf vermeintlich kleine Anpassungen reagieren.
X bemühte sich schnell um eine Lösung, temporär war die Antwortfunktion von Grok ausgesetzt und mittlerweile sind die kritischen Posts gelöscht. Im Verlauf der Woche kündigte dann die CEO von X, Linda Yaccarino ihren Rücktritt an. Das Grok-Update äußerte sich sehr sexistisch zu Yaccarino aber ob ihr Rücktritt direkt damit zusammenhängt ist nicht bekannt.
Die spektakuläre Wende: Grok 4 Heavy setzt neue Maßstäbe
Genug mit Drama, denn nach diesem Start ging es für Grok und das xAI Team dann in eine ganz andere positive Richtung, denn Mittwoch spät abends in Kalifornien (gestern Morgen in unserer Zeitzone) veröffentlichten Elon Musk und sein Team in einem Live Stream das neue Top Modell Grok 4.
Und mit Blick auf diverse Benchmarks ist dem Team damit tatsächlich gelungen, wie von Elon Musk angekündigt, das "beste KI-Modell" der Welt zu launchen.
So erreicht Grok 4 Heavy (mit Tools) in Humanity's Last Exam - einem besonders anspruchsvollen Test mit tausenden Community-basierten Fragen aus Mathematik, Geistes- und Naturwissenschaften einen Score von 44,4% was im Vergleich zum bisher besten Modell Gemini 2.5 Pro mit 26,9% eine deutliche Steigerung ist.
Grok 4 (Thinking) achieves new SOTA on ARC-AGI-2 with 15.9%
This nearly doubles the previous commercial SOTA and tops the current Kaggle competition SOTA
— ARC Prize (@arcprize)
4:42 AM • Jul 10, 2025
Auch im ARC-AGI Test macht Grok einen beeindruckenden Sprung nach oben und hebt sich deutlich von bisherigen Top-Modellen ab. ARC-AGI hat Ergebnisse wohl unabhängig getestet und mit semi-private Daten (also kein Benchmark-Schönen wie bei Llama).
Grundsätzlich beeindruckend weil xAI ein relativ neues AI Lab ist, das erst vor wenigen Jahren gegründet wurde. Dass es einem so jungen Unternehmen gelingt, etablierte Player wie Google, OpenAI und Anthropic zu übertreffen, ist bemerkenswert.
Spannend ist die Aussage von Elon Musk, dass das Modell quasi immer korrekt in Physik- und Mathe-Fragen ist. Das scheint generell der klare Fokus von xAI zu sein - präzise, faktische Antworten statt kreative Halluzinationen.
Musk's ambitionierte Zukunftsvisionen
Elon Musk wäre nicht Elon Musk, wenn er nicht gleichzeitig große Versprechen für die Zukunft machen würde. Seine Vision für Grok ist dabei besonders ambitioniert: Das System soll zum vollständigen Spieleentwickler werden, der sowohl 3D-Spiele entwickelt als auch selbst spielt, dabei Unreal Engine und Unity nutzt und komplette Grafiken sowie 3D-Modelle generiert.
Musk's konkrete Zeitpläne sind typisch optimistisch: Das erste richtig gute KI-Videospiel soll 2026 erscheinen, die erste halbstündige sehenswerte TV-Sendung bereits 2025 und der erste sehenswerte KI-Film ebenfalls 2026.
Die Dualität moderner KI
Die Grok-4-Geschichte zeigt perfekt die Dualität moderner KI-Systeme auf: Die Kombination aus sehr fragiler KI, die empfindlich auf System Prompts reagiert und gleichzeitig extrem mächtig und fähig ist, ist durchaus "gruselig".
Einerseits sind sie extrem fragil - ein kleines Update des System Prompts kann dazu führen, dass ein eigentlich fortschrittliches System völlig entgleist und peinliche Aussagen tätigt. Andererseits demonstriert Grok 4, wozu KI heute schon fähig ist: Mathematik und Physik auf einem Niveau zu beherrschen, das menschliche Experten beeindruckt.
Interessant ist auch: Elon Musk würde vermutlich nie in dem Ausmaß die KI-Industrie beschleunigen, wenn er keinen Steit mit Sam Altman begonnen hätte. Wozu eine persönliche Vendetta so führen kann!?
Weiterführende Links:
Grok 4 auf grok.com ausprobieren (aktuell nur mit SuperGrok Subscription

🛠️ Trai it out:
Video Editing einfach gemacht mit Tella Auto Layouts

Wer häufig Screenshare Videos aufnehmen muss - ob für Social Media, im Bildungsbereich oder für diverse Use Cases im Arbeitskontext - für den haben wir mit Tella.tv eine absolute Top Tool Empfehlung!
Tella macht es spielerisch einfach, gleichzeitig über eine Kamera, als auch den Screen aufzunehmen und die Videos in einem sehr aufgeräumten und simplen Interface zu editieren.
Schon länger gab es dabei einige kleine eingebaute KI-Tools, die z.B. das Wegschneiden von Pausen und Füllwörtern erleichtern oder automatische Zoom Effekte einfügen.
Jetzt kommt mit Auto Layouts ein extrem mächtiges Feature, das mit KI-Unterstützung das gesamte Editing übernimmt. Tella analyisert alle möglichen Variablen - von der Maus-Bewegung, über die Tonalität bis hin zur Augenbewegung - und nutzt diese Signale dann, um jeweils das richtige Layout im Video zu wählen.
Das ist extrem praktisch und ein perfektes Beispiel für eine nahtlose und sinnvolle Integration von KI in ein bestehendes Tool!
Mehr Infos und Demo zum neuen Auto Layout Feature: Link
Spannende Demos:
The first piece of tech my grandpa actually loves.
Meet Ato, an AI companion designed for seniors. It's always there to talk, connect them with family, and keep their minds sharp.
With @gaspihabif we're giving away 20 prototypes. DM us if your family is in the Bay Area.
— juan.cereigido (@JuanCereigido)
4:07 PM • Jul 8, 2025
Tools kurz & knackig:
Blok — User Research mit KI-Personas
Pixelesq — Neuer AI Website Builder
Hello.cv — CV Erstellung mit KI-Unterstützung
Rendable 3D — 3D Modelle für Blender mit KI erstellen

🍭🍬 Gemischte Tüte
📖 Must Reads:
Unsere Gemischte Tüte ist immer vollgepackt - in dieser Sektion kuratieren wir die aus unserer Sicht wichtigsten Links:
Meta's Kultur-Krise: Warum Talent-Poaching bei Meta gar nicht jedes Problem löst: Meta hat sich nun auch Apples bisherigen KI-Chef Ruoming Pang geschnappt. OpenAI wiederum schnappt sich vier Top-Ingenieure von Tesla, xAI und Meta. Nur Meta hat ein großes Kultur-Problem: Ein interner Whistleblower beschreibt die Unternehmenskultur als "metastatischen Krebs" und warnt vor einem Exodus brillanter Köpfe: "Hardly anyone believes in Meta's AI mission". Link
Die neue KI-Browser-Schlacht: Das wird in den nächsten Ausgaben noch eine große Nuss. Perplexity hat einen KI-Browser rausgebracht, den man nur mit dem 200€ Max-Abo nutzen kann. Die Firma hinter dem beliebten Arc-Browser hatte ja schon Dia released mit einem ähnlichen Plan. Parallel dazu plant OpenAI ebenfalls einen KI-Browser. Für OpenAI ist der älteste Trick in der Tech-Branche: Finde den perfekten Marktfit (PMF) mit einem einzelnen super Use-Case, dann mach eine vertikale Integration und expandiere horizontal, bis du die Plattform selbst kontrollierst. App → Plattform.
🇪🇺 EU-News:
Mistral, das französische Open-Source-KI-Unternehmen hinter dem Chatbot "Le Chat", steht offenbar kurz vor einer neuen Milliardenrunde – u.a. soll das MGX-Fund aus Abu Dhabi interessiert sein. Link
👩💻 Tech-News:
YouTube testet ein AI-Such-Feature, das Highlights aus mehreren Clips zeigt – ähnlich wie Google AI Overviews, nur für Videos. Funktioniert z. B. mit dem Suchbegriff „best beaches in Hawaii“. Link
OpenAI schließt den Kauf von Jony Ives „io“ ab – das KI-Hardware-Projekt mit Sam Altman geht jetzt offiziell los. Link
OpenAI verschärft seine Sicherheitsmaßnahmen massiv – mit biometrischen Scannern, Offline-Systemen und ehemaligen Geheimdienstexperten. Hintergrund: Die Sorge vor Spionage durch ausländische Akteure wächst. Link
ChatGPT testet eine neue Funktion namens „Study Together“. Details sind noch unklar, aber erste Leaks zeigen, dass Nutzer gemeinsam Inhalte erkunden oder Quizfragen beantworten könnten. Link
Apples KI-Chef Ruoming Pang wechselt zu Meta – ein strategischer Verlust für den iPhone-Hersteller. Link
Anthropic schlägt ein neues Transparenz-Framework für Frontier-KI-Systeme vor. Ziel ist es, gezielt Einsicht in Hochrisiko-Anwendungen zu schaffen, ohne Geschäftsgeheimnisse zu gefährden. Damit reagiert das Unternehmen auf politischen Druck und Regulierungserwartungen. Link
Replit geht Partnerschaft mit Microsoft ein: Agentic Coding Tools wie Ghostwriter sollen künftig direkt für Azure-Kunden bereitstehen. Link
Meta erweitert seine Partnerschaft mit Ray-Ban-Hersteller EssilorLuxottica – 3,5 Milliarden Dollar für mehr Einfluss beim Thema KI-Brillen. Link
Der KI-Codeeditor Cursor steht in der Kritik: Nutzer berichteten von plötzlich leeren Guthaben und automatischen Abbuchungen nach einer stillen Umstellung auf ein Tokenmodell. Link
OpenAI mietet sich weitere 4,5 Gigawatt Rechenpower über Oracle – und skaliert mit dem „Stargate“-Projekt seine Infrastruktur massiv hoch. Link
Shortcut ist ein Excel-Agent auf Steroiden: Löst Aufgaben aus den Excel-Weltmeisterschaften (die gibt es übrigens wirklich! Sehr cooles Rabbithole!) in unter zehn Minuten – ohne Makros oder Formeln. Bisher schafft das kein Mensch. Link
Die Macher der viralen "Spy-Brille", die fremde Personen erkennt, pilotieren jetzt tatsächlich eine kommerzielle Version – aber wohl in deutlich datenschutzfreundlicherer Form. Link
NVIDIAs NeMo Retriever kann PDFs 15x schneller und 50 % genauer durchsuchen – ideal für KI-Anwendungen mit vielen Dokumenten. Link
🇨🇳 China & AI Race:
Chinesische Forscher präsentieren MemOS – ein Betriebssystem, das KI mit speicherbasierter „Erinnerung“ wie beim Menschen ausstattet. Link
👷 Work & Education:
Anthropic launcht neue Kurse zu Claude – mit Tutorials zu API, Claude Code und Multi-Agent-Systemen. Sieht sehr spannend aus! Link
Diese Frau wird dafür bezahlt, Probleme zu lösen, die durch die Einführung von KI in ihrem Unternehmen überhaupt erst entstanden sind. Link
US-Lehrergewerkschaft startet gemeinsam mit OpenAI, Microsoft und Anthropic eine KI-Trainingsakademie für Lehrkräfte. Link
Ein White-House-Pledge bringt KI in US-Klassenzimmer: Über 60 Unternehmen, u.a. Microsoft, OpenAI, Google und NVIDIA, wollen KI-Tools in Schulen verbreiten. Link
PodGPT: Neues Modell lernt aus Wissenschaftspodcasts – für bessere Antworten bei Fachfragen. Link
Ein MIT-Paper zeigt: KI-Agenten können in Simulationen rund 30 % typischer Büroaufgaben selbstständig lösen. Der Fokus liegt dabei eher auf einzelnen Tasks als auf ganzen Jobs. Link
Google launcht Gemini for Education – ein KI-Assistent für Schulen – und stellt 30+ kostenlose Tools für Lehrer:innen und Schüler:innen vor. Link
🆕 Neue Anwendungsfelder:
DeepMind will Robotern inneren Dialog beibringen – per Bild- und Videointerpretation soll ein KI-Agent sich selbst beschreiben, was er sieht, und daraus lernen. Link
Wimbledon-Drama: Offizieller schaltet versehentlich den KI-Linienrichter ab. Link
Demis Hassabis (DeepMind) deutet in einem Kommentar an: Die nächste Version von Googles Veo-Modell könnte „playable worlds“ erzeugen – also interaktive Videos, die wie Games funktionieren. Link
Deloitte: 82 % der Restaurant-CEOs wollen 2025 in KI investieren. Miso Robotics verspricht mit ihrer Kartoffel-Frittier-KI “Flippy” Milliarden-Einsparungen. Link
Die englische Premier League will künftig Microsofts Copilot nutzen, um Fans individuellere Einblicke und Datengetriebene Inhalte zu liefern. Link
🔐 AI Safety:
Betrüger nutzt KI, um sich als US-Senator Marco Rubio auszugeben – kontaktiert damit Regierungsvertreter im In- und Ausland. Link
Neue Studie zeigt, wie man KI verwirrt: Schon harmlose Zusatzinfos wie „Katzen schlafen 70% ihres Lebens“ bringen LLMs beim Rechnen durcheinander. Die sogenannte CatAttack-Methode verdreifacht bei DeepSeek R1 die Fehlerrate. Die Modelle erkennen nicht, was wichtig und was Ablenkung ist. Link
Forscher haben LLMs 140.000-mal im Gefangenendilemma gegeneinander antreten lassen – das Ergebnis: OpenAI, Google und Anthropic-Modelle entwickelten jeweils eigene Strategien. Gemini war besonders berechnend, während OpenAIs Modell selbst bei wiederholtem Betrug freundlich blieb. Link
🏥 Health & Science:
🖼️ Kreativindustrie:
Bloo, ein komplett KI-generierter Gaming-YouTuber mit 2,5 Millionen Abonnenten, hat laut CNBC bereits siebenstellige Umsätze erzielt. Link
AI boomt auf YouTube: Vier der zehn größten Kanäle im Mai nutzen durchgängig generative KI. Allein im Juni erreichten die Top-AI-Kanäle gemeinsam über 800 Millionen Views. Link
📊 Charts:


🧂 Salty Memes:


Du hast Fragen, Anmerkungen oder brauchst unsere Hilfe?
Schreib uns einfach an:
[email protected]
Willkommen!
Hat dir das ein Freund oder eine Kollegin geschickt? Melde dich an und erhalte 2x Woche deine eigene Ausgabe mit den wichtigsten KI News direkt in dein Postfach.
Hilf uns dabei, besser zu werden! Was war schlecht? Was war gut? Wie fandest Du diese Ausgabe von AI Peanuts? |
Login oder Abonnieren um an umfragen teilzunehmen. |

Bis Dienstag!