Was für eine Woche! Wir versuchen, die Nachrichten von den wichtigen Veröffentlichungen aufzuarbeiten. Heute sprechen wir über das interessante World-Model von Google. Übrigens: AOL hat nun offiziell das Ende der AOL CD’s und Dial-Up Internet angekündigt(🎵Modem Einwählsound-Schweigeminute🎵).
Peanuts für heute:
🧞 Die Große Nuss: Genie 3 von Google DeepMind macht die Welt spielbar
🛠️ Trai it Out: Von Prompt zur Videoanimation in wenigen Klicks
📊 Highlight: Weitere Reaktionen auf GPT5 & Google argumentiert gegen Vorwürfe von Medienhäusern

🥜 Die größte Nuss:

🧞 Genie 3 von Google DeepMind macht die Welt spielbar
Ich (Lukas) habe eine Zukunftsphantasie - schon seit circa zehn Jahren. Ich brauche keine fliegenden Autos - Lilium hat mir gezeigt, dass die viel zu laut sind. Ich brauche auch keine Superintelligenz. Aber ich möchte meine Rente damit verbringen, in einer simulierten Bar zu sitzen, ein paar Bier mit einer perfekten Simulation von Charles Bukowski zu trinken und mit ihm über das Leben zu sprechen. Oder mit Markus Aurelius in seinem Zelt an der gallischen Front in der heutigen Slowakei. Dieser Traum ist in der letzten Woche ein kleines bisschen realistischer geworden.
Die letzte Woche war geprägt von Hype & Ernüchterung zu GPT-5, aber eine andere Ankündigung könnte langfristig vielleicht bedeutsamer sein: Google DeepMind hat Genie 3 vorgestellt, das erste "World Model", das wirklich hält, was der Name verspricht.
Was ist das? Genie 3 generiert nicht nur Videos, sondern vollständig interaktive 3D-Welten in Echtzeit. Der Unterschied zu bisherigen Video-Generatoren ist fundamental: Statt "animierter Standbilder" entstehen hier erkundbare, räumliche Umgebungen, die auf Nutzer-Input reagieren.
Die technischen Fakten:
Echtzeit-Interaktion: 720p bei 24fps - Knopfdruck führt sofort zu Reaktionen im generierten Raum.
World Memory: Änderungen bleiben bestehen - wer eine Wand anmalt, findet die Farbe beim Zurückkehren noch vor.
Promptable Events: Neue Elemente lassen sich spontan in die Welt einfügen (andere Personen, Transportmittel, unerwartete Ereignisse).
Start aus einem Bild: Jedes Foto kann als Ausgangspunkt für eine interaktive Welt dienen.
Für die KI-Entwicklung markiert Genie 3 einen wichtigen Meilenstein in mehreren Bereichen. Erstmals zeigt ein KI-System räumliches Verständnis, das über statische Bilderkennung hinausgeht. Genie 3 "versteht" die 3D-Struktur einer Szene gut genug, um kohärente Bewegungen und Interaktionen zu ermöglichen. Das ist ein Schritt in Richtung dessen, was Forscher "Spatial Intelligence" nennen.
Warum ist das wichtig?
Google positioniert Genie 3 explizit als Tool für das Training von KI-Agenten. Die Logik dahinter ist bestechend einfach: Wir haben nicht genug Real-World-Daten, um Roboter zuverlässig zu trainieren. Also simulieren wir unendlich viele Welten. Darin können KI-Agenten und Roboter dann unendlich viele
Ein Meilenstein mit klaren Schwächen
Google kommuniziert die Schwächen von Genie 3 überraschend ehrlich. Die World Memory funktioniert nur wenige Minuten, nicht Stunden oder Tage. Komplexe Aktionen sind nicht möglich, das System beschränkt sich auf einfache Bewegungen wie Laufen und Springen. Gespräche mit anderen Charakteren funktionieren nicht, und die Physik-Simulation ist ungenau. Auch Text wird nur in niedriger Qualität dargestellt.
Diese Einschränkungen sind nicht nur technische Details, sondern zeigen, wo die Technologie heute steht. Für ernsthafte Robotik-Anwendungen ist Genie 3 noch nicht brauchbar. Die Physik-Probleme machen es unzuverlässig für das Training von Systemen, die später in der realen Welt funktionieren müssen.
Trotz der Einschränkungen dürfte Genie 3 zuerst die Unterhaltungsindustrie umkrempeln, nicht die Robotik. AAA-Spiele, also Computerspiele, die vom Mainstream gekauft werden, kosten heute teilweise Hunderte Millionen Dollar, wobei ein Großteil davon in die manuelle Gestaltung von Spielumgebungen fließt. Genie 3 zeigt einen Weg zu vollständig generierten, aber dennoch kohärenten Spielwelten.
I got the @GoogleDeepMind team to test Genie 3 with one of my artworks
— #Rui Huang (#@RuiHuang_art)
1:29 AM • Aug 11, 2025
Der Ansatz unterscheidet sich fundamental von bestehenden Tools. Während Unreal Engine und Unity auf hart programmierte Assets setzen, trainiert Genie 3 auf Milliarden Stunden YouTube-Video. Das macht es skalierbarer, aber weniger vorhersagbar.
Bisher nur als “Research-Preview”
Google hat Genie 3 als "Research-Preview" zurückgehalten und sagt nicht, wann es für alle verfügbar sein wird. Das ist ähnlich wie bei Imagen 1, das vor 2 Jahren auch als "nicht bereit für die Öffentlichkeit" bezeichnet wurde. Heute kann man Imagen 4 frei nutzen und über eine API darauf zugreifen. Vermutlich wird es bei Genie 3 genauso sein – es dauert nur eine Weile.
Die fundamentale Frage bleibt, ob vollständig imaginierte Simulationen der Weg zu fortgeschrittener KI sind, oder ob programmierbare, aber vorhersagbare Umgebungen wie Nvidias Isaac Lab zuverlässiger funktionieren. Auf meinen Zukunftstraum muss ich also noch eine Weile warten – aber bis zu meiner Rente in etwa 40 Jahren sollte das schon möglich sein.

🛠 Trai it out:
Hera - vom Prompt zur Videoanimation in wenigen Klicks

Für alle, die (noch) keine Motion-Design-Skills haben, gibt es jetzt Abhilfe: HERA. Damit lassen sich in kurzer Zeit ansprechende Animationen erstellen. Egal ob für Social Media, Präsentationen, um Daten lebendiger wirken zu lassen, oder als stilvolle Video-Abbinder.
Unser Eindruck nach dem Test: Komplett von Null zu starten und HERA nur zu beschreiben, was man braucht, klappt aktuell eher mäßig. Wer sich aber durch die Templates klickt, findet schnell Vorlagen, die sich mit eigenen Daten, Logos oder Schriften anpassen lassen – und so zu guten Ergebnissen führen.
Animationen lassen sich per Prompt anpassen, z. B. schneller abspielen, Balken gleichzeitig oder nacheinander einblenden oder gleich eine ganze Excel-Datei als Datengrundlage nutzen.

Spannende Demos:
Passend zur großen Nuss: Ein Nutzer hat Genie 3 mit berühmten Gemälden gefüttert, die man nun begehen kann. Sehr sehr cool!
Something fun we discovered: you can use #Genie3 to step into and explore your favorite paintings.
Here's a short visit to Edward Hopper's "Nighthawks".
— #Aleksander Holynski (#@holynski_)
6:04 PM • Aug 8, 2025
Tools kurz & knackig:
Hyprnote - Schon wieder eine Meeting Notizen App? Ja, aber die hier läuft komplett lokal, besser für die Privatsphäre
Color.io - hat nicht direkt etwas mit KI Generierung zu tun, aber wer seine Bilder auf die Schnelle mit cinematischen Filtern versehen möchte, dem empfehlen wir diese App (die auch ohne Anmeldung auskommt)
Supercraft - im Handumdrehen physische Produkte designen

🍭🍬 Gemischte Tüte
📖 Must Reads:
Unsere Gemischte Tüte ist immer vollgepackt - in dieser Sektion kuratieren wir die aus unserer Sicht wichtigsten Links:
Paar Update zu GPT-5: Die Reaktionen sind gemischt und in der Tendenz eher enttäuscht. Es gibt wohl viel weniger Halluzinationen Link, ein bessere Langkontext-Leistung Link, aggressive API-Preise (bis zu 12× günstiger als Konkurrenz) und stark für Alltagsnutzer. Sam Altman & einige Researcher haben auf Reddit ein Ask-Me-Anything veranstaltet und Nutzer haben sich intensiv dafür ausgesprochen das 4o-Modell zurückzubekommen. Link
Google verteidigt seine AI Overviews gegen den Vorwurf, Publisher-Traffic massiv zu verringern. In einem Blogpost spricht das Unternehmen von „relativ stabilem“ Referral-Traffic – wasauchimmer das heißen mag. Wichtiger ist jedoch der Kernpunkt: Laut Google verschieben LLMs nicht nur Klicks von Publishern zu Google, sondern verändern grundlegend, welche Arten von Suchanfragen Menschen stellen und welche Websites sie ansteuern. Das bedeutet, dass sich die Verteilung von Online-Traffic durch KI-Suche strukturell ändern wird. Link
🇪🇺 EU-News:
Der deutsche Ex-OpenAI-Forscher Leopold Aschenbrenner verwaltet inzwischen über 1 Mrd. USD und schlägt mit seinem KI-Infrastruktur-Fonds („Pick and Shovels“) praktisch alle großen Hedgefonds YTD. Mal sehen, wie das in 10 Jahren aussieht. Link
KI-getriebene Wettbewerbs- und Kartellrechtsfragen zu algorithmischer Preisabstimmung und Self-Learning-Tools in USA und EU. Link
👩💻 Tech-News:
Grok 4 ist jetzt für alle Benutzer kostenlos. Die kostenlose Stufe erlaubt eine kleine Anzahl von Anfragen pro Tag. Darüber hinaus ist ein Abonnement erforderlich. Link
Meta kauft WaveForms AI, ein Startup für emotionserkennende Audio-KI. Link
OpenAI schlägt Elon Musks Grok im AI-Schachturnier. Link
Analyse der Architekturfortschritte von GPT-2 bis gpt-oss. Link
KI schafft neue Milliardäre in Rekordtempo. Link
Google macht Rechenzentren flexibler, um Stromnetzen zu helfen. Link
OpenAIs Codex CLI jetzt mit GPT-5 und kostenloser Nutzung für ChatGPT-Abonnenten – kein API-Key nötig. Link
Cursor CLI bringt KI-Coding-Hilfe ins Terminal – ähnlich wie Claude Code oder Gemini CLI. Link
Ex-EY-UK-Chef sieht in KI große Chancen für neue Player – und steigt selbst bei mehreren ein. Link
Meta zeigt in einem Paper, wie KI Werbeanzeigen umschreibt, um höhere Response-Raten zu erzielen. Link
Shopify will sich mit KI von SaaS-Standardware zu einer Empfehlungs- und Traffic-Plattform hocharbeiten – die Umsetzung wird durch LLMs komplexer. Link
Google plant, Anzeigen in den „AI Mode“-Suchergebnissen einzubauen. Link
Nach Perplexity jetzt auch Google Finance mit KI-Kern: Nutzer können detaillierte Finanzfragen stellen und erhalten Antworten samt relevanter Weblinks. Link
🇨🇳 China & AI Race:
Nvidia und AMD einigen sich auf 15 % Umsatzsteuer für China-AI-Chip-Verkäufe. Link
Ehemaliger OpenAI-Forscher (jetzt bei Meta) erklärt, warum Scaling Laws nicht scheitern können – sie spiegeln die Struktur der Daten selbst wider. Link
Leaderboard für beste Video-Modelle: 14 der Top 20 kommen aus China. Link
Analyse: Wie die AI-Capex-Welle die US-Wirtschaft beeinflusst. Link
Chinas Qwen veröffentlicht ein Modell mit 1 Mio. Token Kontextlänge – extrem beachtlich. Link
👷 Work & Education:
Warum KI in GDP-Zahlen nicht auffällt: Der Nutzen fließt größtenteils an Konsumenten – gemessen wird, wie viel Geld nötig wäre, um auf ein Gut zu verzichten, nicht nur der Kaufpreis. Link
Unklar, was KI für Berater und Buchhalter bedeutet – aber für Indiens 300-Mrd.-USD-IT-Outsourcing-Industrie könnten Code-schreibende Maschinen ein Gamechanger sein. Link
🆕 Neue Anwendungsfelder:
🔐 AI Safety:
Nur Stunden nach Release der Open-Weight-Modelle von OpenAI hat ein Hacker sie jailbreakt und zu gefährlichen Inhalten gebracht. Link
Anthropic-Forscher wollen KI durch „böses Training“ langfristig sicherer machen. Link
Black-Hat-Forscher zeigen Zero-Click-Prompt-Injection-Angriffe auf populäre AI-Agents. Link
MIT, Harvard und Broad Institute stellen PUPS vor – ein KI-System, das den exakten Ort praktisch jedes Proteins in einer menschlichen Zelle vorhersagen kann. Link
Cloudflare wirft Perplexity vor, Robots.txt zu ignorieren und Crawler zu tarnen, um blockierte Websites auszulesen. Link
🏥 Health & Science:
Meta Llama 3.2 90B wird in Brasilien genutzt, um Antibiotikaresistenzen zu bekämpfen. Link
🖼️ Kreativindustrie:
Umfrage zur KI-Nutzung in journalistischen Redaktionen. Link
Hilf uns dabei, besser zu werden! Was war schlecht? Was war gut? Wie fandest Du diese Ausgabe von AI Peanuts?

🧂 Salty Memes:


Du hast Fragen, Anmerkungen oder brauchst unsere Hilfe?
Schreib uns einfach an:
[email protected]

Bis Freitag!