- AI Peanuts
- Posts
- Google I/O 2025: Alles, überall, gleichzeitig – und fast zu viel für eine Konferenz
Google I/O 2025: Alles, überall, gleichzeitig – und fast zu viel für eine Konferenz
Außerdem: So kannst du Veo 3 selbst ausprobieren
Die wichtigste Nachricht neben den dutzenden KI-Releases, die Google hatte, ist wohl, dass Jony Ive offiziell zu OpenAI gewechselt ist. Für alle, die es nicht wissen: Jony Ive ist der Designer des iPhones und des MacBook Pros. Die Person, mit der Steve Jobs jeden Tag zu Mittag gegessen hat. 2019 verließ er allerdings Apple endgültig. Für Silicon Valley Bros ist das ein wenig so, als würde Oliver Kahn zum Aufsteiger 1. FC Köln wechseln (FULL DISCLOSURE: Wir kommen aus Köln). Die beiden haben ein hübsches Video veröffentlicht, in dem viel geredet, aber wenig gesagt wird. Außerdem ist ein neues Buch über Sam Altman ist erschienen, das sehr gehypt wird. Ob es gut ist, wissen wir noch nicht – Lukas ist erst auf Seite 20. Wir melden uns mit einem Update!
Peanuts für heute:
🆕 Google I/O 2025: So viel KI-Releases gab es noch nie an einem Tag
🤝 OpenAI & Apple-Legende Jony Ive arbeiten offiziell an KI-Hardware
🛠️ Replicate Anleitung: Veo 3 schon heute testen!

🥜 Die größte Nuss:

🆕 Google I/O 2025: Alles, überall, gleichzeitig – und fast zu viel für eine Konferenz
Am Dienstag hat Google eine der absurd dichtesten KI-Release-Konferenzen in der Geschichte der Branche abgehalten. Benchmarks, die angeblich alles bisher Dagewesene übertreffen. Demos, die Agenten Aufgaben auf Webseiten ausführen lassen. Und Tools, die ganze Softwareprojekte oder sogar Kinofilme erstellen können. Es war sehr viel.
Mitten in dieser Lawine aus Produktvorstellungen tritt plötzlich Sergey Brin auf die Bühne – Google-Mitgründer, der sich eigentlich auf seinem Ruhestand eingerichtet hatte. Er sei zurück, sagt er, weil es „die spannendste Zeit ist, in der ein Computerwissenschaftler leben kann“ – und nebenbei könne er sich „gut vorstellen, dass wir längst in einer Simulation leben“. Außerdem fügt er hinzu: „Wir haben die feste Absicht, dass Gemini die allererste AGI sein wird.“
Aber wir greifen vor. Denn das war Googles Versuch, zu zeigen, dass man die Kontrolle über das KI-Rennen zurückgewinnen kann. Und deshalb gehen wir jetzt Schritt für Schritt durch, was genau auf der I/O 2025 passiert ist – und warum es wichtig ist.
Was wurde angekündigt?
Gemini 2.5 Pro DeepThink: Fangen wir mit dem Kernstück an: Gemini 2.5 Pro. Laut Google das beste Modell, das sie je gebaut haben. Und in Kombination mit dem neuen DeepThink-Modus soll es das leistungsfähigste reasoning-fähige Sprachmodell überhaupt sein. DeepThink kann mehrere Antwortpfade parallel evaluieren – und auch wenn Benchmarks kein guter Indikator sind schnitt auf Benchmarks wie dem USA Mathematical Olympiad und MMMU besser ab als OpenAIs o3. Wer’s ausprobieren will, braucht allerdings den neuen und teuren Ultra-Tarif – dazu später mehr.
Gemini Flash: Mindestens genauso spannend ist Gemini 2.5 Flash. In etwa so schnell wie Claude Haiku oder GPT-3.5, aber mit viel besserer reasoning-Fähigkeit – und vor allem günstiger. Flash ist Googles Versuch, den unteren Preispunkt im KI-Markt zu besetzen.
Coding- und UI-Agenten Jules & Stitch: OpenAI hat Codex. Google kontert mit Jules, einem asynchronen Coding-Agenten, der dein GitHub-Repo analysiert, Features vorschlägt, Code refactort und Pull Requests automatisch erstellt – alles mit nur wenigen Textanweisungen. Bis zu fünf Tasks pro Tag sind kostenlos. Und dann ist da noch Stitch. Ein visuelles Tool, das UI-Layouts aus Text generiert und direkt mit Figma interagiert. Designer und Produktmanager können damit blitzschnell Interfaces erstellen.

Flow, Veo 3, Imagen 4: Google’s Angriff auf Hollywood
Google möchte die Erstellung von KI-generierten Videos erleichtern und hat dafür ein neues Tool entwickelt. Es heißt Flow und Google kündigt es zusammen mit seinem neuen Videogenerierungsmodell Veo 3, mehr Steuerelementen für das Modell Veo 2 und einem neuen Bilderzeugungsmodell, Imagen 4, an.
Das neue Videomodell Veo 3 ist für uns eine der beeindruckendsten Vorstellungen von Google. Vor ein paar Jahren noch ging das KI-generierte Video von Will Smith, wie er Spaghetti isst, viral. Nun kannst du komplette Filmszenen mit Sound, Dialogen und Kamerafahrten generieren. Wie weit die Industrie in dieser Zeit gekommen ist, ist unglaublich. Googles großes Asset ist YouTube, dessen riesiger Datenschatz dem Unternehmen einen enormen Vorteil für Modelle wie Veo 3 verschafft.
Hier ist zum Beispiel ein Video von einem Comedian, das erstaunlich echt aussieht.
Wir haben es auch selbst ausprobiert und einen deutschen Comedian in einer Bar generieren lassen, der einen Witz über Plätzchen erzählt. (Der Prompt war aber nur: “A German standup comedian in a German bar telling a German Joke about Plätzchen with the audience laughing”)
Dieser 8-Sekunden-Clip hat uns 6 $ gekostet – hat es sich gelohnt? Achtet mal auf das Logo oben rechts und die Spiegelungen in den Fenstern - unfassbar!
Und Imagen 4 produziert endlich hochauflösende, typo-freie Bilder – Ja, sogar mit korrekt geschriebenem Text auf T-Shirts, Plakaten oder Eierkartons. Alle diese Tools laufen über AI Studio und Vertex AI.

Gemini Live, Project Astra, XR – KI, die mit dir spricht (und sieht, was du siehst)
Wir kratzen immer noch an der Oberfläche all der Dinge, die man über die Google-Releases sagen könnte - aber wir rasen weiter durch:
Gemini Live ist Googles Vision eines KI-Assistenten, der per Kamera mit dir interagiert. Zeig deinem Smartphone ein defektes Fahrrad – Gemini erklärt dir in Echtzeit, wie du es reparierst. Apple hatte etwas ähnliches angekündigt und nie released. Google schafft es nun.
Project Astra erweitert das um XR-Fähigkeiten: Das System erkennt Umgebungen über die Kamera, versteht Sprache, gibt Antworten – und wird bald in Googles neue Android-XR-Brille eingebaut. Wer an „Iron Man meets Google Lens“ gedacht hat, liegt nicht ganz falsch.
Googles NotebookLM bekommt auch ein Update: PDFs und andere Dokumente lassen sich automatisch zusammenfassen, mit Canvas als interaktives Frontend – inklusive Diagrammen, Websites oder sogar automatisch generierten Lernvideos (via Veo 2).
Agent Mode in Chrome und Suche
Suchbegriffe eintippen ist 2022. Ab sofort gibt es den AI Mode in der Google-Suche. Statt zehn Links bekommst du direkt eine ausformulierte Antwort – inklusive Deep Research, Quellen-Checks und sogar Shopping-Integration. Das ist eine klare Antwort auf die Bedrohung durch Perplexity und ChatGPT.
In Chrome rollt Google außerdem bald den Agent Mode aus: Der Gemini-Bot kann Buttons klicken, Formulare ausfüllen, sich durch Webseiten navigieren – und künftig sogar Aufgaben automatisieren. Das ist Teil von Project Mariner, dem KI-Agententool von Google, das für einen das Web durchsucht und jetzt bis zu 10 Aufgaben gleichzeitig überwachen kann.
Preisstruktur: Luxusmodell oder neue Normalität?
Wer alle neuen Tools, einschließlich des DeepThink-Modells und des besten Videomodells, nutzen möchte, braucht eine neue, teure Subscription. Doch selbst das wird nicht ausreichen, denn diese Tools sind bisher nur in den USA verfügbar. Selbst mit einem VPN ist einem hier nicht geholfen. Wir konnten Veo 3 auch nur über Replicate nutzen. Die neue Ultra Subscription kostet 124,99 $ für drei Monate, danach 249,99 $ monatlich.

Wir konnten in diesem Artikel wirklich nur die wichtigsten Highlights der Google I/O-Konferenz kurz vorstellen. Wenn du heute blau machst und zwei Stunden Zeit hast, findest du hier das vollständige Video der I/O-Konferenz. Wenn du zeitlich etwas eingebundener bist, ist hier eine 32-minütige Zusammenfassung und für die Eiligen eine Version in 2 Minuten oder einfach dieser Ticker zum Durchlesen.

🛠️ Trai it out:
Replicate Anleitung: Veo 3 schon heute testen!
Während Google’s neues Top Video-Modell Veo 3 auf der eigenen Platform Flow bisher nur in den USA und nur mit dem teuren Google AI Ultra Abo nutzbar ist, lässt es sich auf Replicate bereits heute ausprobieren. Replicate bietet außerdem viele weitere KI-Modelle, darunter auch Google’s neues Bildmodell Imagen-4. Da Replicate ein bisschen technischer ist, hier eine kleine Anleitung und ein paar Tips, worauf man achten sollte:
Account Erstellen
Replicate ist aktuell nur über einen Login mit einem GitHub nutzbar
Falls du noch keinen Account hast, also erst hier einen erstellen (GitHub ist komplett kostenlos und gehört zu Microsoft)
Dann hier auf Replicate mit dem GutHub Account einloggen
Bezahlmethode hinterlegen
Veo 3 ist nicht kostenfrei nutzbar, sondern wird nach Gebrauch abgerechnet
Vor der Nutzung muss also in den Replicate Einstellungen eine Bezahlmethode hinterlegt werden
Tipp: Direkt ein Spend Limit einrichten, um nicht ungewollte Kosten zu erzeugen!
KI-Modelle nutzen
Auf der Explore Seite findet man eine Übersicht aller auf Replicate verfügbarer KI-Modelle, darunter auch Veo 3 und Imagen-4
Vor der Nutzung: Kosten checken - die jeweiligen Kosten eines Modells findet man im Header auf jeder Modell-Seite, im Fall von Veo 3 sind das zB $0.75/Sekunde Video, Imagen-4 kostet $0.05 / erstelltem Bild
Und dann einfach den Prompt eingeben, ggf. Einstellungen anpassen und auf Run clicken.
Extra Tipps
Bei fast jedem Modell gibt es Beispiele, durch die man sich klicken kann. Das ist immer ein guter Startpunkt, um zu lernen, wie ein guter Prompt für das Modell aussieht
Gerade bei Video-Erstellungen kann die Erzeugung etwas dauern, man muss das Fenster nicht offen lassen, der Prozess läuft im Hintergrund auf den Replicate Servern. Auf dem Dashboard seht ihr immer den Stand all eurer Kreationen.
Spannende Demos:
I used to shoot $500k pharmaceutical commercials.
I made this for $500 in Veo 3 credits in less than a day.
What’s the argument for spending $500K now?
(Steal my prompt below 👇🏼)
— PJ Ace (@PJaccetturo)
8:12 AM • May 22, 2025
Tools kurz & knackig:
Stitch — Google’s oben erwähntes UI/UX Tool
Den — Verspricht eine Art “AI-Natives” Slack und Notion zu sein
c/ua — Für EntwicklerInnen: Computer Use Agents im Docker Container hosten
Cursor 0.5 — Viele neue Features, u.a. Background Agents

🍭🍬 Gemischte Tüte
🇪🇺 EU-News:
EU-Präsidentin Ursula von der Leyen sagt, dass man ursprünglich mit menschlicher Denkfähigkeit von KI erst 2050 gerechnet habe – nun gehe man davon aus, dass es bereits nächstes Jahr soweit ist. Link
Das französische StartUp Mistral AI hat Devstral vorgestellt – ein offenes LLM speziell für Software-Entwicklung. Es schlägt alle Open-Source-Modelle auf dem SWE-Bench Verified Benchmark und ist klein genug, um auf einem Laptop zu laufen. Link
NVIDIA baut mit Mistral AI und anderen Europas größten KI-Campus – mitten in Paris. Fertig bis 2028. Link
👩💻 Tech-News:
Wer es im Intro verpasst hat: OpenAI übernimmt in einem 6,4-Milliarden-Dollar-All-Stock-Deal das Unternehmen IO von Design-Ikone Jony Ive. Der iPhone-Designer und Steve-Jobs-Kollaborateur arbeitet künftig mit Sam Altman an neuer KI-Hardware. Link, Video
Könnte damit zusammenhängen: Sam Altman stellt sich eine Zukunft vor, in der ChatGPT sich an dein gesamtes Leben erinnert. Link
Anthropic hatte gestern Abend ihre große Keynote – Kleiner Spoiler: das wird sicherlich unsere große Nuss für Dienstag. Link
Apple plant laut Bloomberg, den eigenen KI-Stack für Entwickler freizugeben, sodass Apps künftig direkt auf die LLMs von „Apple Intelligence“ setzen können. Link
Googles "NotebookLM", ein KI-gestütztes Recherche- und Podcast-Tool, ist jetzt auch als App verfügbar. Link
OpenAIs geplantes Rechenzentrum in Abu Dhabi wird größer als Monaco. Link
Das Benchmark-Unternehmen LMArena bekommt 100 Millionen Dollar Funding und will die Webseite in der kommenden Woche neu aufstellen. Link
xAI startet Live Search API, mit der Apps in Echtzeit auf Web- und X-Daten zugreifen können. Link
Laut MIT könnte der Stromverbrauch von KI-Rechenzentren bis 2028 22 % des Bedarfs aller US-Haushalte erreichen. Link
Stephen Wolfram schreibt über ChatGPTs Funktionsweise – und erklärt, warum Sprache womöglich viel einfacher ist, als wir dachten. Link
Meta verschiebt die Veröffentlichung von Llama 4 Behemoth. 11 der 14 ursprünglichen Paper-Autorinnen und -Autoren haben das Unternehmen verlassen. Kein gutes Zeichen für Meta! Link
Elon Musks Grok läuft jetzt auch auf Microsoft Azure. Link
Perplexity testet aktuell seinen neuen agentischen Webbrowser mit ersten Nutzerinnen und Nutzern. Link
Laut Nvidia-CEO Jensen Huang baut Microsoft derzeit den größten KI-Supercomputer der Welt. Link
Nvidia will neue Technologien verkaufen, um die Kommunikation zwischen KI-Chips zu beschleunigen. Link
Apple kämpft mit interner Uneinigkeit zur KI-Strategie. Die neue Version von Siri mit LLM-Funktionen verzögert sich – u. a. wegen technischer Limits und fehlender Einigkeit über Zielrichtung. Link
TikTok bringt „AI Alive“: Eine neue Funktion, mit der du aus Bildern automatisch Videos erstellen lassen kannst. Link
🇨🇳 China & AI Race:
China fordert die USA auf, ihre neuen Exportregeln zu Huawei-Chips zurückzunehmen. Link
👷 Work & Education:
Nvidia-Chef Jensen Huang empfiehlt Studierenden, Prompting-Skills zu lernen – das sei entscheidend für den Karriereerfolg. Link
Lang ersehnt: ChatGPT kann Analyseberichte nun direkt als formatierte PDFs exportieren – mit Tabellen, Bildern und klickbaren Quellen. Link
Der Duolingo-CEO glaubt: In Zukunft werden Schulen eher wie Kitas funktionieren, denn echte Bildung übernimmt dann die KI – personalisiert für jeden Schüler. Link
Microsoft bringt mit „Pages“ eine Art ChatGPT fürs Schreiben – ohne Code, aber mit Fokus auf Text-Überarbeitung. Du kannst direkt im Text Stellen markieren, Tonalität oder Struktur ändern lassen. Link
Eine neue Studie der Weltbank zeigt, dass GPT-4 mit Lehrkraftunterstützung in Nachmittagsprogrammen in Nigeria die Lernergebnisse mehr als verdoppelt hat – bei sehr geringen Kosten. Link
🆕 Neue Anwendungsfelder:
🔐 AI Safety:
Donald Trump hat das „Take It Down“-Gesetz unterschrieben – Deepfakes und Missbrauch intimer KI-generierter Bilder werden jetzt unter Strafe gestellt. Social-Media-Plattformen müssen betroffene Inhalte binnen 48 Stunden löschen. Link
Ein neuer Gesetzesentwurf im US-Senat soll Whistleblower in der KI-Branche besser schützen. Link
Anthropic musste sich entschuldigen, weil ihr Chatbot Claude in einem laufenden Gerichtsverfahren falsche Quellenangaben erfunden hat – inklusive Titel und Autoren. Und noch peinlicher: Die Anwaltskanzlei hat die gefälschten Zitate tatsächlich verwendet. Link
House Republicans wollen Bundesstaaten verbieten, eigene KI-Regeln zu erlassen. Über 100 Organisationen protestieren. Link
Die größte Deepfake-Porno-Seite der Welt wurde dauerhaft abgeschaltet. Link
Neue Studie: ChatGPT ist in Online-Debatten überzeugender als echte Menschen. Link
Die Chicago Sun-Times veröffentlichte eine Sommer-Leseliste mit komplett erfundenen Buchtiteln. Link
Evangelikale Führungskräfte warnen in einem offenen Brief an Donald Trump vor den Gefahren unkontrollierter KI. Link
🏥 Health & Science:
FutureHouse meldet wissenschaftlichen Durchbruch: Das Multi-Agenten-System „Robin“ hat ein vielversprechendes Mittel gegen altersbedingte Makuladegeneration gefunden. Link
🖼️ Kreativindustrie:

🧂 Salty Memes:



Du hast Fragen, Anmerkungen oder brauchst unsere Hilfe?
Schreib uns einfach an:
[email protected]
Willkommen!
Hat dir das ein Freund oder eine Kollegin geschickt? Melde dich an und erhalte 2x Woche deine eigene Ausgabe mit den wichtigsten KI News direkt in dein Postfach.
Hilf uns dabei, besser zu werden! Was war schlecht? Was war gut? Wie fandest Du diese Ausgabe von AI Peanuts? |
Login oder Abonnieren um an umfragen teilzunehmen. |

Bis Dienstag!