Frohe Pfingsten nachträglich - es gibt viel zu erzählen!

Menschen wie wir, die auf KI-Twitter (meinetwegen KI-X, aber das klingt einfach nicht so gut) zuhause sind, waren diese Woche SEHR aufgeregt. Andrej Karpathy war im Gründungsteam von OpenAI, leitete die KI-Abteilung bei Tesla und baute zuletzt ein Education-Startup auf. Jetzt ist er zu Anthropic gewechselt, um ein Team aufzubauen, das KI-Systeme ihr eigenes Pre-Training optimieren lässt. Einer der gefragtesten KI-Forscher der Welt, und er kehrt nicht zu OpenAI zurück. Das ist, als würde Manuel Neuer bei der WM für Frankreich antreten.

Peanuts für heute:

🧠 Die Große Nuss: Google I/O 2026: Alles, was du wissen musst
📊 Highlight: Karpathy wechselt zu Anthropic, Pre-Training-Team
🛠️ Trai it Out: 60-Minuten-Videos aus einem einzigen Prompt generieren

🔍 Googles eigene Entwickler nutzen heimlich das Konkurrenzprodukt

Letzte Woche fand die wichtigste Entwicklerkonferenz des Jahres für Google statt. Zahlreiche neue Produkte wurden bekannt gegeben. In der zweiten Minute des Launch-Videos für Antigravity, Googles neuem KI-Coding-Tool, ist kurz ein Dateiordner im Hintergrund zu sehen. Der Name: Codex. Das Tool von OpenAI, Googles direktem Konkurrenten.

Google hat Dutzende neue Produkte vorgestellt: KI-Brillen mit Samsung und Warby Parker, ein weltsimulierendes System namens Genie 3, das auf Googles Street-View-Datenschatz zurückgreift, und das Sprachmodell Gemini 3.5 Flash. Dahinter steckt die Idee, Gemini nicht mehr als eigenständiges Chat-Produkt zu positionieren, sondern als KI-Schicht tief in alle Google-Oberflächen einzubauen: Suche, Gmail, Android, Chrome.

Hier die wichtigsten Ankündigungen:

Gemini 3.5 Flash: Das wichtigste Modell ist nicht das größte

Google hat Gemini 3.5 Flash vorgestellt. Das ist nicht das supergroße Pro-Modell, sondern eher das schnelle Arbeitsmodell.

Das ist wahrscheinlich Googles wichtigste Wette: Nicht jedes Modell muss in jedem Benchmark Platz 1 sein. Es reicht, wenn es stark genug ist und überall eingebaut wird. Gemini 3.5 Flash ist also weniger „Wow, die schlauste KI der Welt“ und mehr „das Modell, das Google in Milliarden Workflows stecken kann“.

Gemini Omni: Googles neues Video- und Multimodal-Modell

Gemini Omni ist Googles neues Modell für kreative Medien. Es kann aus Text, Bildern, Videos und Audio neue Videos erstellen oder bestehende Videos bearbeiten. Google verbindet Video-KI mit einer größeren These: Wenn ein Modell gute Videos erzeugen kann, muss es etwas über die Welt verstanden haben. Zum Beispiel Bewegung, Licht, Schwerkraft, Objekte und Ursache-Wirkung.

Das ist die große AGI-Wette von Google: Intelligenz entsteht nicht nur durch Text und Denken, sondern auch durch Modelle, die die Welt simulieren können.

SynthID: Wasserzeichen werden wichtiger

Google setzt bei KI-generierten Inhalten auf SynthID. Das ist eine Art Wasserzeichen für KI-Medien. Laut Dossier will sogar OpenAI Googles SynthID für bestimmte generierte Bilder unterstützen. Wenn jeder sehr schnell realistische Medien erstellen kann, wird die Frage wichtiger: Was ist echt? Was ist generiert? Was wurde bearbeitet?

SynthID löst dieses Problem nicht komplett. Aber es ist ein Baustein für Vertrauen. Ohne solche Systeme wird das Internet noch chaotischer.

Wenn das eigene Team das eigene Tool nicht benutzt

Der Codex-Ordner ist peinlich, keine Frage. Aber aus unserer Sicht ist er auch ehrlich. Unter Entwicklern gilt Googles Coding-Tool als zweitklassig. Cursor, ein unabhängiger KI-Code-Editor, hat Gemini 3.5 Flash in seinen eigenen internen Tests unter dem älteren Composer-Modell eingestuft, obwohl Gemini rund viermal teurer ist.

Verteilung schlägt Modellqualität

Und genau da liegt Googles eigentliche Wette. Microsoft hat in den 1990ern den Browserkrieg nicht gewonnen, weil Internet Explorer besser war als Netscape, sondern weil er einfach mit Windows ausgeliefert wurde. Google hat die Suche nicht durch überlegene Technik dominiert, sondern weil sie auf jedem Telefon, jedem Browser, jedem Betriebssystem vorinstalliert war. Dasselbe Playbook läuft gerade wieder ab. Wenn Gemini direkt in der Gmail-Oberfläche sitzt, die täglich 1,8 Milliarden Menschen öffnen, ist die Frage "Welches Modell ist besser?" für die meisten Nutzer schlicht irrelevant.

Vielleicht ist der ehrlichste Kommentar zu Google I/O 2026 nicht eine Keynote-Folie, sondern dieser eine, versehentlich sichtbare Ordner. Google muss bei der Modellqualität gar nicht gewinnen. Es muss nur dafür sorgen, dass seine Milliarden Nutzer nie einen Grund haben, nach einem anderen Ordner zu suchen.

Quellen: Google Blog, Antigravity, Gemini 3.5, Android XR & Eyewear

🛠 Trai it out:

Higgsfield Supercomputer

Das hat uns echt beeindruckt! Stell dir vor, du beschreibst ein Video mit einem Satz und ein Agent übernimmt den Rest: passende Musik, Schnitt, Bewegtbild, alles in einem Durchgang. Genau das ist der Ansatz von Higgsfield Supercomputer, einem KI-System das mehrere spezialisierte Modelle orchestriert (also koordiniert und zusammenspannt), um Videos bis zu 60 Minuten Länge zu erstellen. Für Reasoning greift es je nach Aufgabe auf Opus 4.7, GPT-5.5 Pro oder Gemini 3.1 Pro zurück, für die eigentliche Videogenerierung auf Seedance, Veo oder Kling. Was das von einfachen KI-Videogeneratoren unterscheidet, ist der Kontext, der sich über Sessions hinweg aufbaut: Das System merkt sich Stil, Ton und Struktur früherer Projekte und wendet das konsistent auf neue Aufgaben an. Für alle, die regelmäßig Motion-Design, Produktvideos oder Erklärfilme produzieren, lohnt sich ein genauer Blick, auch wenn noch offen ist, wie gut die Qualität bei längeren Formaten wirklich hält, was die Demo auf X jedenfalls eindrucksvoll aussehen lässt. Link

Tools kurz & knackig:

Claude for Microsoft 365 — Claude landet als Add-in direkt in Excel, PowerPoint und Word, sodass Kontext zwischen den Apps automatisch mitläuft, ohne alles neu erklären zu müssen.
Google Stitch — Googles neues Design-Tool verwandelt Text, Sprache oder Code per Prompt in App-Oberflächen, die sich in Echtzeit anpassen lassen.
Codex Appshots — Mit einem Tastenkürzel schickt OpenAIs Codex den vollständigen Kontext der aktuell geöffneten App an den Agenten, inklusive Inhalte, die gerade nicht auf dem Bildschirm sichtbar sind.
Google AI Studio — Baut jetzt native Android-Apps direkt aus Prompts und kann dabei auf Workspace-Daten zugreifen.
Antigravity — Googles neuer KI-Coding-Agent funktioniert ähnlich wie Codex oder Conductor, kommt aber ohne zwingend notwendige IDE-Installation aus.
Cursor Composer 2.5 — Cursors eigenes Coding-Modell, teilweise auf SpaceX-GPUs trainiert, soll laut internen Benchmarks mit Opus 4.7 und GPT-5.5 mithalten, zu einem günstigeren Preis.
Perplexity Premium Health Sources — Perplexity zieht für Medizinfragen jetzt aus denselben Fachjournalen und Datenbanken wie NEJM, BMJ und Micromedex, die auch Ärzteschaft und Forschende nutzen.

🍭🍬 Gemischte Tüte

📖 Must Reads:

Unsere Gemischte Tüte ist immer vollgepackt - in dieser Sektion kuratieren wir die aus unserer Sicht wichtigsten Links:

Andrej Karpathy wechselt zu Anthropic. Karpathy “the greatest Tinkerer alive”, KI-Forscher und Mitgrüner von OpenAI, schließt sich Anthropic an, um ein neues Team aufzubauen, das Claude zur Beschleunigung von Pretraining-Forschung nutzt. Das Team konzentriert sich auf rekursive Selbstverbesserung, einen Ansatz, bei dem KI-Systeme ihre eigene Weiterentwicklung aktiv unterstützen. Link

Simon Willison fasst sechs Monate LLM-Fortschritt zusammen. Simon Willison, Django-Mitschöpfer und einflussreicher KI-Blogger, hat einen Überblick über die LLM-Entwicklung seit November 2025 veröffentlicht. Sein zentrales Argument: November 2025 markiert einen Wendepunkt, an dem die Führung unter den Top-Modellen allein in diesem Zeitraum fünfmal zwischen den drei großen Anbietern wechselte. Link

🇪🇺 EU & Deutschland:

Europäische Kommission veröffentlicht Entwurf für High-Risk-AI-Regulierung. Link

👩‍💻 Tech-News:

Sehr spannend! Dashboard zur Verfolgung von KI-Engpässen. Was verhindert aktuell wirklich Fortschritt! Link
Dwarkesh Patel, Host eines einflussreichen KI-Podcasts, besichtigt Jane Streets Datenzentrum. Irre wie LLMs für Trading eingesetzt werden! Link
Trump plant zunächst eine Anordnung, die eine freiwillige Überprüfung von KI-Modellen durch die Regierung vorsieht. Später zieht er diese zurück, da sie seiner Meinung nach den Fortschritt bremst. Link
Kein Mist. Papst Leo XIV und Anthropic kooperieren nun und veröffentlichen eine Enzyklika zur menschlichen Würde im Zeitalter der KI. Link, Link
Peter Steinberger, OpenClaw-Gründer, verbraucht bei OpenAI 1,3 Millionen Dollar Token-Credits in 30 Tagen. Link
Greg Brockman übernimmt Product-Leadership bei OpenAI während CEO Fidji Simo wegen Krankheit ausscheidet. Link
OpenAI nähert sich offenbar IPO-Einreichung. Link
SpaceX verhandelt mit mehreren Unternehmen über KI-Compute-Dienste im großen Stil. Link
Sam Altman bietet Y-Combinator-Gründern 2 Millionen Dollar OpenAI-Token für Equity. Link
Siemens-Mitarbeitende berichten von beispiellosen Auftragsmengen für Energie-Hardware wegen KI-Boom. Link
NVIDIA-CEO Huang identifiziert neue 200-Milliarden-Dollar-Marktchance in KI-Agent-Prozessoren. Link
Anthropic-CFO wird im Wall Street Journal porträtiert vor großer Finanzierungsrunde. Link

💻 Agentic Engineering:

OpenAI veröffentlicht internes PDF über Codex-Einsatz bei Engineers für schnelleres Verständnis von Code. Link
Microsoft cancelt interne Claude Code-Lizenzen wegen Token-Kosten, pusht Developer zu Copilot CLI. Link

🔐 AI Safety & Governance:

Anthropic-Projekt Glasswing findet über 10.000 kritische Software-Sicherheitslücken in einem Monat. Link
Eine Mutter aus der Bay Area verlor Tausende Dollar, weil eine KI die Stimme ihrer Tochter imitierte und sie glauben ließ, dass diese entführt wurde. Link

🏥 Health & Science:

Google DeepMind stellt Co-Scientist vor, Multi-Agent-System das biomedizinische Hypothesen generiert und testet. Link
Robotic Beehives in Florida-Community reduzieren Bienenkolonie-Zusammenbruch um 70 Prozent. Link

🎨 Kreativ & Medien:

Spotify und Universal Music einigen sich auf Lizenzmodell für KI-generierte Fan-Covers und Remixe. Link

👷 Arbeitswelt:

Samsung-Chipfertiger erhalten durchschnittlich 340.000 Dollar Bonus im KI-Boom. Link
KI-Adoption nach Branche über Zeit hinweg im visuellen Überblick. Link
Amish-Gemeinden nutzen ChatGPT als praktisches Business-Tool ohne kulturelle Kompromisse. Link

🧂 Salty Memes:

— # (#)

Klicken für mehr Infos zu den Autoren

Du hast Fragen, Anmerkungen oder brauchst unsere Hilfe?
Schreib uns einfach an:
[email protected]

Bis zur nächsten Ausgabe!

🔍 Google I/O 2026: Alles, was Google gerade für die KI-Zukunft vorgestellt hat