• AI Peanuts
  • Posts
  • Das beste Modell kommt von Google! Wie sie sich an die Spitze kämpften

Das beste Modell kommt von Google! Wie sie sich an die Spitze kämpften

„Es gibt Jahrzehnte, in denen nichts passiert; und es gibt Wochen, in denen Jahrzehnte passieren“, soll Lenin gesagt haben. Seit zwei Jahren sind selbst die ruhigen Wochen in der KI-Industrie immer noch spannend. Aber hier ist eine der ganz großen Wochen. OpenAI bringt ein unfassbar gutes Bildmodell heraus, nachdem sich monatelang alle über DALL-E lustig gemacht haben. Twitter ist geflutet mit Studio Ghibli Adaptionen!
Und dann veröffentlicht Google nach monatelangem Anschlusskampf das beste Sprachmodell aller Zeiten (bis jetzt). Es gibt also einiges zu erzählen!

Peanuts für heute:

  • 🚀 Das beste Modell kommt von Google! Wie sie sich an die Spitze kämpften

  • 🗣️ Gerüchte um Anthropic: Eine neue Claude-Version

  • 🛠️ Gleich zwei neue Top KI-Bildmodelle selber testen

Anzeige

KI im Unternehmen: Schluss mit Schatten-KI, Sicherheit geht vor!

Hast du dich schon einmal gefragt, wie du Künstliche Intelligenz sicher in deinem Unternehmen einsetzen kannst? Die rasante Entwicklung von KI-Technologien bringt nicht nur technische, sondern auch wichtige Datenschutz- und Sicherheitsfragen mit sich.

Ein oft unterschätztes Risiko: Was passiert mit den Informationen, die Mitarbeitende in KI-Tools eingeben, die privat “organisiert” wurden? Viele Anbieter nutzen diese Daten möglicherweise für das Training ihrer KI-Modelle – und das könnte sensible Firmeninformationen gefährden.

Doch es gibt Lösungen: Plattformen wie ChatGPT bieten in ihren Einstellungen die Möglichkeit, der Nutzung dieser Daten zu widersprechen.

Welche Datenschutzbestimmungen beim Einsatz von KI-Tools besonders relevant sind und worauf Unternehmen achten sollten, erfährst du ausführlich im Modul „Datenschutz & KI“ von unserem Partner Herdt. Dieses Modul ist für Unternehmen jeder Größe von Bedeutung. Wenn das für dich interessant klingt - schau doch mal rein:

🥜 Die größte Nuss:

🚀 Das beste Modell kommt von Google! Wie sie sich an die Spitze kämpften

Vor wenigen Tagen stellte Google überraschend sein neues KI-Modell Gemini 2.5 Pro vor – und das mitten in einem regelrechten KI-Launch-Festival: Parallel gingen nämlich auch GPT-4o mit Bildgenerierung (Siehe Tools!) und DeepSeek V3 an den Start. Aber ausgerechnet Google, das in den letzten zwei Jahren immer wieder mit Rückschlägen kämpfte, hat sich nun plötzlich wieder ganz vorne platziert.

Wie genau ist das passiert? Und warum ist Googles Sprung zurück an die Spitze eine ziemliche Überraschung?

Von der Spitze in die Krise und zurück

Google ist eigentlich kein KI-Neuling – ganz im Gegenteil - GenAI haben sie quasi erfunden. Vor sechs Jahren erfanden sie die heute allgegenwärtige Transformer-Technologie, die das „T“ in GPT (ja genau, ChatGPT) stellt. Doch als OpenAI 2022 mit ChatGPT plötzlich viral ging, wurde Google kalt erwischt. Über Nacht schaltete das Unternehmen auf Alarmstufe Rot und seitdem herrscht bei Google eine fast panische Aufholjagd. Man fusionierte Teams, machte Nachtschichten zur Norm und strich lästige Sicherheits-Checks zugunsten schneller Ergebnisse. Resultat: Gemini – Googles erster ernstzunehmender Angriff auf ChatGPT.

Gemini 2.5 Pro – ein neuer Benchmark-König?

Jetzt, wenige Monate nach dem Release von Gemini 2.0, folgt Gemini 2.5 Pro. Und das Modell lässt aufhorchen: In vielen Benchmarks katapultiert es sich direkt an die Spitze.

Beispielsweise in dem extrem anspruchsvollen (und kuriosen) Test „Humanity’s Last Exam“ – einer wilden Mischung aus Schmetterlings-Physiologie, lateinischen Texten und abstrusen Mathe-Problemen. Hier erreicht Gemini 2.5 Pro satte 18,8 % (klingt wenig, ist aber ein Rekord). Beeindruckend dabei: Das Ganze passiert ohne Tricks wie Internet-Recherche oder aufwändige Mehrfachabstimmungen, die Google gerne als „teure Spielereien“ verspottet.

Auch bei wirklich komplexen Wissenschaftsfragen bewegt sich Gemini 2.5 Pro mittlerweile auf Augenhöhe mit Anthropic’s Claude 3.7 Sonnet. Zwar fehlen noch die Zahlen des neuen o3-Modells von OpenAI, doch Google hat den Abstand zu den Top-Performern deutlich verringert – und gibt sich selbstbewusst.

Wenn man sich die Prediction Markets anschaut, sieht man, dass wirklich niemand damit gerechnet hat, dass ausgerechnet Google das beste Modell stellen würde.

Was ist Googles Geheimrezept?

Hier wird’s interessant: Während viele Konkurrenten wie DeepSeek ganz offen kommunizieren, wie ihre Modelle funktionieren, hält sich Google diesmal zurück. Die „Geheimzutat“ hinter Gemini 2.5 Pro bleibt unter Verschluss.

Das heizt natürlich Spekulationen an. Womöglich steckt dahinter aber schlicht eine Menge Geld, Compute-Power und schweißtreibende Nachtschichten – oder wie Microsoft-Chef Satya Nadella es kürzlich ausdrückte: KI wird zunehmend zum Commodity-Produkt, bei dem „mehr Intelligenz“ einfach gekauft werden kann. Und Labs wie OpenAI seien im Grunde „nur Produktfirmen“ ohne echten Vorsprung in Richtung AGI („Allgemeine Künstliche Intelligenz“).

Egal, ob Claude, Gemini oder DeepSeek – bei gleichem Compute-Level liefern inzwischen fast alle Modelle ähnliche Resultate. Gemini 2.5 Pro ist hier keine Ausnahme, zeigt aber, wie schnell man aufholen kann, wenn man das nötige Kleingeld und den entsprechenden Ehrgeiz hat.

Lange Texte, komplexe Tabellen & „fast menschliche“ Fähigkeiten

Ein paar Highlights hebt Google dann aber doch hervor:

  • Extremer Langkontext: Gemini 2.5 Pro kann jetzt schon Texte von bis zu einer Million Tokens verarbeiten und das wird bald auf zwei Millionen Token hochgestuft. Schon der jetzige Wert entspricht grob 750.000 Wörtern – genug, um ein ganzes Buch oder tagelange Videoaufnahmen am Stück zu analysieren.

  • Spitzenwerte im Vista-Benchmark: Gemini schafft es erstmals, Bilder und Diagramme fast so gut wie Menschen auszuwerten – ein echtes Novum.

  • Coding-Power: Im Benchmark „SWE-Bench Verified“ kommt Gemini 2.5 Pro auf starke 63,8 %, perfekt für komplexe Coding-Aufgaben oder sogar ganze Videospiele.

Die Frage ist: Bleibt Google dort oben, oder folgt schon bald der nächste große Durchbruch von OpenAI, DeepSeek, Anthropic & Co.? Kurze Antwort: Ja! Ganz sicher!

🛠️ Trai it out:

Teste die neuesten Hype Bildmodelle

Wenn schon zwei neue KI-Bildmodelle der Hype der Woche sind, dann widmen wir ihnen in dieser Ausgabe auch einmal die gesamte Tool Section.

Neben ChatGPT-4o’s neuester nativer Bildfunktion hat ein bisher noch recht unbekanntes Startup aus Kalifornien namens Reve sein Modell vorgestellt, das ähnlich wie 4o auch extrem gut mit Text umgehen kann, dabei gleichzeitig aber noch ein bisschen besser in photorealistischen Ergebnissen ist.

Die neue Bildfunktion in ChatGPT lässt sich aktuell nur mit Pro Subscription nutzen, Reve bietet aber auch ohne zu bezahlen, ein großzügiges Credit-Kontingent.

Beide Modelle erzeugen unfassbar gute Ergebnisse. Ob sie wirklich gut genug sind, um ohne Nachbearbeitung “produktiv” eingesetzt zu werden - z.B. in Ads oder im Marketing, das muss jeder für seinen Case selbst entscheiden, unsere Einschätzung: Noch nicht ganz, aber als Grundlage für einen menschlichen Editor oder für’s kreative Brainstorming sind die Tools unfassbar wertvoll.

Besonders viel Spaß macht es, den Modellen ein Bild als Grundlage mit in den Prompt zu geben. So fügt man sich mal eben in ein bekanntes Meme ein, erzeugt ein Ad-Creative mit einer berühmten Anzeige als Vorlage oder gestaltet mal eben sein Wohnzimmer um.

Das beste Gespür dafür, was man mit den Tools alles umsetzen kann, bekommt man, indem man es selbst ausprobiert. Als Grundlage dafür kommen hier einige Ideen und Beispiele:

Youtube Thumbnails (erstellt mit 4o):

Familien-Fotos im Studio Ghibli Style (erstellt mit 4o):

Mockup-Vorlagen (erstellt mit 4o):

Text-Bild Kombinationen (erstellt mit Reve):

Comic Strips (erstellt mit 4o):

Social Media Ads/Posts (erstellt mit Reve):

Und natürlich unzählige weitere Ideen:

  • Custom Icon Sets

  • Sticker-Vorlagen

  • Product-Mockups (z.B. T-Shirt Designs)

  • Stock-Image Ersatz

  • Hintergrundbilder für Powerpoint Präsentationen

  • Memes mit eigenen Bildern

  • UI/UX Konzept-Mockups

  • Individuelle Kunst

  • Persönliche Kinderbuch-Illustrationen

  • Raumgestaltung/Innendesign Konzepte testen

Wir sind gespannt, was ihr alles gestaltet! Teilt eure kreativsten Ergebnisse gerne mit uns an [email protected]

🍭🍬 Gemischte Tüte

🇪🇺 EU-News:

  • Microsoft hat alle geplanten neuen Rechenzentren in den USA und Europa gestrichen. Link

  • Europäische Unternehmen und Behörden erwägen, ihre Cloud-Services von US-Anbietern wie Amazon, Microsoft und Google auf europäische Alternativen umzustellen – aus Sorge vor Datenschutzproblemen unter der Trump-Regierung. Link

👩‍💻 Tech-News:

  • Gerüchte um Anthropic: Eine neue Claude-Version mit 500.000 Token Kontextfenster steht offenbar kurz vor dem Release. Link

  • OpenAI will wohl erstmals ein eigenes Rechenzentrum für Speicherinfrastruktur bauen. Link

  • Nvidia steht kurz vor dem Kauf eines großen GPU-Resellers – für mehrere Hundert Millionen Dollar. Link

  • Chinas DeepSeek veröffentlicht ein Upgrade seines KI-Modells – mitten im Wettbewerb mit OpenAI. Link

  • Bei der „Super Bowl“ der KI-Unternehmen gibt Nvidia den Ton an – mit einer Vision, in der Roboter eine zentrale Rolle spielen. Link

  • Alibaba bringt ein neues Open-Source-Modell auf den Markt, das speziell für kostengünstige KI-Agenten entwickelt wurde. Link

  • OpenAIs viel beachteter Deal mit Apple? Finanziell bringt er dem KI-Unternehmen wohl erstmal gar nichts – Apple zahlt nicht. Link

  • China plant im April einen Roboter-Halbmarathon mit 23 teilnehmenden Unternehmen. Vielleicht der erste Schritt hin zu echten Roboter-Olympischen Spielen? Link 

  • Apple räumt bei der KI-Führung auf. Mike Rockwell, der Mann hinter der Vision Pro, übernimmt jetzt Siri – ein klares Zeichen, dass Apple seine Assistenz-KI dringend verbessern muss. Link 

  • Sam Altman hat neue Führungsposten bei OpenAI bekannt gegeben. Mark Chen wird Chief Research Officer, und Brad Lightcap erweitert seinen Verantwortungsbereich als COO. Link 

  • Perplexity erweitert seine Suchergebnisse mit neuen Antwort-Modi – inklusive Bildern, Videos und direkten Kaufoptionen in den Suchkarten. Link 

  • Alibaba präsentiert LHM, ein KI-Modell, das aus einem einzelnen Bild animierte 3D-Avatare erstellt. Link 

  • Google rollt die „Project Astra“-Features für Gemini aus – mit Live-Video, erweitertem Screen-Reading und verbesserten Vision-Fähigkeiten. Link 

  • Ant Group kombiniert bei KI-Entwicklung jetzt Chips aus den USA und China – und spart dadurch angeblich 20 % der Kosten. Link 

  • Das ARC Prize-Team startet den neuen KI-Reasoning-Benchmark ARC-AGI-2 – und legt direkt ein Preisgeld von 1 Million Dollar für das beste Modell obendrauf. Der neue Test soll KI-Systeme auf menschlich-intuitive Problemstellungen prüfen. Zum Vergleich: OpenAIs o3-low schneidet mit gerade mal geschätzten 4 % ab – Menschen erreichen locker 75 %. Link 

  • Ant, ein Unternehmen aus dem Alibaba-Kosmos, kombiniert chinesische und US-Chips, um die KI-Entwicklungskosten massiv zu senken. Link

  • OpenAI bringt drei neue Sprachmodelle: gpt-4o-transcribe für präzise Transkriptionen, gpt-4o-mini-transcribe und gpt-4o-mini-tts für anpassbare Sprachsynthese. Sie versprechen eine geringe Fehlerquote (2,46 %) und unterstützen 100+ Sprachen, aber keine Sprechererkennung. Der Preis: 6 $ pro Million Audiotoken – Konkurrenz für ElevenLabs und Hume AI. Link 

  • Anthropic will eine Sprachfunktion für Claude einführen und sich stärker auf KI-gestützte Unternehmenslösungen konzentrieren. Geplant sind unter anderem Features zur Meeting-Analyse und Partner-Integrationen mit Amazon und ElevenLabs für schnellere Sprach-KI-Entwicklung. Link 

  • MIT entwickelt künstliche Muskeln für weiche Roboter, die sich wie eine menschliche Iris zusammenziehen und dehnen können. Link

👷 Work & Future of Work:

  • Bill Gates glaubt, dass KI in weniger als zehn Jahren viele Ärzte und Lehrer überflüssig machen wird – seiner Meinung nach werden Menschen dann „für die meisten Dinge“ nicht mehr gebraucht. Link

  • Otter AI bringt drei spezialisierte KI-Meeting-Assistenten heraus, darunter einen sprachgesteuerten Agenten für Meetings, einen Sales-Agenten mit Echtzeit-Coaching und einen SDR-Agenten für automatisierte Produktdemos. Link 

  • Adobe setzt voll auf KI-Agenten für Unternehmen: Die neue Experience Platform Agent Orchestrator integriert zehn spezialisierte KI-Agenten für Marketing- und Kundenmanagement-Aufgaben. Link 

🆕 Neue Anwendungsfelder:

  • Meta hat eine Benutzeroberfläche entwickelt, die anhand von Gehirnaktivitäten erkennt, was jemand tippen möchte. Die Technologie könnte langfristig für Menschen mit körperlichen Einschränkungen revolutionär sein. Link 

  • Earth AI findet mithilfe seiner Algorithmen kritische Rohstoffe an Orten, die alle anderen übersehen haben. Link

🔐 Cybersecurity & AI Safety:

  • Kim Jong Un inspiziert eine neue Generation größerer Spionagedrohnen – inklusive „KI-Selbstmorddrohnen“. Link

  • Ein US-Richter lässt eine Klage wegen Urheberrechtsverletzung gegen OpenAI zu – die erste große Copyright-Klage könnte nun vor Gericht landen. Link

  • Character.ai führt ein neues Feature ein, mit dem Eltern sehen können, mit welchen Bots ihre Kinder interagieren. Link

🏥 Health & Education:

  • KI findet Krebs mit 99 % Genauigkeit – Das neue Modell ECgMLP erkennt Gebärmutterkrebs auf mikroskopischen Gewebebildern mit 99,26 % Trefferquote. Zum Vergleich: Menschliche Experten liegen nur bei 78-81 %. Auch bei anderen Krebsarten wie Darmkrebs (98,57 %), Brustkrebs (98,20 %) und Mundkrebs (97,34 %) erzielt es beeindruckende Ergebnisse. Link 

  • Netflix-Mitgründer Reed Hastings spendet 50 Millionen Dollar an seine ehemalige Uni – mit dem Ziel, eine Forschungsinitiative zum Einfluss von KI auf die Menschheit aufzubauen. Link 

🖼️ Kreativindustrie:

  • Synthesia startet ein 1-Million-Dollar-Programm für Schauspieler, die ihre Gesichter als KI-Avatare freigeben. Link 

  • Stability AI bringt "Stable Virtual Camera" heraus, ein neues Modell zur Erstellung von 3D-Videos aus Einzelbildern mit dynamischen Kamerabewegungen. Link 

AI Peanuts Workbook

Vollgepackt mit KI-Wissen, Tools & Tutorials!

Du hast angefangen, dich tiefer mit dem Thema KI zu beschäftigen und willst den nächsten Schritt machen? Dann ist unser offizielles AI Peanuts Workbook genau das Richtige für dich!

Das Workbook ist kein klassisches “Buch”, sondern ein praxisorientiertes, interaktives digitales Dokument. Gegliedert in 3 Teile:

Theorie — Der Textbuch-Teil des Workbooks, in dem wir das Thema KI und seine technischen Grundlagen erklären.
Praxis — Eine Reihe von praktischen Tutorials, mit denen du lernst, KI praktisch anzuwenden (z.B.: ChatGPT Masterprompts, HeyGen, NotebookLM, Midjourney…)
Daten  Datenbanken mit den besten KI-Tools und den spannendsten Firmen im KI-Umfeld.

🧂 Salty Memes:

Du hast Fragen, Anmerkungen oder brauchst unsere Hilfe?
Schreib uns einfach an:
[email protected]

Willkommen!

Hat dir das ein Freund oder eine Kollegin geschickt? Melde dich an und erhalte 2x Woche deine eigene Ausgabe mit den wichtigsten KI News direkt in dein Postfach.

Hilf uns dabei, besser zu werden! Was war schlecht? Was war gut? Wie fandest Du diese Ausgabe von AI Peanuts?

Login oder Abonnieren um an umfragen teilzunehmen.

Bis Dienstag!