- AI Peanuts
- Posts
- 🥇 OpenAI gewinnt Mathe-Olympiade-Gold!
🥇 OpenAI gewinnt Mathe-Olympiade-Gold!
Hallo Freunde!
Die Gerüchte um einen baldigen Release von GPT-5 laufen heiß, aber es gibt auch genügend News, die sich nicht nur auf Spekulationen stützen. Rein geht’s in die spannendsten Themen der letzten Tage:
Peanuts für heute:
🥇 Die Große Nuss: OpenAI gewinnt Mathe-Olympiade-Gold!
🛠️ Trai it Out: Ultrarealistisches Stimm-Klonen mit Hume
📊 Highlight: Meta weigert sich, den freiwilligen KI-Verhaltenskodex der EU zu unterschreiben
Heute wird die Ausgabe wieder durch einen Werbepartner unterstützt. 1440 Media ist ein englischsprachiger Newsletter, vielleicht ja auch was für dich! Schaut rein, ihr unterstützt damit unsere Arbeit - danke!
Looking for unbiased, fact-based news? Join 1440 today.
Join over 4 million Americans who start their day with 1440 – your daily digest for unbiased, fact-centric news. From politics to sports, we cover it all by analyzing over 100 sources. Our concise, 5-minute read lands in your inbox each morning at no cost. Experience news without the noise; let 1440 help you make up your own mind. Sign up now and invite your friends and family to be part of the informed.

🥜 Die größte Nuss:

🥇 OpenAI gewinnt Mathe-Olympiade-Gold!
Die Entwicklung von Künstlicher Intelligenz ist fest mit Wettbewerben und Spielen verankert. Das große Go-Match von DeepMind gegen Lee Sedol 2016, oder als OpenAI menschliche Spieler im Computerspiel Dota besiegen konnte. Dann war es der Turing Test, den es zu schlagen galt - nach und nach brechen diese Mauern.
Eine weitere ist nun gefallen: Künstliche Intelligenz hat Gold bei dem anspruchsvollsten Mathematikwettbewerb der Welt gewonnen.
Alle Augen sind dabei auf OpenAI gerichtet, obwohl sich hier etwas Forschungsdrama andeutet: Google DeepMind es wohl ebenfalls geschafft hat, hält sich aber an die sieben tägige Sperrfrist. OpenAI war einfach schneller im Announcement. Ein experimentelles KI-Modell des Unternehmens hat bei der International Math Olympiad (IMO) 2025 Gold gewonnen, und zwar unter exakt denselben Bedingungen wie die menschlichen Teilnehmer.
Das wirklich Bemerkenswerte? Das System löste fünf von sechs Problemen ohne Zugang zu Tools, Internet oder Programmiersprachen. Nur mit reinem Reasoning über Stunden hinweg. Während o1 sekunden- und Deep Research minutenlang nachdachte, verbringt dieses System mehrere Stunden mit einem einzigen Problem.
Was die IMO-Challenge so besonders macht
Die International Math Olympiad gilt als härtester Mathematik-Wettbewerb der Welt. Sechs Aufgaben, 4,5 Stunden pro Tag, nur Stift und Papier. Die Probleme sind sehr schwer, erfordern kreative Lösungsansätze und großen mathematische Eleganz.
OpenAI's Modell erreichte nun 35 von 42 Punkten – genug für Gold. Von 630 Teilnehmern schafften nur 67 diese Schwelle. Der entscheidende Unterschied zu bisherigen Benchmarks liegt im Zeithorizont: Während Grundschul-Mathe in 0,1 Minuten lösbar ist, benötigen IMO-Aufgaben oft 100 Minuten intensiver Denkarbeit.
Alexander Wei von OpenAI beschreibt es als Durchbruch in "general-purpose reinforcement learning and test-time compute scaling" – nicht als mathe-spezifisches System, sondern als allgemeines Reasoning-Modell.
Wie überraschend war dieser Fortschritt?
Sehr. Auf Prediction Markets wie Manifold (Plattformen, auf denen Nutzer Geld auf den Eintritt zukünftiger Ereignisse wetten), lag die Wahrscheinlichkeit wenige Stunden zuvor bei unter 25 Prozent. Das Ergebnis überrascht viele Experten.

Die berechtigte Kritik
Natürlich gibt es skeptische Stimmen. Gary Marcus bemängelt vor allem die fehlende Transparenz – OpenAI hat das Ergebnis präsentiert, aber wenig über die genaue Funktionsweise preisgegeben.
Die wichtigsten Kritikpunkte: Verallgemeinerbarkeit (funktioniert es auch bei nicht-mathematischen Problemen?), unklare Preprocessing-Schritte und astronomische Kosten bei stundenlanger Inferenz-Zeit.
Fields-Medaillen-Gewinner Terence Tao warnt zudem vor voreiligen Vergleichen, wenn die Testbedingungen nicht strikt kontrolliert sind. Ein CS-Student berichtete, dass die KI-Beweise schwer lesbar seien und stark von der Nachsicht der Bewerter abhingen.
Warum wir noch lange warten müssen
Das wichtigste Detail: Diese Technologie wird nicht in GPT-5 enthalten sein. OpenAI plant erst in mehreren Monaten eine Veröffentlichung mit vergleichbaren mathematischen Fähigkeiten.
Die Gründe sind offensichtlich: Stundenlange Inferenz-Zeit macht das System unpraktikabel für den Alltag. Die Kosten sind astronomisch. Das System wurde für mathematisches Reasoning optimiert – bei anderen Aufgaben könnte es schlechter abschneiden als heutige Modelle.
Für komplexe wissenschaftliche Beweise könnte das relevant werden – wenn die Kosten stimmen. Für den Alltag bleiben Ultra-Reasoning-Modelle noch Jahre entfernt. Der wahre Test wird sein, ob OpenAI diese Technologie kosteneffizient skalieren kann.

🛠️ Trai it out:
Headline
Die “empathischen” Sprachfähigkeiten von Hume haben wir bereits im April 2024 vorgestellt. Mittlerweile hat sich Hume zu einer vollen Toolsuite mit KI-Voice Fähigkeiten weiterentwickelt.
Es gibt Text-to-Speech, und auch Speech-to-Speech Fähigkeiten, um z.B. Voice Agents zu bauen.
Besonders beeindruckend sind bei Hume zwei Aspekte: Die KI-Stimmen wirken extrem realistisch, weil sie eine große Bandbreite an Stimmfarben- und Emotionen abdecken können. Und außerdem lässt sich die eigene Stimme mit Hume mit nur einer kurzen Sprachaufnahme sehr originalgetreu klonen. Das ist dann z.B. für jegliche Content-Erstellung nützlich.
2024: Voice Cloning
2025: What about personality cloning?Hume’s voice AI can now not only mimic your voice but also speaking style and language.
It’s now available via our TTS and new speech-to-speech model, EVI 3, which is also launching today.
— Hume AI (@hume_ai)
5:37 PM • Jul 17, 2025
Probiert’s mal aus! Hume lässt sich kostenfrei testen, noch mehr Features und Nutzung gibt’s in den Bezahl-Plänen schon ab $3 im Monat.
Zusammengefasst:
Spannende Demos:
OpenAI are testing a new model on the Web Dev Arena @lmarena_ai under the name 'Anonymous Chatbot 0717'. I can't believe I'm gonna say this, but it is genuinely at a completely different level of front end coding - far better than Sonnet, o3, Gemini 2.5 Pro, or Grok 4.
To test
— Peter Gostev (@petergostev)
9:14 PM • Jul 18, 2025
Tools kurz & knackig:
Decart — Live Stream Video Diffusion Model
AI 3D Bust Maker — Vom einzelnen Foto zum 3D-Druck Modell dank AI
Levio — KI-gestütztes Video Editing

🍭🍬 Gemischte Tüte
📖 Must Reads:
Unsere Gemischte Tüte ist immer vollgepackt - in dieser neuen Sektion kuratieren wir zukünftig die aus unserer Sicht wichtigsten 3 Links:
Meta weigert sich, den freiwilligen KI-Verhaltenskodex der EU zu unterschreiben – das sei eine Innovationsbremse. Der Konzern unterstützt zwar grundsätzlich den AI Act, lehnt aber die zusätzlichen Vorgaben des freiwilligen „Code of Practice“ ab. Diese seien zu restriktiv und könnten das Wachstum behindern. Die Entscheidung zeigt einmal mehr die wachsenden Spannungen zwischen Big Tech und europäischen Regulierern, wenn es um die Governance von KI geht. Link
Ein Entwickler rechnet vor, warum KI-Agenten noch lange nicht produktiv einsetzbar sind: Fehler addieren sich exponentiell. Bei 95 % Erfolgsrate pro Schritt liegt die Gesamterfolgswahrscheinlichkeit über 20 Schritte hinweg nur noch bei 36 %. Für den Produktionseinsatz braucht es aber 99,9 %+. Zudem verursachen lange Kontextfenster quadratische Tokenkosten – längere Gespräche werden schnell untragbar teuer. Fazit: Das Problem ist nicht die KI, sondern das Design brauchbarer Agentenwerkzeuge. Link
Forschende von OpenAI, DeepMind, Anthropic und Meta schlagen gemeinsam Alarm: Wenn wir nicht schnell handeln, verlieren wir das Verständnis dafür, wie KI-Modelle „denken“. Über 40 Autoren warnen, dass sich das Fenster zur Überwachung von KI-Schlussfolgerungen bald für immer schließen könnte. Link
🇪🇺 EU-News:
Mistral launcht Devstral, eine neue Open-Source-Familie von KI-Modellen speziell für Software-Agents. Link
Jedes große Modell überschreitet bereits jetzt oder wird bald das EU-Systemrisiko-FLOP-Limit überschreiten, wenn es im nächsten Jahr in Kraft tritt.
Großbritannien nimmt neuen KI-Supercomputer „Isambard-AI“ in Betrieb – er soll unter anderem kranke Kühe und Hautkrebs erkennen. Der Rechner steht in Bristol und ist Teil der nationalen KI-Infrastrukturstrategie. Link
👩💻 Tech-News:
Google rüstet Gemini-Pro-Modell weiter auf: Mit „Deep Think“ soll die nächste Version deutlich smarter werden – plant, exploriert und führt Aufgaben autonom aus („Agent Mode“). Personalisiertes „Bespoke“-Feature und Lernmodus für Schüler sind auch in Arbeit. Außerdem neu: Ein Bild-zu-Video-Tool, drei neue KI-Funktionen im Firebase-IDE und ein Memory-Modul für dauerhaftes KI-Gedächtnis. Link
Detaillierte Liste aller 44 Personen im Superintelligenz-Team von Meta. Die Hälfte ist aus China, eine Person aus Deutschland. Jede dieser Personen erhält wahrscheinlich $10-$100M/Jahr. Link
ChatGPT-5 soll laut Gerüchten am 31. Juli kommen – OpenAI schweigt, nachdem sie gerade erst ihr Open-Source-Modell „open o1“ verschoben haben. Bleibt spannend, was zuerst erscheint. Link
Das israelische Ökosystem rund um generative KI boomt: Über 20 Milliarden Dollar sind laut neuem Bericht bereits in israelische GenAI-Startups geflossen. Link
Anthropic könnte bald mit über 100 Milliarden bewertet werden – laut Bericht läuft der Verkauf der Claude-Modelle direkt an Endnutzer schon mit über 70 % Bruttomarge. Link
Perplexity Pro ist jetzt für alle 360 Millionen Airtel-Kund:innen in Indien kostenlos verfügbar – direkt durch eine neue Partnerschaft. Perplexity ist daraufhin zur Nummer 1 App in Indien gestiegen. Link
xAI sucht jetzt offiziell Entwickler, um Charaktere als digitale "Liebespartner" für X (Twitter) zu bauen – darunter Persönlichkeiten wie ein virtueller Edward Cullen. Link
Google investiert über 25 Mrd. $ in neue Datenzentren in Pennsylvania und Umgebung – ein Großteil davon fließt in KI-Infrastruktur. Link
Google ergänzt das Notiz-Tool NotebookLM um neue “Featured Notebooks” inklusive Expertenwissen für bestimmte Themen. Praktisch für komplexe Recherchen. Link
Claude Sonnet 4 liegt im neuesten Finanz-Benchmark mit 44,5 % Genauigkeit leicht vor OpenAI's o3. Die meisten anderen Modelle schafften nicht mal 30 %. Link
OpenAI wird Google Cloud für ChatGPT nutzen. Link
🇨🇳 China & AI Race:
Nvidia will den KI-Chip H20 wieder nach China liefern. Grund: Die US-Regierung gibt offenbar grünes Licht. Auch AMD zieht nach. Link
Trump will die USA zur KI-Supermacht machen. Auf einem Gipfel in Pittsburgh kündigt er 92 Mrd. $ an Investitionen in KI und Energie an. Link
Alibaba bringt seine Qwen-Modelle als Desktop-App raus – inklusive lokalem Zugang zu einem leistungsstarken Chatbot. Link
👷 Work & Education:
Saudi-Arabien will 1 Million Bürger:innen in KI schulen – als Teil einer nationalen Digitaloffensive. Link
🆕 Neue Anwendungsfelder:
Anthropic statt Bloomberg: Claude bekommt ein großes Update für die Finanzwelt – mit Anbindung an Marktdaten (z.B. S&P), internen Firmendaten (z.B. Snowflake) und vorgefertigten Tools für Analysen, Trading-Modelle und Monte-Carlo-Simulationen. Link
MIT entwickelt ein KI-Modell zur Vorhersage langfristiger Effekte von Atommüll in unterirdischen Endlagern. Der Ansatz kombiniert geologische Daten mit physikalisch-chemischen Wechselwirkungen und soll Entsorgungsstrategien sicherer machen. Link
MIT stellt „Smart Coach“ vor – ein System, das Sprachmodelle gezielt beim Wechsel zwischen Code und Text trainiert. Die Methode verbessert Prompting-Effizienz und bringt LLMs neue Fähigkeiten bei, ähnlich einem personalisierten Tutor. Link
KI hilft Patienten, sich gegen Ablehnungen ihrer Krankenversicherungen zu wehren – durch automatisierte Dokumentation, Widerspruchsschreiben und Nachweise. Link
DuckDuckGo führt neue Funktion ein, mit der Nutzer KI-generierte Bilder aus den Suchergebnissen ausblenden können. Link
🔐 AI Safety:
Eine entdeckte Sicherheitslücke in ChatGPT erlaubte es, fremde Chat-Verläufe einzusehen. Laut Forschern war die Lücke monatelang offen, OpenAI reagierte erst nach 45 Tagen. Link
Ethan Mollick warnt: KI neigt dazu, deinem Input zu sehr zuzustimmen – sogar bei falschen Infos. Sein Prompt-Hack dagegen: Bitte GPT, deine Frage neutral neu zu formulieren, ganz wie ein Wissenschaftler bei einer Hypothese. Link
🖼️ Kreativindustrie:

🧂 Salty Memes:
Vibe Coders will understand:


Du hast Fragen, Anmerkungen oder brauchst unsere Hilfe?
Schreib uns einfach an:
[email protected]
Willkommen!
Hat dir das ein Freund oder eine Kollegin geschickt? Melde dich an und erhalte 2x Woche deine eigene Ausgabe mit den wichtigsten KI News direkt in dein Postfach.
Hilf uns dabei, besser zu werden! Was war schlecht? Was war gut? Wie fandest Du diese Ausgabe von AI Peanuts? |
Login oder Abonnieren um an umfragen teilzunehmen. |

Bis Freitag!