Dies ist höchstwahrscheinlich das letzte Mal, dass das passiert. Beim AtCoder World Tour Finals - einem sehr harten Coder-Wettbewerb - belegte der menschliche Programmierer Psyho den ersten Platz und übertraf damit den KI-Beitrag von OpenAI (OpenAIAHC). Daher hat „die Menschheit gesiegt.“ Sam Altman gratulierte ihm auf Twitter, und so macht das auch AI Peanuts. Let’s Go, Menschen!

Peanuts für heute:

  • 🧠 Die Große Nuss: Neuer OpenAI Release: Endlich ein echter Agent

  • 🛠️ Trai it Out: OpenAI’s “geheimes” Bild-Editing Tool

  • 📊 Highlight: Nvidia verkauft wieder nach China & xAI macht KI-Girlfriends

🥜 Die größte Nuss:

🚀 Neuer OpenAI Release: Endlich ein echter Agent

Gestern Abend hat OpenAI sein neuestes Produkt vorgestellt, und treue Leser wissen, dass OpenAI wirklich schlecht darin ist, Produkte anständig zu benennen (ChatGPT-o4-mini-high, anyone?). Deswegen haben sie sich diesmal für etwas komplett Generisches entschieden. Wir stellen vor: ChatGPT Agent.

Eigentlich hat OpenAI mit "Operator" bereits ein Produkt im Rennen, das sich selbstständig durch Websites klicken und einfache Aufgaben übernehmen konnte. Allerdings war Operator ausschließlich für ChatGPT-Pro-User (ca. 200 Euro im Monat) verfügbar und… naja, insgesamt ziemlich ernüchternd in der Praxis. Unsere Tests damals brachten eher wenig Beeindruckendes zu Tage.

ChatGPT Agent ist nun aber die sinnvolle Fusion zwei bestehender Tools: Dem gerade erwähnten Operator, der gut darin war, Websites interaktiv zu nutzen, und Deep Research, das aus unterschiedlichsten Quellen tatsächlich hochwertige Berichte generieren konnte und ein Feature, dass wir wirklich häufig benutzen.

Was genau kann der neue Agent?
Ein paar konkrete Beispiele zeigen deutlich, wohin die Reise geht:

  • „Analysiere drei Wettbewerber und erstelle daraus eine Präsentation.“

  • „Schau in meinen Kalender und bereite mich auf kommende Kundentermine anhand aktueller News vor.“

  • „Plane und kaufe Zutaten für ein japanisches Frühstück für vier Personen.“

Leider nimmt OpenAI im Announcement Video wieder seltsame Beispiele (“Such mir ein Outfit für eine Hochzeit heraus”) anstatt auf nervige Tätigkeiten des Alltags zu setzen (“Such die Belege für meine Steuererklärung heraus”). Aber gut. 

Das alles läuft über einen eigenen virtuellen Computer, auf dem der Agent flexibel zwischen Browser, eigenem Terminal und APIs wechseln kann. Außerdem nutzt er die „Connectors“ von ChatGPT, über die man Zugriff auf Gmail, Dropbox oder GitHub geben kann. Der Agent führt Aufgaben eigenständig durch, ohne dass man ständig zusehen muss, man kann ihn laufen lassen und später die Ergebnisse abrufen.

Interessanterweise erzielt der ChatGPT Agent auf verschiedensten Benchmarks deutlich bessere Ergebnisse als das aktuell stärkste OpenAI Modell - o3-, obwohl es kein neues Sprachmodell ist. Die Fähigkeit, verschiedene Tools in Kombination zu nutzen macht es einfach insgesamt zu einem stärkeren Modell

Wie auch Operator, lässt sich Agent jederzeit unterbrechen, man kann selbst die Kontrolle übernehmen oder ihm sensible Informationen wie Login-Daten und Kreditkarteninfos geben. Das macht das Tool enorm flexibel, birgt aber gleichzeitig erhebliche Risiken.

Die Risiken hinter der Flexibilität

Je mehr sensible Daten der Agent erhält, desto nützlicher – aber eben auch riskanter – wird die Nutzung. Besonders kritisch könnten sogenannte Prompt-Injection-Angriffe sein, bei denen manipulierte Websites oder z.B. E-Mails versuchen, sensible Daten wie Passwörter oder Kreditkarteninformationen abzugreifen. OpenAI ist sich dieser Gefahr bewusst und hat diverse Sicherheitsmechanismen eingebaut. Das wird ab nun ein ganz schönes Katz und Maus Spiel. 

Einen großen Haken hat die Sache aber noch: Tief im Pressetext findet man den Hinweis, dass OpenAI an einem Release in der EU und der Schweiz arbeitet. Wir sind also leider wieder als letztes in dran. (VPN oder die Zeit regeln) 

Link zum Blog

🛠 Trai it out:

OpenAI’s “geheimes” Bild-Editing Tool

Spätestens durch den Studio Ghibli Trend wurde ChatGPT zum ernstzunehmenden KI-Bild Tool. Doch was viele nicht wissen, neben der Möglichkeit, in ChatGPT Bilder zu erstellen, kann man auch die OpenAI Platform Sora nutzen, die ursprünglich mal nur für die Video-Erstellung gedacht war.

Das Sora Interface bietet deutlich mehr Einstellungsmöglichkeiten, eine Media-Library und einen Explore-Feed mit Inspiration:

Und für alle, die dann noch einen Schritt weiter gehen wollen, um Zugang zu noch mehr Features zu bekommen:

Seit dieser Woche bietet die OpenAI ein neues Profi Feature, dass besonders für das KI-gestützte Bearbeiten von Bildern relevant ist: High Input Fidelity. Das bedeutet, dass ChatGPT die Bilder, die man als Input reingibt in deutlich höherer Qualität “versteht”, und somit Edits deutlich näher am Original macht.

Wenn man vorher ein Bild einer Person hochgeladen hat und darum gebeten hat, ein Detail des Outfits zu verändern, kam es häufig vor, dass ChatGPT auch das generelle Aussehen stark veränderte oder den Hintergrund ungefragt anpasste.

Mit der High Input Fidelity Einstellung sind Bearbeitungen jetzt deutlich näher am Original.

Aber: Wer jetzt dachte das Feature gibt es einfach in ChatGPT oder Sora, der hat die kompliziert Produktstrategie (oder das Fehlen einer solchen) von OpenAI nicht auf dem Schirm. Denn das Feature gibt es nur per API - doch jetzt kommt das zweite Aber: Für die API gibt es ein etwas verstecktes Frontend - und als kleine AI Peanuts Service Leistung zeigen wir euch, wie ihr dort hinkommt:

  1. Wenn ihr einen neuen Account habt, klickt oben rechts auf den grünen Knopf “Start Building” und füllt das Formular aus.

    1. Die API Key Erstellung könnt ihr einfach ignorieren

    2. Um die API zu nutzen, muss man Credits kaufen und/oder eine Zahlungsmethode hinterlegen. $5 sind für den Start locker ausreichend!

  2. Jetzt habt ihr Zugang zum API Playground und spezifisch zum Images Playground

  3. Klickt auf das “Einstellungs”-Symbol, dann auf Advanced und dann seht ihr folgendes Menü, in dem ihr u.a. die Input Fidelity auf High stellen könnt.

Eine Demo und Erklärung zum Feature gibt’s auch hier von OpenAI selbst:

Spannende Demos:

Die Power von schneller Inferenz + Open Source:

Tools kurz & knackig:

  • ChatGPT Record Mode — Meeting Transcriptions direkt in ChatGPT - jetzt auch in Europa für zahlende Nutzer verfügbar

  • Adobe Firefly — Mit vielen neuen Funktionen, u.a. rund um realistische Audioeffekte

  • Suno 4.5+ — Neue Version des beliebten KI-Musik Tools

  • Claude Desktop Extensions — Neue Art Tools mit One-Click an Claude anzubinden

  • Asimov — Agent, der auf das Verstehen von großen Code-Repos spezialisiert ist

🍭🍬 Gemischte Tüte

📖 Must Reads:

Unsere Gemischte Tüte ist immer vollgepackt - in dieser neuen Sektion kuratieren wir zukünftig die aus unserer Sicht wichtigsten 3 Links:

Nvidia kann wieder einzelne Chiptypen nach China verkaufen. Die Wiederaufnahme der GPU-Lieferungen nach China hängt mit Verhandlungen über Seltene Erden zusammen. Jensen Huang reiste nun nach Peking und spricht öffentlich über den „Tech-Stack als neue Weltreservewährung“. Link

xAI bietet jetzt KI-Freundinnen an, sogenannte Waifus. Gleichzeitig verspricht xAI: Grok wird künftig nicht mehr Hitler zitieren oder sich auf Elon Musks Meinung stützen – wie verrückt ist es, dass das eine echte Schlagzeile ist? Nach öffentlicher Kritik wurde das Modell umprogrammiert, und auch die EU fordert Gespräche mit x wegen antisemitischer Grok-Antworten. Groks neuer KI-Companion mit Erotik-Avatar wird im App Store ab 12 Jahren freigegeben. Link, Link, Link

OpenAI plant, E-Commerce-Checkouts in ChatGPT zu integrieren und einen Anteil an den Online-Einkäufen zu nehmen, die innerhalb des Chatbots getätigt werden. Erste Entwürfe werden den Marken gezeigt, und Shopify ist bereits für die Kaufabwicklung integriert. Link

🇪🇺 EU-News:

  • Die EU hat ein neues AI Code of Practice veröffentlicht – Firmen müssen u. a. einheitliche Modell-Dokumentation, Urheberrechtsregeln und Risiko-Checks umsetzen. Als hätte die EU absolut keinen Bock auf eine europäische KI-Industrie.. Link 

  • Mistral stellt sein erstes Open-Source-Audio-Modell vor: Voxtral. Außerdem hat Mistral bald Deep Research, Sprachmodus, Projekte und fortgeschrittene Bildbearbeitung. Link, Link

  • ETH Zürich und EPFL veröffentlichen ein großes Sprachmodell, trainiert auf öffentlicher Infrastruktur mit dem Alps-Supercomputer – ein Meilenstein für Open-Source-KI. Link

👩‍💻 Tech-News:

  • Meta prüft intern, ob die Zukunft eher in geschlossenen KI-Modellen liegt – Llama 5 könnte nie kommen. Link 

  • Microsofts Copilot Vision AI kann jetzt den gesamten Bildschirminhalt erfassen – auch Desktop-Elemente und offene Apps. Link

  • Zwei Entwickler des Claude-Coding-Teams wechselten erst zu Anysphere – und sind jetzt überraschend wieder bei Anthropic. Keine Ahnung was hier los ist! Link

  • Amazon/ AWS stellt Kiro vor – eine neue KI-IDE, die agentisches Coding vereinfachen und den Brückenschlag von Prototyp zur Produktion ermöglichen soll. Link 

  • US-Verteidigungsministerium vergibt KI-Großaufträge im Wert von 200 Mio. $ an xAI, OpenAI, Google & Anthropic. Link 

  • Ex-OpenAI-CTO Mira Murati verrät Details zu ihrem neuen Startup: Fokus auf „Collaborative AI“ für Startups und Einzelpersonen. Link

  • Ein ehemaliger OpenAI-Ingenieur packt aus: Die Arbeit sei herausfordernd, manchmal chaotisch, aber auch zutiefst bedeutend. Spannende Einblicke, wie es hinter den Kulissen wirklich aussieht. Link 

  • MIT-Forschende entwickeln neues Versuchsdesign, um Wechselwirkungen von Zellbehandlungen effizient zu messen – ein Durchbruch für Arzneientwicklung und Bias-Reduktion in der Biologie. Link

  • Anthropic verhandelt mit Investoren über eine neue Runde – Bewertung über 100 Milliarden Dollar, fast doppelt so hoch wie noch vor vier Monaten. Der Umsatz stieg von 3 auf 4 Milliarden pro Jahr – innerhalb eines Monats. Link

🇨🇳 China & AI Race:

  • Die USA setzen für den KI-Boom verstärkt auf Atomkraft. 300 GW Atomstrom sind bis 2040 geplant, zehn neue Reaktoren bis 2030. Präsident Trump will zusätzlich 70 Milliarden Dollar in KI-Energieinfrastruktur in Pennsylvania investieren. Link 

👷 Work & Education:

  • Laut Umfrage nutzen 60 % der US-Manager KI für Personalentscheidungen – 78 % davon auch für Gehaltsfragen. Link 

  • Microsoft spart laut interner Zahlen 500 Millionen Dollar pro Jahr durch KI im Callcenter – zeitgleich entließ der Konzern rund 9.000 Mitarbeitende. Link

🆕 Neue Anwendungsfelder:

  • Ein Entwickler erstellt ein LLM-Trainingsset mit 50 Büchern aus London (1800–1850) – komplett ohne modernen Bias. Ein faszinierendes Retro-Dataset. Link

  • Delta testet personalisierte Flugpreise – abhängig davon, wie viel du laut KI bereit bist zu zahlen. Feste Ticketpreise könnten bald Geschichte sein. Link 

  • Ein neuer humanoider Roboter erledigt Pick-and-Place-Aufgaben in Lagerhallen mit Präzision und Tempo – potenziell eine Revolution für Logistik und E-Commerce. Link

🔐 AI Safety:

  • Ethan Mollick warnt: KI-Modelle sind konfliktscheu – schon ein einfaches „Bist du sicher?“ reicht, um faktenbasierte Antworten ins Wanken zu bringen. Lösung: Frag neutral, vermeide suggestive Fragen. Link 

  • Hugging Face hostet über 5.000 nicht-einvernehmliche Deepfake-Modelle echter Personen – darunter Prominente, Streamer, Lehrer und Politiker. Link

  • Warum KI günstiger wird, aber teuer bleibt: Andreas erklärt das „Jevons-Paradoxon“ – je günstiger die Ressource, desto mehr wird sie verbraucht. Heißt: KI senkt zwar Kosten, aber lässt die Rechnungen trotzdem explodieren. Wie bei der Cloud. Link 

  • Google Gemini kann per „invisible prompt“ gehackt werden – über unsichtbaren Text in E-Mails. Ein bekannter Uni-Trick wird hier zur echten Sicherheitslücke. Link

🏥 Health & Science:

  • John Jumper (Nobelpreisträger) erklärt in einem Video, wie KI wissenschaftliche Entdeckungen revolutioniert. Link

  • Ein neues KI-Modell sagt Nebenwirkungen durch Wechselwirkungen von Medikamenten voraus – mithilfe molekularer Strukturen und biologischer Pfade. Link

🖼️ Kreativindustrie:

  • Runway bringt mit Act-Two ein Motion-Capture-System für den ganzen Körper – ohne Sensoren, ohne Rigs. Link 

  • Google Discover testet KI-Zusammenfassungen direkt in der App – ein weiterer Schlag für Publisher, deren Traffic weiter zurückgeht. Link

🧂 Salty Memes:

Du hast Fragen, Anmerkungen oder brauchst unsere Hilfe?
Schreib uns einfach an:
[email protected]

Hilf uns dabei, besser zu werden! Was war schlecht? Was war gut? Wie fandest Du diese Ausgabe von AI Peanuts?

Login or Subscribe to participate

Bis Dienstag!

Weitere Artikel

No posts found