• AI Peanuts
  • Posts
  • 🚀 Neuer OpenAI Release: Endlich ein echter Agent

🚀 Neuer OpenAI Release: Endlich ein echter Agent

Dies ist höchstwahrscheinlich das letzte Mal, dass das passiert. Beim AtCoder World Tour Finals - einem sehr harten Coder-Wettbewerb - belegte der menschliche Programmierer Psyho den ersten Platz und ĂŒbertraf damit den KI-Beitrag von OpenAI (OpenAIAHC). Daher hat „die Menschheit gesiegt.“ Sam Altman gratulierte ihm auf Twitter, und so macht das auch AI Peanuts. Let’s Go, Menschen!

Peanuts fĂŒr heute:

  • 🧠 Die Große Nuss: Neuer OpenAI Release: Endlich ein echter Agent

  • đŸ› ïž Trai it Out: OpenAI’s “geheimes” Bild-Editing Tool

  • 📊 Highlight: Nvidia verkauft wieder nach China & xAI macht KI-Girlfriends

đŸ„œ Die grĂ¶ĂŸte Nuss:

🚀 Neuer OpenAI Release: Endlich ein echter Agent

Gestern Abend hat OpenAI sein neuestes Produkt vorgestellt, und treue Leser wissen, dass OpenAI wirklich schlecht darin ist, Produkte anstĂ€ndig zu benennen (ChatGPT-o4-mini-high, anyone?). Deswegen haben sie sich diesmal fĂŒr etwas komplett Generisches entschieden. Wir stellen vor: ChatGPT Agent.

Eigentlich hat OpenAI mit "Operator" bereits ein Produkt im Rennen, das sich selbststĂ€ndig durch Websites klicken und einfache Aufgaben ĂŒbernehmen konnte. Allerdings war Operator ausschließlich fĂŒr ChatGPT-Pro-User (ca. 200 Euro im Monat) verfĂŒgbar und
 naja, insgesamt ziemlich ernĂŒchternd in der Praxis. Unsere Tests damals brachten eher wenig Beeindruckendes zu Tage.

ChatGPT Agent ist nun aber die sinnvolle Fusion zwei bestehender Tools: Dem gerade erwÀhnten Operator, der gut darin war, Websites interaktiv zu nutzen, und Deep Research, das aus unterschiedlichsten Quellen tatsÀchlich hochwertige Berichte generieren konnte und ein Feature, dass wir wirklich hÀufig benutzen.

Was genau kann der neue Agent? 
Ein paar konkrete Beispiele zeigen deutlich, wohin die Reise geht:

  • „Analysiere drei Wettbewerber und erstelle daraus eine PrĂ€sentation.“

  • „Schau in meinen Kalender und bereite mich auf kommende Kundentermine anhand aktueller News vor.“

  • „Plane und kaufe Zutaten fĂŒr ein japanisches FrĂŒhstĂŒck fĂŒr vier Personen.“

Leider nimmt OpenAI im Announcement Video wieder seltsame Beispiele (“Such mir ein Outfit fĂŒr eine Hochzeit heraus”) anstatt auf nervige TĂ€tigkeiten des Alltags zu setzen (“Such die Belege fĂŒr meine SteuererklĂ€rung heraus”). Aber gut. 

Das alles lĂ€uft ĂŒber einen eigenen virtuellen Computer, auf dem der Agent flexibel zwischen Browser, eigenem Terminal und APIs wechseln kann. Außerdem nutzt er die „Connectors“ von ChatGPT, ĂŒber die man Zugriff auf Gmail, Dropbox oder GitHub geben kann. Der Agent fĂŒhrt Aufgaben eigenstĂ€ndig durch, ohne dass man stĂ€ndig zusehen muss, man kann ihn laufen lassen und spĂ€ter die Ergebnisse abrufen.

Interessanterweise erzielt der ChatGPT Agent auf verschiedensten Benchmarks deutlich bessere Ergebnisse als das aktuell stÀrkste OpenAI Modell - o3-, obwohl es kein neues Sprachmodell ist. Die FÀhigkeit, verschiedene Tools in Kombination zu nutzen macht es einfach insgesamt zu einem stÀrkeren Modell

Wie auch Operator, lĂ€sst sich Agent jederzeit unterbrechen, man kann selbst die Kontrolle ĂŒbernehmen oder ihm sensible Informationen wie Login-Daten und Kreditkarteninfos geben. Das macht das Tool enorm flexibel, birgt aber gleichzeitig erhebliche Risiken.

Die Risiken hinter der FlexibilitÀt

Je mehr sensible Daten der Agent erhĂ€lt, desto nĂŒtzlicher – aber eben auch riskanter – wird die Nutzung. Besonders kritisch könnten sogenannte Prompt-Injection-Angriffe sein, bei denen manipulierte Websites oder z.B. E-Mails versuchen, sensible Daten wie Passwörter oder Kreditkarteninformationen abzugreifen. OpenAI ist sich dieser Gefahr bewusst und hat diverse Sicherheitsmechanismen eingebaut. Das wird ab nun ein ganz schönes Katz und Maus Spiel. 

Einen großen Haken hat die Sache aber noch: Tief im Pressetext findet man den Hinweis, dass OpenAI an einem Release in der EU und der Schweiz arbeitet. Wir sind also leider wieder als letztes in dran. (VPN oder die Zeit regeln) 

Link zum Blog 

đŸ› ïž Trai it out:

OpenAI’s “geheimes” Bild-Editing Tool

SpĂ€testens durch den Studio Ghibli Trend wurde ChatGPT zum ernstzunehmenden KI-Bild Tool. Doch was viele nicht wissen, neben der Möglichkeit, in ChatGPT Bilder zu erstellen, kann man auch die OpenAI Platform Sora nutzen, die ursprĂŒnglich mal nur fĂŒr die Video-Erstellung gedacht war.

Das Sora Interface bietet deutlich mehr Einstellungsmöglichkeiten, eine Media-Library und einen Explore-Feed mit Inspiration:

Und fĂŒr alle, die dann noch einen Schritt weiter gehen wollen, um Zugang zu noch mehr Features zu bekommen:

Seit dieser Woche bietet die OpenAI ein neues Profi Feature, dass besonders fĂŒr das KI-gestĂŒtzte Bearbeiten von Bildern relevant ist: High Input Fidelity. Das bedeutet, dass ChatGPT die Bilder, die man als Input reingibt in deutlich höherer QualitĂ€t “versteht”, und somit Edits deutlich nĂ€her am Original macht.

Wenn man vorher ein Bild einer Person hochgeladen hat und darum gebeten hat, ein Detail des Outfits zu verÀndern, kam es hÀufig vor, dass ChatGPT auch das generelle Aussehen stark verÀnderte oder den Hintergrund ungefragt anpasste.

Mit der High Input Fidelity Einstellung sind Bearbeitungen jetzt deutlich nÀher am Original.

Aber: Wer jetzt dachte das Feature gibt es einfach in ChatGPT oder Sora, der hat die kompliziert Produktstrategie (oder das Fehlen einer solchen) von OpenAI nicht auf dem Schirm. Denn das Feature gibt es nur per API - doch jetzt kommt das zweite Aber: FĂŒr die API gibt es ein etwas verstecktes Frontend - und als kleine AI Peanuts Service Leistung zeigen wir euch, wie ihr dort hinkommt:

  1. Loggt euch auf der OpenAI API Platform ein (nicht auf ChatGPT!) / Erstellt einen Account

  2. Wenn ihr einen neuen Account habt, klickt oben rechts auf den grĂŒnen Knopf “Start Building” und fĂŒllt das Formular aus.

    1. Die API Key Erstellung könnt ihr einfach ignorieren

    2. Um die API zu nutzen, muss man Credits kaufen und/oder eine Zahlungsmethode hinterlegen. $5 sind fĂŒr den Start locker ausreichend!

  3. Jetzt habt ihr Zugang zum API Playground und spezifisch zum Images Playground

  4. Klickt auf das “Einstellungs”-Symbol, dann auf Advanced und dann seht ihr folgendes MenĂŒ, in dem ihr u.a. die Input Fidelity auf High stellen könnt.

Eine Demo und ErklĂ€rung zum Feature gibt’s auch hier von OpenAI selbst:

Spannende Demos:

Die Power von schneller Inferenz + Open Source:

Tools kurz & knackig:

  • ChatGPT Record Mode — Meeting Transcriptions direkt in ChatGPT - jetzt auch in Europa fĂŒr zahlende Nutzer verfĂŒgbar

  • Adobe Firefly — Mit vielen neuen Funktionen, u.a. rund um realistische Audioeffekte

  • Suno 4.5+ — Neue Version des beliebten KI-Musik Tools

  • Claude Desktop Extensions — Neue Art Tools mit One-Click an Claude anzubinden

  • Asimov — Agent, der auf das Verstehen von großen Code-Repos spezialisiert ist

🍭🍬 Gemischte TĂŒte

📖 Must Reads:

Unsere Gemischte TĂŒte ist immer vollgepackt - in dieser neuen Sektion kuratieren wir zukĂŒnftig die aus unserer Sicht wichtigsten 3 Links:

Nvidia kann wieder einzelne Chiptypen nach China verkaufen. Die Wiederaufnahme der GPU-Lieferungen nach China hĂ€ngt mit Verhandlungen ĂŒber Seltene Erden zusammen. Jensen Huang reiste nun nach Peking und spricht öffentlich ĂŒber den „Tech-Stack als neue WeltreservewĂ€hrung“. Link

xAI bietet jetzt KI-Freundinnen an, sogenannte Waifus. Gleichzeitig verspricht xAI: Grok wird kĂŒnftig nicht mehr Hitler zitieren oder sich auf Elon Musks Meinung stĂŒtzen – wie verrĂŒckt ist es, dass das eine echte Schlagzeile ist? Nach öffentlicher Kritik wurde das Modell umprogrammiert, und auch die EU fordert GesprĂ€che mit x wegen antisemitischer Grok-Antworten. Groks neuer KI-Companion mit Erotik-Avatar wird im App Store ab 12 Jahren freigegeben. Link, Link, Link

OpenAI plant, E-Commerce-Checkouts in ChatGPT zu integrieren und einen Anteil an den Online-EinkĂ€ufen zu nehmen, die innerhalb des Chatbots getĂ€tigt werden. Erste EntwĂŒrfe werden den Marken gezeigt, und Shopify ist bereits fĂŒr die Kaufabwicklung integriert. Link

đŸ‡ȘđŸ‡ș EU-News:

  • Die EU hat ein neues AI Code of Practice veröffentlicht – Firmen mĂŒssen u. a. einheitliche Modell-Dokumentation, Urheberrechtsregeln und Risiko-Checks umsetzen. Als hĂ€tte die EU absolut keinen Bock auf eine europĂ€ische KI-Industrie.. Link 

  • Mistral stellt sein erstes Open-Source-Audio-Modell vor: Voxtral. Außerdem hat Mistral bald Deep Research, Sprachmodus, Projekte und fortgeschrittene Bildbearbeitung. Link, Link

  • ETH ZĂŒrich und EPFL veröffentlichen ein großes Sprachmodell, trainiert auf öffentlicher Infrastruktur mit dem Alps-Supercomputer – ein Meilenstein fĂŒr Open-Source-KI. Link

đŸ‘©â€đŸ’» Tech-News:

  • Meta prĂŒft intern, ob die Zukunft eher in geschlossenen KI-Modellen liegt – Llama 5 könnte nie kommen. Link 

  • Microsofts Copilot Vision AI kann jetzt den gesamten Bildschirminhalt erfassen – auch Desktop-Elemente und offene Apps. Link

  • Zwei Entwickler des Claude-Coding-Teams wechselten erst zu Anysphere – und sind jetzt ĂŒberraschend wieder bei Anthropic. Keine Ahnung was hier los ist! Link

  • Amazon/ AWS stellt Kiro vor – eine neue KI-IDE, die agentisches Coding vereinfachen und den BrĂŒckenschlag von Prototyp zur Produktion ermöglichen soll. Link 

  • US-Verteidigungsministerium vergibt KI-GroßauftrĂ€ge im Wert von 200 Mio. $ an xAI, OpenAI, Google & Anthropic. Link 

  • Ex-OpenAI-CTO Mira Murati verrĂ€t Details zu ihrem neuen Startup: Fokus auf „Collaborative AI“ fĂŒr Startups und Einzelpersonen. Link

  • Ein ehemaliger OpenAI-Ingenieur packt aus: Die Arbeit sei herausfordernd, manchmal chaotisch, aber auch zutiefst bedeutend. Spannende Einblicke, wie es hinter den Kulissen wirklich aussieht. Link 

  • MIT-Forschende entwickeln neues Versuchsdesign, um Wechselwirkungen von Zellbehandlungen effizient zu messen – ein Durchbruch fĂŒr Arzneientwicklung und Bias-Reduktion in der Biologie. Link

  • Anthropic verhandelt mit Investoren ĂŒber eine neue Runde – Bewertung ĂŒber 100 Milliarden Dollar, fast doppelt so hoch wie noch vor vier Monaten. Der Umsatz stieg von 3 auf 4 Milliarden pro Jahr – innerhalb eines Monats. Link

🇹🇳 China & AI Race:

  • Die USA setzen fĂŒr den KI-Boom verstĂ€rkt auf Atomkraft. 300 GW Atomstrom sind bis 2040 geplant, zehn neue Reaktoren bis 2030. PrĂ€sident Trump will zusĂ€tzlich 70 Milliarden Dollar in KI-Energieinfrastruktur in Pennsylvania investieren. Link 

đŸ‘· Work & Education:

  • Laut Umfrage nutzen 60 % der US-Manager KI fĂŒr Personalentscheidungen – 78 % davon auch fĂŒr Gehaltsfragen. Link 

  • Microsoft spart laut interner Zahlen 500 Millionen Dollar pro Jahr durch KI im Callcenter – zeitgleich entließ der Konzern rund 9.000 Mitarbeitende. Link

🆕 Neue Anwendungsfelder:

  • Ein Entwickler erstellt ein LLM-Trainingsset mit 50 BĂŒchern aus London (1800–1850) – komplett ohne modernen Bias. Ein faszinierendes Retro-Dataset. Link

  • Delta testet personalisierte Flugpreise – abhĂ€ngig davon, wie viel du laut KI bereit bist zu zahlen. Feste Ticketpreise könnten bald Geschichte sein. Link 

  • Ein neuer humanoider Roboter erledigt Pick-and-Place-Aufgaben in Lagerhallen mit PrĂ€zision und Tempo – potenziell eine Revolution fĂŒr Logistik und E-Commerce. Link

🔐 AI Safety:

  • Ethan Mollick warnt: KI-Modelle sind konfliktscheu – schon ein einfaches „Bist du sicher?“ reicht, um faktenbasierte Antworten ins Wanken zu bringen. Lösung: Frag neutral, vermeide suggestive Fragen. Link 

  • Hugging Face hostet ĂŒber 5.000 nicht-einvernehmliche Deepfake-Modelle echter Personen – darunter Prominente, Streamer, Lehrer und Politiker. Link

  • Warum KI gĂŒnstiger wird, aber teuer bleibt: Andreas erklĂ€rt das „Jevons-Paradoxon“ – je gĂŒnstiger die Ressource, desto mehr wird sie verbraucht. Heißt: KI senkt zwar Kosten, aber lĂ€sst die Rechnungen trotzdem explodieren. Wie bei der Cloud. Link 

  • Google Gemini kann per „invisible prompt“ gehackt werden – ĂŒber unsichtbaren Text in E-Mails. Ein bekannter Uni-Trick wird hier zur echten SicherheitslĂŒcke. Link

đŸ„ Health & Science:

  • John Jumper (NobelpreistrĂ€ger) erklĂ€rt in einem Video, wie KI wissenschaftliche Entdeckungen revolutioniert. Link

  • Ein neues KI-Modell sagt Nebenwirkungen durch Wechselwirkungen von Medikamenten voraus – mithilfe molekularer Strukturen und biologischer Pfade. Link

đŸ–Œïž Kreativindustrie:

  • Runway bringt mit Act-Two ein Motion-Capture-System fĂŒr den ganzen Körper – ohne Sensoren, ohne Rigs. Link 

  • Google Discover testet KI-Zusammenfassungen direkt in der App – ein weiterer Schlag fĂŒr Publisher, deren Traffic weiter zurĂŒckgeht. Link

🧂 Salty Memes:

Du hast Fragen, Anmerkungen oder brauchst unsere Hilfe?
Schreib uns einfach an:
[email protected]

Hilf uns dabei, besser zu werden! Was war schlecht? Was war gut? Wie fandest Du diese Ausgabe von AI Peanuts?

Login oder Abonnieren um an umfragen teilzunehmen.

Bis Dienstag!