🤯 Endlich: Das neue OpenAI Modell ist da

Hi Freunde!
Montag war mal wieder Apple Keynote - und neben neuen Apple Watches und dem iPhone 16 war vor allem neu, dass Tim Cook das Wort “Artificial Intelligence” direkt im ersten Satz ausgesprochen hat… Zum Thema AI gab’s aber kaum Updates über die letzten Neuerungen der WWDC hinaus (siehe unserer Bericht von Juni hier). Und da die KI-Features ja leider sowieso erst mal nicht nach Europa kommen, fokussieren wir uns heute lieber auf andere spannende Themen:

Peanuts für heute:

🧠 OpenAI’s „Strawberry“: Was kann das nächste Modell?
🎬 Deutsche Justiz mit KI entlasten?
🛠 RenderNet macht das erstellen von digitalen Influencern einfach

📊 Chart des Monats: Top 50 beliebtesten Gen-AI-Produkte nach monatlichen Besucherzahlen

Quelle: a16z

🥜 Die größte Nuss:

Eigentlich hatten wir eine große Nuss rund um die Gerüchte des nächsten großen OpenAI Releases geplant - doch gestern Abend wurde es überraschend veröffentlicht.

Wir präsentieren: OpenAI o1-Preview, das neue Flaggschiff Modell von OpenAI, das komplexe Aufgaben besser lösen soll, indem es sich mehr Zeit für das Denken nimmt. Und ja, es heißt tatsächlich nicht mehr “GPT”.

Was macht o1-Preview so besonders?

Anstatt wie bisher vor allem auf mehr Trainingsdaten und höhere Rechenpower zu setzen, wird bei der neuen o1-Serie die Inferenzzeit erhöht – sprich: Das Modell „denkt“ länger, um präzisere Antworten zu liefern. Dies markiert einen Wendepunkt in der KI-Entwicklung.

Längere Denkzeit: Die Modelle verbringen mehr Zeit damit, Probleme zu analysieren, bevor sie antworten.
Bessere Ergebnisse: In Tests übertrifft o1-Preview frühere Modelle bei Mathematik (83 % vs. 13 % bei GPT-4o) und Programmierung (89. Perzentil in Codeforces-Wettbewerben).
Sicherheit: Ein neues Sicherheits-Framework sorgt dafür, dass o1-Preview Regeln strikter befolgt, z.B. in “Jailbreaking”-Tests (84 Punkte vs. 22 bei GPT-4o).

Das o1-Modell nutzt erstmals Reinforcement Learning, um wirklich „hart“ über Probleme nachzudenken, bevor es antwortet.

Ein spannender Aspekt: Bei o1 kann man tatsächlich verfolgen, wie das Modell denkt. Es legt seine Überlegungen Schritt für Schritt offen, was es einfacher macht zu verstehen, wie es zu seinen Antworten kommt – und auch Fehler reduziert.

Wer profitiert von o1-Preview?

o1-Preview: bei einfachen Aufgaben kaum besser

o1-Preview ist nicht automatisch allen Bereichen besser als die alten Modelle wie die Grafik oben zeigt. Z.B beim Erstellen oder Verbessern von Texten ist es ähnlich gut.
Sobald die Aufgaben aber umfangreicher und komplexer werden, verbessern sich die Ergebnisse.

Wie sieht das konkret aus?

OpenAI hat zum Release ein paar Videos veröffentlicht, in denen o1-Preview Probleme lösen kann, an denen GPT-4 kläglich scheiterte. Anstatt Antworten zu generieren, die komplett falsch sind aber gut klingen, scheint o1-Preview ein besseres Verständnis zu haben.

Hier ein paar Beispiele von Aufgaben, die o1-Preview korrekt löst:

Medizinische Diagnosen

Mathematik

Für aktuelle Fragen braucht o1-Preview 5–30 Sekunden Bedenkzeit. OpenAI glaubt aber, dass es zukünftig auch Stunden, Tage oder mehrere Wochen über bestimmte Prompts nachdenken wird.

Wenn Sprachmodelle wie o1-Preview in „Schritten“ denken können, haben wir dann bald eine allgemeine künstliche Intelligenz, die auf Augenhöhe mit dem menschlichen Verstand steht?

Ihr wisst, dass wir wenig vom Überhypen halten. Wir möchten deswegen noch den sehr lesenswerten Artikel des KI-Experten François Chollet erwähnen.

Er argumentiert, dass große Sprachmodelle (LLMs) den KI-Fortschritt sogar verlangsamen, indem sie die Forschung in eine Sackgasse führen. Laut ihm beruhen sie eher auf bloßem „schlechtem Auswendiglernen“ als auf echter Intelligenz. Chollet glaubt, dass wir neue, kreativere Ansätze brauchen, um wirklich menschenähnliche Denkfähigkeiten in KI-Systemen zu entwickeln.

Ihr erinnert euch sicher noch an Headlines wie “KI schneidet im Mediziner-test besser ab als Experten”. Das liegt laut Chollet eher daran, dass die KI die Antworten schon kannte - sei aber kein Zeichen von Intelligenz. Womit wir aber wohl wieder bei einer philosophischen Debatte wären, was Intelligenz eigentlich ist…

Chollet hat übrigens für kreativere Ansätze auch einen eigenen Preis ins Leben gerufen, bei dem Gewinnern bis zu einer Million Euro winken. Na dann mal los!

Weiter Info zu Strawberry
KI Preis für kreativere Ansätze

🛠 Trai it out:

RenderNet — Ob digitale Nachrichtensprecher oder Influencer - mit RenderNet kann man konsistente digitale “Charaktere” erstellen und diese dann in jeglichen KI-Bildern mit diversen Posen, Outfits & co. nutzen. Und auch Videos lassen sich mit den Charakteren erstellen.

Das kann praktisch sein für alles mögliche: Interne Demos, Ads, Social Media Posts…

Weitere Neue Tools, Updates & Demos:

Smartcat — Texte, Dokumente, Websites & Software übersetzen mit KI
Fish Audio — Gratis & Open Source Text-to-Speech und Voice-Cloning Alternative zu ElevenLabs
Serra — Recruiting & Talentsuche meets KI
PaperQA — Ein KI-Agent, der wissenschaftliches Arbeiten mit Papern beherrscht
SaleStack — Eine umfassende Übersicht an KI-Tools für Sales

Prompting & Kurse:

Für alle, die ein LLM “from scratch” selbst coden wollen gibt’s hier ein neues Buch. Link

🍭🍬 Gemischte Tüte

🇪🇺 EU-News:

Die deutsche Justiz soll mit Hilfe von KI entlastet werden. Link
Das französische Mistral hat ein neues multimodales LLM namens Pixtral veröffentlicht. Link

👩‍💻 Tech-News:

Hype? 75% der Startups in YCombinator arbeiten an KI-Themen. Link
Spannende Statistiken zu den Investments in KI Themen. U.a. haben alleine Meta, Amazon, Microsoft und Google im letzten Quartal über $50Mrd. in KI investiert! Link
OpenAI ist wohl mal wieder dabei, frisches Geld einzusammeln. Die angepeilte Bewertung: $150Mrd! Link
Apple’s neue KI-Technologie: Ein solider Anfang, aber noch Luft nach oben. Link
Aber Apple Intelligence könnte richtig spannend werden, wenn Drittanbieter-Apps ins Spiel kommen. Link
Und Apple erwägt den Einstieg in das Smart-Glasses-Geschäft und könnte eine Alternative zu den Meta Ray-Ban-Brillen entwickeln. Link
Nevada setzt auf Googles KI, um über Arbeitslosenunterstützung zu entscheiden – ein neuer Ansatz in der Verwaltung. Link
Klarna setzt auf Eigenentwicklungen: Salesforce und Workday werden durch KI-basierte Inhouse-Lösungen ersetzt. Könnte aber auch einfach gutes Marketing sein, da dies wohl schon länger geplant war. Link
Amazon testet Anzeigen im Rufus-Chatbot, basierend auf Gesprächsverlauf und Suchdaten. Link
Audible rekrutiert Sprecher, um KI-gesteuerte Hörbuchgeneratoren zu trainieren. Link
YouTube führt „Ask Music“ ein: Eine neue KI-basierte Radiofunktion für Premium-Mitglieder. Link
Sergey Brin (einer der Google Gründer) über KI bei Google: Fortschritte bei Algorithmen könnten wichtiger sein als bloße Rechenpower – Brin bestätigt seine Rückkehr zu Google. Link
Amazon investiert 10,5 Milliarden Dollar in den Ausbau seiner KI-Infrastruktur im Vereinigten Königreich – eine langfristige Wette auf die Zukunft. Link
AMD setzt auf KI und verabschiedet sich von Gaming-GPUs als Flaggschiff-Produkte. Link

👷 Work:

Praxis schlägt Theorie: Warum der Umgang mit KI-Chatbots mehr als nur technisches Wissen erfordert. Link

🆕 Neue Anwendungsfelder:

Ein Bericht über Figure’s neuen humanoiden KI-Roboter, der u.a. bei BMW schon testweise eingesetzt wird. Link

🖼️ Kreativindustrie:

Adobe bringt Firefly für Text-zu-Video: Generiere Clips mit Referenzbildern und individuellen Kamerawinkeln – Veröffentlichung noch dieses Jahr. Link
Wie Autoren ChatGPT kreativ einsetzen: Fünf Wege, wie professionelle Schreiber KI für ihre Arbeit nutzen.Link
Einblicke in die Zusammenarbeit von Schriftstellern und Journalisten mit KI: Wie sie den Output von Chatbots optimieren.
Link

🧂 Salty Memes:

Bis Dienstag!