• AI Peanuts
  • Posts
  • 🤯 Endlich: Das neue OpenAI Modell ist da

🤯 Endlich: Das neue OpenAI Modell ist da

Willkommen zu o1 Ära der Künstlichen Intelligenz

Hi Freunde!
Montag war mal wieder Apple Keynote - und neben neuen Apple Watches und dem iPhone 16 war vor allem neu, dass Tim Cook das Wort “Artificial Intelligence” direkt im ersten Satz ausgesprochen hat… Zum Thema AI gab’s aber kaum Updates über die letzten Neuerungen der WWDC hinaus (siehe unserer Bericht von Juni hier). Und da die KI-Features ja leider sowieso erst mal nicht nach Europa kommen, fokussieren wir uns heute lieber auf andere spannende Themen:

Peanuts für heute:

  • 🧠 OpenAI’s „Strawberry“: Was kann das nächste Modell?

  • 🎬️ Deutsche Justiz mit KI entlasten?

  • 🛠️ RenderNet macht das erstellen von digitalen Influencern einfach

📊 Chart des Monats: Top 50 beliebtesten Gen-AI-Produkte nach monatlichen Besucherzahlen

Quelle: a16z


🥜 Die größte Nuss:


Eigentlich hatten wir eine große Nuss rund um die Gerüchte des nächsten großen OpenAI Releases geplant - doch gestern Abend wurde es überraschend veröffentlicht.

Wir präsentieren: OpenAI o1-Preview, das neue Flaggschiff Modell von OpenAI, das komplexe Aufgaben besser lösen soll, indem es sich mehr Zeit für das Denken nimmt. Und ja, es heißt tatsächlich nicht mehr “GPT”. 

Was macht o1-Preview so besonders?

Anstatt wie bisher vor allem auf mehr Trainingsdaten und höhere Rechenpower zu setzen, wird bei der neuen o1-Serie die Inferenzzeit erhöht – sprich: Das Modell „denkt“ länger, um präzisere Antworten zu liefern. Dies markiert einen Wendepunkt in der KI-Entwicklung.

  • Längere Denkzeit: Die Modelle verbringen mehr Zeit damit, Probleme zu analysieren, bevor sie antworten.

  • Bessere Ergebnisse: In Tests übertrifft o1-Preview frühere Modelle bei Mathematik (83 % vs. 13 % bei GPT-4o) und Programmierung (89. Perzentil in Codeforces-Wettbewerben).

  • Sicherheit: Ein neues Sicherheits-Framework sorgt dafür, dass o1-Preview Regeln strikter befolgt, z.B. in “Jailbreaking”-Tests (84 Punkte vs. 22 bei GPT-4o).

Das o1-Modell nutzt erstmals Reinforcement Learning, um wirklich „hart“ über Probleme nachzudenken, bevor es antwortet.

Ein spannender Aspekt: Bei o1 kann man tatsächlich verfolgen, wie das Modell denkt. Es legt seine Überlegungen Schritt für Schritt offen, was es einfacher macht zu verstehen, wie es zu seinen Antworten kommt – und auch Fehler reduziert.

Wer profitiert von o1-Preview?

o1-Preview: bei einfachen Aufgaben kaum besser

o1-Preview ist nicht automatisch allen Bereichen besser als die alten Modelle wie die Grafik oben zeigt. Z.B beim Erstellen oder Verbessern von Texten ist es ähnlich gut.
Sobald die Aufgaben aber umfangreicher und komplexer werden, verbessern sich die Ergebnisse.

Wie sieht das konkret aus?

OpenAI hat zum Release ein paar Videos veröffentlicht, in denen o1-Preview Probleme lösen kann, an denen GPT-4 kläglich scheiterte. Anstatt Antworten zu generieren, die komplett falsch sind aber gut klingen, scheint o1-Preview ein besseres Verständnis zu haben.

Hier ein paar Beispiele von Aufgaben, die o1-Preview korrekt löst:

Medizinische Diagnosen

Mathematik

Für aktuelle Fragen braucht o1-Preview 5–30 Sekunden Bedenkzeit. OpenAI glaubt aber, dass es zukünftig auch Stunden, Tage oder mehrere Wochen über bestimmte Prompts nachdenken wird.

Wenn Sprachmodelle wie o1-Preview in „Schritten“ denken können, haben wir dann bald eine allgemeine künstliche Intelligenz, die auf Augenhöhe mit dem menschlichen Verstand steht?

Ihr wisst, dass wir wenig vom Überhypen halten. Wir möchten deswegen noch den sehr lesenswerten Artikel des KI-Experten François Chollet erwähnen.
 
Er argumentiert, dass große Sprachmodelle (LLMs) den KI-Fortschritt sogar verlangsamen, indem sie die Forschung in eine Sackgasse führen. Laut ihm beruhen sie eher auf bloßem „schlechtem Auswendiglernen“ als auf echter Intelligenz. Chollet glaubt, dass wir neue, kreativere Ansätze brauchen, um wirklich menschenähnliche Denkfähigkeiten in KI-Systemen zu entwickeln.

Ihr erinnert euch sicher noch an Headlines wie “KI schneidet im Mediziner-test besser ab als Experten”. Das liegt laut Chollet eher daran, dass die KI die Antworten schon kannte - sei aber kein Zeichen von Intelligenz. Womit wir aber wohl wieder bei einer philosophischen Debatte wären, was Intelligenz eigentlich ist…

Chollet hat übrigens für kreativere Ansätze auch einen eigenen Preis ins Leben gerufen, bei dem Gewinnern bis zu einer Million Euro winken. Na dann mal los!

Weiter Info zu Strawberry
KI Preis für kreativere Ansätze

🛠️ Trai it out:

RenderNet — Ob digitale Nachrichtensprecher oder Influencer - mit RenderNet kann man konsistente digitale “Charaktere” erstellen und diese dann in jeglichen KI-Bildern mit diversen Posen, Outfits & co. nutzen. Und auch Videos lassen sich mit den Charakteren erstellen.

Das kann praktisch sein für alles mögliche: Interne Demos, Ads, Social Media Posts…

Weitere Neue Tools, Updates & Demos:

  • Smartcat Texte, Dokumente, Websites & Software übersetzen mit KI

  • Fish Audio — Gratis & Open Source Text-to-Speech und Voice-Cloning Alternative zu ElevenLabs

  • Serra — Recruiting & Talentsuche meets KI

  • PaperQA — Ein KI-Agent, der wissenschaftliches Arbeiten mit Papern beherrscht

  • SaleStack — Eine umfassende Übersicht an KI-Tools für Sales

Prompting & Kurse:

  • Für alle, die ein LLM “from scratch” selbst coden wollen gibt’s hier ein neues Buch. Link

🍭🍬 Gemischte Tüte

🇪🇺 EU-News:

  • Die deutsche Justiz soll mit Hilfe von KI entlastet werden. Link

  • Das französische Mistral hat ein neues multimodales LLM namens Pixtral veröffentlicht. Link

👩‍💻 Tech-News:

  • Hype? 75% der Startups in YCombinator arbeiten an KI-Themen. Link

  • Spannende Statistiken zu den Investments in KI Themen. U.a. haben alleine Meta, Amazon, Microsoft und Google im letzten Quartal über $50Mrd. in KI investiert! Link

  • OpenAI ist wohl mal wieder dabei, frisches Geld einzusammeln. Die angepeilte Bewertung: $150Mrd! Link

  • Apple’s neue KI-Technologie: Ein solider Anfang, aber noch Luft nach oben. Link

  • Aber Apple Intelligence könnte richtig spannend werden, wenn Drittanbieter-Apps ins Spiel kommen. Link

  • Und Apple erwägt den Einstieg in das Smart-Glasses-Geschäft und könnte eine Alternative zu den Meta Ray-Ban-Brillen entwickeln. Link

  • Nevada setzt auf Googles KI, um über Arbeitslosenunterstützung zu entscheiden – ein neuer Ansatz in der Verwaltung. Link

  • Klarna setzt auf Eigenentwicklungen: Salesforce und Workday werden durch KI-basierte Inhouse-Lösungen ersetzt. Könnte aber auch einfach gutes Marketing sein, da dies wohl schon länger geplant war. Link

  • Amazon testet Anzeigen im Rufus-Chatbot, basierend auf Gesprächsverlauf und Suchdaten. Link

  • Audible rekrutiert Sprecher, um KI-gesteuerte Hörbuchgeneratoren zu trainieren. Link

  • YouTube führt „Ask Music“ ein: Eine neue KI-basierte Radiofunktion für Premium-Mitglieder. Link

  • Sergey Brin (einer der Google Gründer) über KI bei Google: Fortschritte bei Algorithmen könnten wichtiger sein als bloße Rechenpower – Brin bestätigt seine Rückkehr zu Google. Link

  • Amazon investiert 10,5 Milliarden Dollar in den Ausbau seiner KI-Infrastruktur im Vereinigten Königreich – eine langfristige Wette auf die Zukunft. Link

  • AMD setzt auf KI und verabschiedet sich von Gaming-GPUs als Flaggschiff-Produkte. Link

👷 Work:

  • Praxis schlägt Theorie: Warum der Umgang mit KI-Chatbots mehr als nur technisches Wissen erfordert. Link

🆕 Neue Anwendungsfelder:

  • Ein Bericht über Figure’s neuen humanoiden KI-Roboter, der u.a. bei BMW schon testweise eingesetzt wird. Link

🖼️ Kreativindustrie:

  • Adobe bringt Firefly für Text-zu-Video: Generiere Clips mit Referenzbildern und individuellen Kamerawinkeln – Veröffentlichung noch dieses Jahr. Link

  • Wie Autoren ChatGPT kreativ einsetzen: Fünf Wege, wie professionelle Schreiber KI für ihre Arbeit nutzen.Link

  • Einblicke in die Zusammenarbeit von Schriftstellern und Journalisten mit KI: Wie sie den Output von Chatbots optimieren.

    Link

🧂 Salty Memes:

Wir wollen uns verbessern! Wie hat dir diese Ausgabe gefallen? Welche Themen wünschst du dir für die Zukunft mehr?

Login or Subscribe to participate in polls.

Bis Dienstag!