• AI Peanuts
  • Posts
  • 🔍️ OpenAI Deep Research: Wie OpenAI das DeepSeek-Dilemma schnell begraben möchte

🔍️ OpenAI Deep Research: Wie OpenAI das DeepSeek-Dilemma schnell begraben möchte

Uiuiui… anlässlich des o3-Mini-Releases haben Sam Altman und Konsorten auf Reddit ein Ask Me Anything veranstaltet. Es lohnt sich, mal durchzuscrollen. Besonders spannend fanden wir, dass Sam Altman Open Source für ihre Modelle wieder in Erwägung zieht. Da gewinnt das ‘Open’ im Firmennamen doch glatt wieder an Bedeutung. Aufregend, aber höchst unwahrscheinlich. Don't get your hopes up…

Peanuts für heute:

  • 🔍️ OpenAI Deep Research: Wie OpenAI das Deepseek-Dilemma schnell begraben möchte

  • 🇪🇺 Die neuen KI-Regeln in der EU treten in Kraft

  • 🛠️ Skyvern ist eine Operator Alternative, die man schon heute nutzen kann - auch in der EU!

Anzeige

KI im Unternehmen: Schluss mit Schatten-KI, Sicherheit geht vor!

Hast du dich schon einmal gefragt, wie du Künstliche Intelligenz sicher in deinem Unternehmen einsetzen kannst? Die rasante Entwicklung von KI-Technologien bringt nicht nur technische, sondern auch wichtige Datenschutz- und Sicherheitsfragen mit sich.

Ein oft unterschätztes Risiko: Was passiert mit den Informationen, die Mitarbeitende in KI-Tools eingeben, die privat “organisiert” wurden? Viele Anbieter nutzen diese Daten möglicherweise für das Training ihrer KI-Modelle – und das könnte sensible Firmeninformationen gefährden.

Doch es gibt Lösungen: Plattformen wie ChatGPT bieten in ihren Einstellungen die Möglichkeit, der Nutzung dieser Daten zu widersprechen.

Welche Datenschutzbestimmungen beim Einsatz von KI-Tools besonders relevant sind und worauf Unternehmen achten sollten, erfährst du ausführlich im Modul „Datenschutz & KI“ von unserem Partner Herdt. Dieses Modul ist für Unternehmen jeder Größe von Bedeutung. Wenn das für dich interessant klingt - schau doch mal rein:

🥜 Die größte Nuss:

🔍️ OpenAI Deep Research: Wie OpenAI das DeepSeek-Dilemma schnell begraben möchte

Nach einer turbulenten Woche musste OpenAI dringend etwas liefern, um seinen Status als unangefochtener KI-Marktführer zu behaupten. Letzte Woche haben sie mit Operator ihr erstes Agenten-Experiment vorgestellt – eine KI, die eigenständig Lebensmittel einkaufen oder Restaurantreservierungen vornehmen kann. Wirklich brauchbar war das Feature noch nicht, aber es war zumindest ein erster Schritt.

Doch plötzlich gibt es eine neue Dimension im Rennen um Agenten-KI: Automatisierte Forschung. Tiefgehende Recherche - tiefer als alles zuvor?
Das bringt uns zu OpenAIs neuestem Produkt: Deep Research.

Was ist Deep Research?

OpenAI hat mit Deep Research eine KI vorgestellt, die eigenständig Informationen aus dem gesamten Internet zusammentragen und in präzise Berichte zusammenfassen kann. Im Kern handelt es sich um automatisierte Forschung mit mehrstufigem logischen Denken, Websuche und einer ganzen Palette an Zusatzfunktionen.

Unter der Haube läuft scheinbar das o3-Modell, das bisher noch nicht einmal in ChatGPT direkt nutzbar ist. Es wurde speziell darauf trainiert, relevante Daten zu extrahieren, Berechnungen durchzuführen und Grafiken zu erstellen. Die gesamte o3-Modellfamilie wurde gerade erst veröffentlicht:

  • o1 bleibt das breit angelegte Wissens- und Reasoning-Modell.

  • o3-mini ist die spezialisierte Alternative für technische Domänen, in denen Präzision und Geschwindigkeit zählen.

  • o3-mini-high ist eine leistungsfähigere Variante, die etwas länger für Berechnungen braucht, dafür aber ‘intelligenter’ agiert.

Alle zahlenden Nutzer können o3-mini & o3-mini-high jetzt über den Modell-Picker in ChatGPT auswählen - die volle o3-Version ist wie gesagt noch nicht verfügbar. Aber "mini" darf man nicht missverstehen: Vor allem im Bereich Coding dominiert OpenAIs o3-mini aktuell die Coding-Benchmarks. Allerdings gibt es mittlerweile so viele Benchmarks, dass es fraglich ist, welche tatsächlich relevant sind. Also mit Vorsicht genießen und weitere Tests abwarten oder anhand der eigenen Anwendung bewerten.

Wie leistungsfähig ist Deep Research wirklich?

Die neue Funktion wurde am Sonntag per YouTube-Demo vorgestellt – wenige Tage, nachdem OpenAI die Technologie in Washington Politikern und Regulierungsbehörden gezeigt hatte.

„Es kann komplexe Rechercheaufgaben übernehmen, für die Menschen zwischen 30 Minuten und 30 Tagen brauchen würden.“
– Kevin Weil, Chief Product Officer bei OpenAI

Laut Weil kann Deep Research solche Aufgaben je nach Komplexität in 5 bis 30 Minuten erledigen. Aktuell ist es allerdings nur für Pro-Nutzer verfügbar – also im höchsten Preis-Tier für 200 Dollar im Monat. Und natürlich auch erst mal nicht in der EU verfügbar. Wir konnten es daher noch nicht testen. Langfristig soll es aber auch für die regulären Plus- und sogar Free-Nutzer ausgerollt werden und wohl auch hierzulande zugänglich sein.

Der wirklich spannende Teil: Deep Research ist in der Lage, nicht nur Webseiten zu durchsuchen, sondern auch Texte, Bilder und PDFs zu verstehen. Es arbeitet rekursiv, indem es mit einer anfänglichen Suche beginnt, die Ergebnisse analysiert und daraus neue, präzise Suchen generiert, um schließlich alles zusammenzuführen.

Nutzer, die Deep Research bereits ausprobieren konnten, zeigen sich beeindruckt. Ein großes Problem gibt es aber noch: Sobald eine Recherche läuft, kann sie nicht mehr gestoppt werden. Wenn die Ergebnisse nicht passen oder man den Prozess korrigieren will – Pech gehabt. Man muss komplett neu starten.

Trotzdem sieht Sam Altman darin einen gewaltigen Schritt nach vorn:
„Unsere neue Deep Research KI kann bereits einen einstelligen Prozentanteil aller wirtschaftlich wertvollen Aufgaben übernehmen. Bald wird sie nicht nur Wissen synthetisieren, sondern auch neues Wissen generieren.“

Wie groß ist der Fortschritt wirklich?

Deep Research ist beeindruckend, aber man fragt sich, ob man viele Aufgaben nicht auch einfach mit Perplexity Pro und DeepSeek Reasoning lösen kann. Das werden nur die nächsten Wochen Testing zeigen.

Ein wichtiger Punkt ist jedoch die Leistung von Deep Research im „Humanity’s Last Exam“, einem neuen Benchmark, der KI in über 100 Bereichen auf Expertenniveau prüft.

Deep Research erreichte dabei eine Genauigkeit von 26,6 % bei mehr als 3.000 Fragen. Besonders gut schnitt es in Chemie, Geistes- und Sozialwissenschaften sowie Mathematik ab. Das könnte zeigen, dass Deep Research mehr sein könnte als nur eine Suchmaschine mit ChatGPT. Vielleicht entwickeln sich diese neuen Systeme zu echten Agenten. Aber aktuell bleibt die große Frage: Wer braucht wirklich eine KI, die auf Knopfdruck einen 30-seitigen Bericht erstellt?

🛠️ Trai it out:

Komplexe Aufgaben automatisieren mit Skyvern

KI-Agenten, die Zugriff auf einen Browser haben liegen aktuell ja ziemlich im Trend. OpenAI’s Operator ist aktuell nur für Pro Nutzer und nicht in der EU verfügbar. Das heißt aber nicht, dass man ähnliche Tools nicht trotzdem schon testen kann. Wir finden das lohnt sich, mindestens, um ein Gefühl für den aktuellen Stand der Technik zu bekommen. Unser Tipp heute: Skyvern.

Dieses KI-Tool kann einen Browser bedienen und kann somit Aufgaben übernehmen, die man ansonsten nur mühsam händisch selbst durchführen müsste.

Es gibt zwei Modi, um Skyvern agieren zu lassen:

  • Tools kurz & knackig:: Hier beschreibt man einfach grob eine Aufgabe als Prompt und lässt Skyvern “einfach machen”. Besonders cool ist, dem Tool Live dabei zuzusehen. Nützlich kann das für kleine, wenig komplexe Tasks sein, wie z.B. einfache Formulare ausfüllen, oder diverse Informations- und Recherche Tasks

  • Workflows: Mit Workflows lassen sich vorgelegte Pfade mit agentischen Tools kombinieren. So könnte man z.B. einen Workflow gestalten, der die KI anweist, Gmail anzusteuern, alle E-Mails mit Rechnungen zu extrahieren, dann zum Buchhaltungssystem zu navigieren und diese Rechnungen dann dort hochzuladen.

Der Art von Aufgaben, die man mit Skyvern erledigen kann, sind keine Grenzen gesetzt. Das Tool kann auch mit Logins & co. umgehen, Dateien hoch- und herunterladen und vieles mehr.

Zusammengefasst:

  • Skyvern ist ein “Browser-Use-Agent”, der autonom Aufgaben mit Hilfe eines Browsers ausführen kann

  • Es gibt zwei Modi - einen rein “agentischen”, bei dem die KI selbst entscheidet und einen basierend auf vorgefertigten Workflows

  • Skyvern lässt sich gratis ausprobieren und ist auch in der EU zugänglich

Spannende Demos:


Tools kurz & knackig:

  • Riffusion — Das KI-Musik Tool hat ein neues beeindruckendes Modell FUZZ

  • CubeOne — “Cursor für Präsentationen”

  • CapCut Dreamina — KI-native Canva Alternative

🍭🍬 Gemischte Tüte

🇪🇺 EU-News:

  • EU AI Act: Erste Anforderungen jetzt rechtlich bindend. Die neuen Regeln in der EU treten in Kraft. Link
    Verboten sind u. a.:

    • Social Scoring, das ungerechtfertigten Schaden verursacht

    • Risikobewertungen für kriminelles Verhalten, wenn sie nur auf Profiling basieren

    • Echtzeit-Biometrieüberwachung im öffentlichen Raum durch Strafverfolgungsbehörden

  • EU startet auf Basis von Draghi’s Forderung eine Initiative zur Förderung von Wachstum und Innovation. Die EU will dafür bürokratische Hürden abbauen, um Innovationen und KI-Entwicklung in Europa zu erleichtern. Link

  • Großbritannien hat neue Gesetze verabschiedet, die den Einsatz von KI zur Generierung von Missbrauchsbildern als Straftat einstufen. Link


👩‍💻 Tech-News:

  • Die gesamte Tech-Welt erholt sich noch von dem Schock, den DeepSeek ausgelöst hat, und hat beispielsweise für eine kurze Zeit Nvidias Marktwert um 25 % einbrechen lassen. In der letzten Ausgabe haben wir ausführlich darüber geschrieben. Hier sind einige Artikel für alle, die immer noch mehr darüber wissen wollen:

    • Warum DeepSeek unvermeidlich war – Steven Sinofsky erklärt, wie Technologie immer voranschreitet. Link

    • DeepSeek FAQ von Stratechery – eine sehr gute Übersicht. Link

    • 5h Podcast mit Lex Friedman über DeepSeek & China. Link

    • Technische Analyse von SemiAnalysis – Seine Schätzung: Deepseek kostete min. 1,5 Mrd. $ für Serverkapazitäten. Link

    • DeepSeek bringt ein neues Bildmodell namens Janus-Pro heraus – scheinbar besser als DALL-E 3 & Stable Diffusion. Link


  • Google startet KI-Modell "Gemini 2.0 Pro Experimental" – und zieht es zurück.
    Google hat sein neues Flaggschiff-Modell in einer Changelog-Ankündigung erwähnt, diese später aber als „veraltete Release Notes“ zurückgezogen. Trotzdem haben einige Nutzer bereits Zugriff auf das Modell. Welcher Praktikant hat hier Mist gebaut? Link

  • KI-entwickelt Computerchips, die der Mensch nicht mehr versteht. Forscher haben Computerchips entwickelt, die vollständig von KI entworfen wurden – mit Designs, die für Menschen kaum noch nachvollziehbar sind. Link

  • Immer mehr Unternehmen arbeiten an KI-gestützter Sprachsynthese. A16Z zeigt in einer neuen Präsentation, wie KI den Voice-Markt umkrempeln könnte. Link

  • Ein absolutes Must-Read: Jede Woche gibt es bessere KI-Modelle, aber was bedeutet "besser" eigentlich? Sind KI-Modelle nur gut für richtige Antworten – oder brauchen wir eine neue Erwartungshaltung? Link

  • Nur 5 % der ChatGPT-Nutzer zahlen – Nutzerzahl verdreifacht. Obwohl ChatGPT über 350 Millionen wöchentliche Nutzer hat, zahlen nur 5 % für das Abo. Link

  • Ein neuer Bericht bestätigt eine Schwachstelle in Gmail, bei der KI für gezielte Angriffe genutzt wird. Betroffen sind bis zu 2,5 Milliarden Nutzer weltweit. Link

👷 Work & Future of Work:

  • Jensen Huang sieht KI-gestützte Tutoren als unverzichtbar für die Zukunft der Bildung. Sie sollen individuelles Lernen ermöglichen und Bildung grundlegend verändern. Link

🆕 Neue Anwendungsfelder:

  • Google X hat "Heritable Agriculture" ausgegliedert – ein neues Startup, das KI einsetzt, um Ernteerträge zu optimieren. Ziel ist es, mit datenbasierten Methoden den Anbau effizienter zu machen. Link

🔐 Cybersecurity & AI Safety:

  • Microsoft gründet neue Abteilung zur Erforschung der Auswirkungen von KI
    Microsoft hat ein neues Team aufgestellt, das sich speziell mit den sozialen, wirtschaftlichen und ethischen Auswirkungen von KI-Technologien beschäftigt. Link

🏥 Health & Education:

  • LinkedIn-Gründer Reid Hoffman startet neues KI-gestütztes Pharmaunternehmen. Link

🖼️ Kreativindustrie:

  • Scott Belsky verlässt Adobe für ein KI-getriebenes Filmstudio. Nach zehn Jahren als Digitalstratege bei Adobe wechselt Belsky zu A24, dem Studio hinter mehreren Oscar-prämierten Filmen. Link

  • KI und Werbung: Wenn das Internet von KI geprägt ist, wird Werbung dann zu einer Frage der KI-Überzeugung statt der Nutzerüberzeugung? Eine spannende Diskussion. Link

  • Der Beatles Song “Now and Then”, der erst dank neuen KI-Tools möglich wurde und 2023 erschien (wir berichteten im Juni 2023) hat einen Grammy gewonnen. Link

AI Peanuts Workbook

Vollgepackt mit KI-Wissen, Tools & Tutorials!

Du hast angefangen, dich tiefer mit dem Thema KI zu beschäftigen und willst den nächsten Schritt machen? Dann ist unser offizielles AI Peanuts Workbook genau das Richtige für dich!

Das Workbook ist kein klassisches “Buch”, sondern ein praxisorientiertes, interaktives digitales Dokument. Gegliedert in 3 Teile:

Theorie — Der Textbuch-Teil des Workbooks, in dem wir das Thema KI und seine technischen Grundlagen erklären.
Praxis — Eine Reihe von praktischen Tutorials, mit denen du lernst, KI praktisch anzuwenden (z.B.: ChatGPT Masterprompts, HeyGen, NotebookLM, Midjourney…)
Daten  Datenbanken mit den besten KI-Tools und den spannendsten Firmen im KI-Umfeld.

🧂 Salty Memes:

Das Problem mit chinesischen LLMs:

Du hast Fragen, Anmerkungen oder brauchst unsere Hilfe?
Schreib uns einfach an:
[email protected]

Willkommen!

Hat dir das ein Freund oder eine Kollegin geschickt? Melde dich an und erhalte 2x Woche deine eigene Ausgabe mit den wichtigsten KI News direkt in dein Postfach.

Hilf uns dabei, besser zu werden! Was war schlecht? Was war gut? Wie fandest Du diese Ausgabe von AI Peanuts?

Login oder Abonnieren um an umfragen teilzunehmen.

Bis Freitag!