• AI Peanuts
  • Posts
  • Halluzinationen - Feature oder Bug?

Halluzinationen - Feature oder Bug?

Es ist unheimlich viel passiert diese Woche! Wichtige große Nuss noch dazu.
Direkt los:

Peanuts für heute:

  • 🤔 Halluzinationen – Feature oder Bug?

  • 🙏 GPT5 Gerüchte haben mehr Beine als gedacht…

  • 🛠️ Mit Oscar Stories schöne Kindergeschichten & Hörbücher generieren

🥜 Die größte Nuss:

🤔 Halluzinationen – Feature oder Bug?

Über 30.000 Ärzte und 40 Krankenhäuser setzen mittlerweile auf das OpenAI-Modell Whisper - mit gravierenden Folgen. Mit einem speziell auf medizinische Sprache abgestimmten Whisper-Tool werden Patientengespräche transkribiert und zusammengefasst. Doch nun fällt auf, dass Whisper bei der Transkription teilweise „halluziniert“. Das Problem? Auf die Originaldaten von 7 Millionen Gesprächen kann man nicht mehr vollständig vertrauen.

Trotzdem könnten Halluzinationen das vielleicht Beste an großen Sprachmodellen sein. Warum? Darum geht es heute!

Wenn die KI kreativ wird – manchmal zu kreativ
Eine aktuelle Studie hat für Aufsehen gesorgt: OpenAIs Whisper, ein KI-Tool zur Transkription von Sprache, neigt dazu, sich Dinge einfach auszudenken. Forscher der University of Michigan fanden heraus, dass in acht von zehn Audiotranskriptionen "halluzinierte" Inhalte auftauchten – also Text, den sich die KI komplett ausgedacht hat.

Das kann harmlos sein, aber auch dramatische Folgen haben: In einem Fall fügte Whisper einer neutralen Beschreibung von "zwei Mädchen und einer Dame" plötzlich einen nie-gesagten Satz zur angeblichen Hautfarbe hinzu. In einem anderen Fall erfand das System eine nicht existierende Medikamentenklasse namens "hyperaktivierte Antibiotika".

Feature oder Bug? Die zwei Seiten der Medaille
Was auf den ersten Blick wie ein gravierender Fehler aussieht, hat einen interessanten Hintergrund: Die gleichen Mechanismen, die KI-Systeme zu kreativen Leistungen befähigen, führen auch zu diesen Halluzinationen. Einige KI-Experten argumentieren sogar, dass Halluzinationen ein notwendiges "Feature" sind – ohne sie gäbe es keine KI-Kreativität.

In der “deterministischen” Welt der Computer, die wir bisher gewohnt waren galt: Computer machen keine Fehler. Eine Excel-Tabelle rechnet korrekt, ein Programm führt seinen Code exakt aus. Aber: Moderne KI-Systeme funktionieren fundamental anders – sie sind eher mit Menschen vergleichbar. Sie interpretieren, assoziieren und sie machen auch Fehler.

Aber Halluzinationen können noch mehr. Und wie? Durch kontrolliertes Chaos. Vor knapp einem Jahr haben wir über ein DeepMind-Projekt namens Fun-Search berichtet.

Das Modell wurde bewusst zu "Halluzinationen" angeregt, um neue Entdeckungen in ungelösten Mathematikproblemen zu finden. Die halluzinierten, teils zufälligen Algorithmen wurden sofort getestet, einer nach dem anderen. Und siehe da – es wurde tatsächlich ein bis dahin ungelöstes Problem gelöst. Die Halluzinationen brachten eine Prise kreatives Chaos ins Spiel.

Googles FunSearch

Wo man dieses Chaos aber gar nicht gebrauchen kann, ist im medizinischen Bereich: Wenn KI-Systeme Arztgespräche transkribieren und dabei Diagnosen oder Medikamente "erfinden", kann das gefährliche Folgen haben. Und trotz Warnungen der Erfinder von Whisper selbst – OpenAI – setzen viele Anwenderinnen und Anwender im Gesundheitssystem schon heute auf Whisper-basierte Tools.

Wichtig ist: Um ein mündiger Anwender von KI zu sein, muss man weder Deep-Techie noch WissenschaftlerIn sein. Aber: Es ist wichtig, zumindest grob zu verstehen, wie KI-Systeme funktionieren und wo die Stärken und Schwächen liegen. Nur dann kann man, wie z.B. im Fall des aktuellen Whisper-Modells, für sich einschätzen, in welchen Bereichen man das Tool unkritisch einsetzen kann und wann man besser noch mal auf das Ergebnis schaut.

AI Peanuts Workbook

Vollgepackt mit KI-Wissen, Tools & Tutorials!

Du hast angefangen, dich tiefer mit dem Thema KI zu beschäftigen und willst den nächsten Schritt machen? Dann ist unser offizielles AI Peanuts Workbook genau das Richtige für dich!

Das Workbook ist kein klassisches “Buch”, sondern ein praxisorientiertes, interaktives digitales Dokument. Gegliedert in 3 Teile:

Theorie — Der Textbuch-Teil des Workbooks, in dem wir das Thema KI und seine technischen Grundlagen erklären.
Praxis — Eine Reihe von praktischen Tutorials, mit denen du lernst, KI praktisch anzuwenden (z.B.: ChatGPT Masterprompts, HeyGen, NotebookLM, Midjourney…)
Daten  Datenbanken mit den besten KI-Tools und den spannendsten Firmen im KI-Umfeld.

🛠️ Trai it out:

Oscar Stories — Schöne Geschichten für Kinder erzeugen - mit KI. Diese Idee wurde nicht nur von einem Team umgesetzt, aber besonders bei Oscar Stories finden wir das Ergebnis sehr gelungen. In wenigen einfachen Schritten erzeugt man so personalisierte Geschichten und Hörbücher inklusive passender Illustrationen.

Dahinter steckt ein deutschsprachiges Indie-Team aus Wien.

Weitere Neue Tools, Updates & Demos:

  • Vocalo — Englisch Lernen mit KI-Unterstützung

  • Unbounded — Spannendes Research Paper von Google zu “unendlichen Spielen” dank KI

  • InternLM — neues Open Source LLM mit angeblich 1Mio. Token Kontextfenster(!)

  • NotebookLlama Open Source Variante von Google’s NotebookLM - von Meta erzeugt als Beispiel für den Einsatz des OS LLM Llama

Prompting & Kurse:

  • Dateinamen in Prompts einfügen führt bei Flux 1.1 Pro zu “besseren” Ergebnissen, die weniger nach “KI-generiert” aussehen. Wild. Link

  • Dieser Prompt führt zu besseren KI-Zusammenfassungen. Wild No. 2. Link

🍭🍬 Gemischte Tüte

🇪🇺 EU-News:

  • Chiptests mit künstlichen Diamanten – das Münchner Startup Quantum Diamonds verfolgt ehrgeizige Ziele in der Chipindustrie, ähnlich wie ASML. Link

  • Boston Dynamics setzt erstmals Spot und Stretch gemeinsam in Europa ein. Hier ein Video, wie die Otto Group sie einsetzen.Link

👩‍💻 Tech-News:

  • Metas Ray-Ban-Brille verkauft sich überraschend gut – Luxottica berichtet, dass sie in vielen ihrer Geschäfte der absolute Bestseller ist. Link

  • OpenAI plant, sein nächstes großes KI-Modell – Codename Orion – noch bis Dezember auf den Markt zu bringen, passend zum zweijährigen Jubiläum von ChatGPT. Allerdings bestreiten die das aktuell. Es gibt aber die schöne Redewendung: No rumour ist true, until officially denied. Wir werden sehen. Link

  • McKinsey beleuchtet die nächsten großen Felder für den Wettbewerb und liefert spannende Einblicke. Link

  • Google tritt mit „Project Jarvis“ in den Wettstreit um KI-gesteuerte Computersteuerung ein. Link

  • Und Apples neues KI-System Ferret-UI 2 kann Apps auf iPhones, iPads, Android und Apple TV steuern. Link

  • Eine ungewöhnliche Geschichte bei Bytedance: Ein „Praktikant“ in der KI-Forschungsabteilung soll eine aufwändige Sabotage-Kampagne gestartet haben. Link

  • Perplexity verteidigt seine KI-Suchmethoden und betont, dass öffentliche Fakten nicht hinter einer Paywall liegen sollten, und zeigt sich offen für Kooperationen mit Dow Jones. Wir sind hier etwas skeptisch. Journalistische Inhalte kosten nunmal Geld und müssen nicht automatisch für jeden kostenlos verfügbar sein. Link

  • Immer mehr Unternehmen erzielen Fortschritte mit humanoiden Robotern, und China unterstützt eine Welle neuer Start-ups in diesem Bereich durch gezielte Industriepolitik. Link

  • Google veröffentlicht sein System zur Wasserzeichenerkennung für KI-generierte Bilder als Open-Source-Tool. Wir sind gespannt, wie wirksam das wirklich sein wird. Link

  • Etwas kurios, werden wir aber bestimmt noch häufiger sehen: Reddit-Nutzer schreiben bewusst gefälschte Bewertungen, um Googles KI-Übersicht dazu zu bringen, das Londoner Restaurant „Angus Steakhouse“ zu empfehlen und Touristen von ihren Lieblings-Steakhäusern fernzuhalten. Link

  • Ein indisches Pharmaunternehmen soll Russland mit Nvidia-KI-Chips versorgen, indem es Dell-Server mit KI-Funktionen weiterverkauft. Link

  • Der Humane-Wearable „Pin“ hat sich nicht bewährt und setzt nun erwartungsgemäß auf die Lizenzierung der Software. Link

  • TSMC meldet erste Erfolge: Die Ausbeute in der neuen Fabrik in Arizona entspricht inzwischen derjenigen in Taiwan – ein wichtiger Meilenstein, auch wenn Analysten die Vergleichbarkeit kritisch hinterfragen. Wäre beeindruckend, wenn unsere Abhängigkeit von Taiwan Link

  • Apple bringt eine neue Serie von Macs und MacBooks mit dem M4-Chip heraus – entwickelt, um die kommenden KI-Features optimal zu unterstützen. Link

  • Zalando und Klarna haben KI-basierte Einkaufsassistenten gestartet, während Otto seinen zurückgezogen hat. LinkChiptests mit künstlichen Diamanten – Quantum Diamonds verfolgt ehrgeizige Ziele in der Chipindustrie, ähnlich wie ASML. Link

🔐 Cybersecurity & AI Safety:

  • KI-Modelle sind genauso anfällig für Betrügereien wie wir – einige Modelle sind sogar besonders leicht zu täuschen. Link

  • Apple bietet Sicherheitsexperten bis zu 1 Million Dollar, um sein privates KI-Cloud-System zu hacken. Link

🖼️ Kreativindustrie:

  • Eine neue Studie zeigt, dass KI nur 200-600 Beispiele benötigt, um die markanten Merkmale eines Künstlers oder einer Person nachzubilden. Link

  • OpenAIs neues KI-Modell generiert Bilder 50-mal schneller als die Vorgängerversion. Link

🧂 Salty Memes:

Du hast Fragen, Anmerkungen oder brauchst unsere Hilfe?
Schreib uns einfach an:
[email protected]

Willkommen!

Hat dir das ein Freund oder eine Kollegin geschickt? Melde dich an und erhalte 2x Woche deine eigene Ausgabe mit den wichtigsten KI News direkt in dein Postfach.

Hilf uns dabei, besser zu werden! Was war schlecht? Was war gut? Wie fandest Du diese Ausgabe von AI Peanuts?

Login oder Abonnieren um an umfragen teilzunehmen.

Bis Freitag!