• AI Peanuts
  • Posts
  • 🤯 Anthropic: Dieser KI-Usecase hat uns auf Ideen gebracht!

🤯 Anthropic: Dieser KI-Usecase hat uns auf Ideen gebracht!

Freunde! Was eine Woche. Vom Trump-Sieg über das Ampel aus gäbe es vieles, was wir hier tiefer kommentieren könnten. Aber - Schuster bleib bei deinen Leisten - und weil wir ein KI-Newsletter und kein Politik Newsletter sind, belassen wir es dabei. Zum Glück bietet aber auch KI alleine wieder genug Neuigkeiten, um einen spannenden Newsletter zu füllen, also los!

Peanuts für heute:

  • 🤯 Anthropic: Dieser KI-Usecase hat uns auf Ideen gebracht!

  • 🟠 Trump und KI?! Was bedeutet seine Rückkehr für die Branche?

  • 🤑 OpenAI hat den Domain-Namen "Chat.com" für 15 Millionen USD gekauft

🥜 Die größte Nuss:

🤯 Anthropic: Dieser KI-Usecase hat uns auf Ideen gebracht!

Jeden Monat gibt es ein neues Hype-Thema in der KI. Eigentlich rechnen wir seit einem Jahr damit, dass die Industrie mal ein bisschen zur Ruhe kommt. Aber zum Glück passiert das einfach nicht.

Erst war es die Multimodalität, dann die größeren Kontextfenster, leichteres Prompten, immer wieder mal Agenten, und aktuell ist es der Modellzugriff auf den Computer selbst.

Diese Woche haben wir einen Use Case entdeckt, der uns auf so viele Ideen gebracht hat, dass wir euch davon berichten müssen. Vielleicht bringt er euch genauso viel wie uns.

Um was geht es: Heute sind KI-Modelle nicht mehr auf einzelne Sprachen oder Medien spezialisiert - die Modelle können sie alle verarbeiten. Sie sind multimodeal - vereinen also Funktionen, die früher auf verschiedene Modelle verteilt waren.

Moderne KI-Systeme können Text, Bilder und Audio verarbeiten und erzeugen. Sie schreiben Code, bedienen Computer, greifen auf das Internet zu und so weiter. Die Bausteine sind alle da, und wir sehen, wie sie allmählich zusammenwachsen.

Und was kann man damit tun? Ethan Mollick, Professor an der Wharton School, einer der Top-Business-Schools in den USA, beschäftigt sich schon lange mit den Auswirkungen von KI auf Arbeit, Bildung und unser Leben. In einem aktuellen Artikel taucht Mollick in die Möglichkeiten des neuen Anthropic-Modells Claude 3.5 Sonnet ein.

Was macht Claude 3.5 Sonnet besonders? Das große Kontextfenster (also wie viel Text das Modell auf einmal „lesen“ kann), die Multimodalität (die Fähigkeit, verschiedene Medien zu analysieren) und die Möglichkeit, die Claude-App direkt auf dem Computer zu installieren. Claude kann also nicht nur Inhalte im Browser sehen, sondern auch, was auf deinem Computer außerhalb des Browsers läuft.

Das ist Mollick’s neuer Usecase: Er füttert Claude mit einem YouTube-Video von einer Baustelle und fordert es auf: „Schau dir die Baustelle an und achte auf Sicherheitsprobleme.“ Ohne spezielles Training analysiert Claude die Sicherheitsmaßnahmen, die Position von Materialien, Arbeitsmuster und potenzielle Gefahren. In wenigen Sekunden erstellt die KI eine Übersicht mit allen Beobachtungen – ein Job, für den Menschen deutlich länger brauchen würden.

Claude analysiert ein Video von einer Baustelle

Da Claude Zugang zum Computer hat, macht die KI alle paar Sekunden einen Screenshot von dem Video . Claude schafft es dann verschiedene Aspekte der Baustelle zu analysieren und einzuschätzen: die Verwendung von Schutzausrüstungen durch die Arbeiter, die Platzierung von Materialien, Arbeitsabläufe und potenzielle Gefahren - und notiert alles. Sorry…aber das klingt doch wie Zauberei.

Das hat uns auf einige Ideen gebracht. Tagtäglich erstellen wir Powerpoint Präsentationen, erstellen Inhalte für Social Media und werkeln an unseren Websiten herum. Feedback holen wir uns dazu aber selten ein. Mit Anthropics Computer use Feature könnte die KI selbstständig auf unsere Inhalte zugreifen - sich in Rollen reinversetzen (“Du hast kein Wissen von meiner neuen App. Was fällt dir auf? Was lässt sich nicht leicht verstehen? Wo wirst du stutzig? Gib mir ausführliches Feedback”) und uns ständig Verbesserungsvorschläge machen.

Wir kennen viele Beispiele, in denen es sich einfach nicht lohnen würde, etwas 24 Stunden am Tag von Menschen überwachen zu lassen. Optimierung von Parkplätzen, Überwachungskameras, Verkehr, vielleicht einfach uns selbst im Workflow um produktiver zu werden?

Welche Use Cases fallen euch noch ein? Schreibt uns an [email protected].

AI Peanuts Workbook

Vollgepackt mit KI-Wissen, Tools & Tutorials!

Du hast angefangen, dich tiefer mit dem Thema KI zu beschäftigen und willst den nächsten Schritt machen? Dann ist unser offizielles AI Peanuts Workbook genau das Richtige für dich!

Das Workbook ist kein klassisches “Buch”, sondern ein praxisorientiertes, interaktives digitales Dokument. Gegliedert in 3 Teile:

Theorie — Der Textbuch-Teil des Workbooks, in dem wir das Thema KI und seine technischen Grundlagen erklären.
Praxis — Eine Reihe von praktischen Tutorials, mit denen du lernst, KI praktisch anzuwenden (z.B.: ChatGPT Masterprompts, HeyGen, NotebookLM, Midjourney…)
Daten  Datenbanken mit den besten KI-Tools und den spannendsten Firmen im KI-Umfeld.

🛠️ Trai it out:

Flux 1.1 Pro Ultra (Raw) — Das führende KI-Bildmodell Flux (deutsches Team!) bleibt auch weiter führend. Mit der neuen Ultra Version lassen sich extrem gute Ergebnisse mit hoher Auflösung erzeugen. Und mit der “raw”-Variante kommen dabei Ergebnisse heraus, die jetzt deutlich weniger “nach KI aussehen”. Also weniger überzeichnet sind und generell realistischer wirken. Ausprobieren lohnt sich - das geht z.B. auf Replicate oder Flux1.

Einige spannende Ergebnisse gibt es auch hier zu sehen.

Weitere Neue Tools, Updates & Demos:

  • PaperGen — Paper mit korrekten Quellen schreiben einfach gemacht mit KI

  • PopPopAI Hilft beim Isolieren von Musik & Gesang u.a. für die Musikproduktion oder Remixes spannend

  • RivalSense — Diese KI monitored eure Konkurrenz

  • CopilotKitFür Entwickler - Ein Toolset, um KI-Agenten in die eigenen React Apps zu integrieren

🍭🍬 Gemischte Tüte

🇪🇺 EU-News:

  • FLUX1.1 (siehe Tool der Ausgabe!) von der deutschen Firma BlackForestLabs hat jetzt zwei neue Modi: Der Ultra-Modus erzeugt Bilder in 4 Megapixeln (viermal höhere Auflösung) ohne Geschwindigkeitseinbußen, und der Raw-Modus sorgt dafür, dass Menschen und Natur deutlich weniger „AI-artig“ wirken. Link 

👩‍💻 Tech-News:

  • Meta öffnet sein Llama-AI-Modell für den US-Verteidigungssektor. Erste Anwendungen beinhalten die Analyse von Flugzeugdokumenten und Bedrohungsanalysen. Interessant: Diese Entscheidung kommt nach Berichten chinesischer Forscher, die Llama 2 für militärische Zwecke nutzen. Link 

  • Eine Sammlung spannender Artikel zur Zukunft der KI von der Financial Times. Link 

  • OpenAI hat den Domain-Namen "Chat.com" von HubSpots Mitgründer übernommen – die ungewöhnliche Verkaufsstrategie beinhaltete Anteile am Unternehmen. Nun leitet die Seite direkt zu ChatGPT um. Angeblich war der Verkaufspreis 15 Millionen Dollar.
    Link

  • Trump und KI?! Was bedeutet seine Rückkehr für die Branche?
    Trumps Philosophie im Bereich KI: Weniger Regulierung, mehr Wettbewerb mit China. Er plant, Bidens KI-Richtlinien sofort zu kippen und setzt auf militärfokussierte Projekte à la "Manhattan Project" für KI. Außerdem wichtig: Er will, dass KI Firmen sich inzwischen selbst testen. Link

  • Microsoft verschiebt erneut den Start von "Recall", einem KI-Feature, das deine Windows-Ansicht versteht, dafür aber auch ständig screenshots macht. Nicht einfach, so ein Feature mit gutem Datenschutz zu vereinen. Link 

  • Ein neues Forschungspapier zeigt: KI-Modelle „wissen“ intern oft die richtige Antwort, liefern aber auf irgendeine Weise trotzdem oft die falsche. Link 

  • Eine Amazon- und Meta-Kooperation zu Atomenergie ist von Regulierungsbehörden blockiert worden. Der Grund: Bedenken über potenzielle Stromausfälle und den Schutz seltener Bienen bei der Meta-Initiative. Link 

  • Jeff Bezos und andere Investoren haben 400 Millionen US-Dollar in das Startup Physical Intelligence gesteckt, das sich auf die Entwicklung von KI-gestützten Gehirnen für Roboter spezialisiert. Link 

  • Google Gemini analysiert jetzt automatisch Meeting-Aufzeichnungen und verwandelt diese in Zusammenfassungen mit strategischen Insights und To-dos. Link 

  • OpenAI arbeitet an einem großen DALL-E-Update, das laut Sam Altman „das Warten wert“ sein soll. Außerdem sollen AI-Agenten, die autonom Aufgaben erledigen und Nutzer zuerst kontaktieren, ein großes Thema für 2025 werden. Link 

  • OpenAI hat Metas ehemaligen Leiter für AR/VR-Hardware eingestellt, was auf einen Push in Richtung physischer Geräte hinzudeuten scheint. Link 

  • OpenAI hat außerdem Gabor Cselle, den Mitbegründer des Twitter-Konkurrenten Pebble, eingestellt – ein möglicher Hinweis darauf, dass OpenAI an einem eigenen Social-Media-Projekt arbeiten könnte. Link 

  • Dank des stabilen Wachstums im AI-Bereich ist NVIDIA nun die wertvollste Firma der Welt, noch vor Apple. Aktuelle Marktkapitalisierung: 3,58 Billionen Dollar. Link

  • Google startet ein AI Hub in Saudi-Arabien, um neue KI-Modelle zu erforschen und an „Saudi-spezifischen Anwendungen“ zu arbeiten. Link 

  • Apple bereitet Entwickler auf Siri-Upgrade vor: Neue Entwickler-Tools sollen Siri helfen, Bildschirminhalte besser zu verstehen und direkt mit sichtbaren Inhalten zu interagieren – ohne Screenshots und zusätzlichen Workarounds. Link 

  • Tencent stellt das open-source Modell Hunyuan-Large vor: Mit einem Mix aus 389B Parametern und innovativer Mixture-of-Experts-Architektur könnte dieses Modell Branchenriesen wie Llama-405B herausfordern. Besonders beeindruckend ist die Unterstützung von 256K Tokens und seine starke Performance in Mathematik, Kodierung und Logik. Link 

  • Apple will in den Markt für Smartglasses einsteigen: Ein internes Forschungsprojekt namens „Atlas“ erkundet die Möglichkeiten von Smartglasses, um möglicherweise einen schlankeren Nachfolger zur Vision Pro auf den Markt zu bringen. Link 

👷 Work & Future of Work:

  • T-Mobile investiert 100 Millionen US-Dollar in OpenAIs KI für den Kundenservice. Link 

  • Das generative KI-Budget von 50 Unternehmen – Vom Coca-Cola bis Walmart und ihre Ausgaben für generative KI-Technologien. Link 

🆕 Neue Anwendungsfelder:

  • Microsoft bringt "Magnetic-One" raus, eine Multi-Agenten-KI, die verschiedene spezialisierte Agenten koordiniert, um komplexe Aufgaben zu bewältigen – von Coding bis Essen bestellen. Link 

  • Amazons Prime Video integriert KI-Recaps: Mit der neuen X-Ray Funktion kannst du KI-generierte Zusammenfassungen von Episoden oder ganzen Staffeln lesen. Falls man mal wieder vergessen hat, was in der letzten Staffel so passiert ist. Link 

  • Nvidia stellt ein neues Toolkit für Robotik und KI vor, das unter anderem spezielle Funktionen für humanoide Roboter umfasst und sich mit Hugging Face zusammentut, um offene Robotics-Lösungen zu beschleunigen. Link 

  • Google hat versehentlich seine neue KI "Jarvis" vor dem geplanten Release im Dezember veröffentlicht. Jarvis kann eigenständig Computer steuern und Aufgaben im Web erledigen. Link 

🔐 Cybersecurity & AI Safety:

  • Google enthüllt mit seinem Projekt 'Big Sleep' zum ersten Mal eine echte Schwachstelle in der Open-Source-Datenbank SQLite. Das KI-Tool entdeckte autonom sicherheitskritische Fehler – ein echter Durchbruch in Sachen KI für Cybersicherheit. Link 

🖼️ Kreativindustrie:

  • Perplexity-CEO bietet Hilfe an, um streikendes NYT-Personal mit KI zu ersetzen. Das Angebot erscheint besonders brisant, da Perplexity und die NYT bereits im Rechtsstreit über Inhalte-Nutzung stecken. Link 

🧂 Salty Memes:

Du hast Fragen, Anmerkungen oder brauchst unsere Hilfe?
Schreib uns einfach an:
[email protected]

Hilf uns dabei, besser zu werden! Was war schlecht? Was war gut? Wie fandest Du diese Ausgabe von AI Peanuts?

Login oder Abonnieren um an umfragen teilzunehmen.

Bis Freitag!