- AI Peanuts
- Posts
- Bücher kaufen, scannen, klagen: Die große Copyright-Debatte um KI-Training
Bücher kaufen, scannen, klagen: Die große Copyright-Debatte um KI-Training
So viel Inhalt in dieser Ausgabe, also halten wir uns hier mal kurz. Es geht um große Entscheidungen in der Urheberrechtsdebatte im KI-Training, um neue Möglichkeiten im Excel-Konkurrenten Airtable und um DeepMind, das sich den härtesten Problemen in der Mathematik annimmt. Also geht's direkt rein!
Peanuts für heute:
📚 Die Große Nuss: Bücher kaufen, scannen, klagen: Die große Copyright-Debatte um KI-Training
🛠️ Trai it Out: Airtable wandelt sich zur Enterprise-App-Building-Plattform.
📊 Highlight: DeepMind wagt sich an die schwersten Matheprobleme

🥜 Die größte Nuss:

📚 Bücher kaufen, scannen, klagen: Die große Copyright-Debatte um KI-Training
Es vergeht gefühlt keine Woche ohne neue Schlagzeilen: Eine weitere KI-Firma wird verklagt, ein weitere Autorin fordert Entschädigung, ein weiteres Gericht muss entscheiden, ob das Training von KI-Modellen mit urheberrechtlich geschützten Inhalten legal ist oder nicht. Diese Woche war besonders wild – und die Ergebnisse könnten die gesamte KI-Industrie umkrempeln.
Das Problem: Es ist völlig unklar, wie das Urheberrecht mit generativer KI umgehen soll. Ist es okay, mit urheberrechtlich geschützten Werken zu trainieren, wenn man nicht direkt mit ihnen konkurriert oder sie reproduziert? Wenn man diese Systeme als Werkzeuge nutzt, um etwas Neues zu schaffen – wem gehört dann das Copyright daran? Die Antwort ist alles andere als einfach, aber diese Woche gab es erste Entscheidungen.
Spoiler alert: Es wird kompliziert. Denn was in den USA als "Fair Use" durchgeht, existiert in Deutschland gar nicht. Und trotzdem machen OpenAI & Co. immer mehr Publishing-Deals. Warum eigentlich?
Warum brauchen KI-Modelle überhaupt so viel Text?
Bevor wir in die Rechtsfälle eintauchen, erstmal die Grundfrage: Warum schlucken KI-Modelle wie ChatGPT, Claude oder Llama so unvorstellbare Mengen an Texten?
Moderne Sprachmodelle lernen nicht wie Menschen durch Erklärungen, sondern durch Mustererkennung in riesigen Datenmengen. Sie analysieren Milliarden von Texten, um zu verstehen, welche Wörter statistisch gesehen aufeinander folgen. Je mehr qualitativ hochwertige Texte sie "sehen", desto besser werden sie darin, menschenähnliche Antworten zu generieren.
Die Dimension ist irre: GPT-4 wurde mit geschätzten 13 Billionen Tokens trainiert – das entspricht etwa 10 Millionen Büchern. Und das ist nur der Anfang. Die neuesten Modelle verschlingen noch mehr Daten. Genaue Zahlen gibt es kaum…aber es ist VIEL!
Das Internet reicht nicht mehr aus. Reddit-Posts und Wikipedia-Artikel sind zwar massenhaft vorhanden, aber für wirklich gute Modelle braucht man hochwertige, gut geschriebene Texte. Und die stehen meist unter Urheberrecht: Bücher, Zeitungsartikel, Fachzeitschriften, Magazine. Genau da beginnt der juristische Ärger.
Die Anthropic-Entscheidung: Bücher kaufen ist okay, Piraterie nicht
Der wohl spannendste Fall der Woche kommt von Anthropic (ja, die Macher von Claude). Ein US-Gericht hat entschieden: Das Training von KI-Modellen mit gekauften Büchern ist "Fair Use" – aber nur, wenn man die Bücher auch wirklich gekauft hat.
Anthropic hatte "viele Millionen" Dollar ausgegeben, um physische Bücher zu kaufen, riss ihnen die Bindungen ab, schnitt die Seiten zurecht und scannte sie in eine zentrale digitale Bibliothek ein. Das Gericht entschied diese Nutzung sei "spectacularly transformative", also eine Form der Bearbeitung, und das fällt unter Fair Use. Der Vergleich des Richters ist ziemlich genial: “Es ist wie wenn Schulkinder lesen lernen, um später eigene Texte zu schreiben.”
Aber – und das ist ein großes Aber – Anthropic hatte zusätzlich über 7 Millionen Bücher von Piratenseiten wie Library Genesis heruntergeladen. Das Gericht war da glasklar: "Stealing is still stealing" – auch wenn man danach etwas Cooles damit macht. Dafür drohen Anthropic Schadenersatzzahlungen von bis zu 150.000 Dollar pro Buch. Das könnten Milliarden werden.
Der Domino-Effekt: Meta & Getty Images
Diese erste wichtige Entscheidung bringt jetzt nach und nach die Copyright-Steine zum Fallen. Wenige Tage später gab es bei einem ähnlichen Prozess gegen Meta eine Entscheidung. Auch hier entschied der Richter: Meta hat nicht gegen das Urheberrecht verstoßen.
Eine Studie ergab zwar, dass Llama komplette Passagen eines Harry-Potter-Buchs wortwörtlich wiedergeben konnte. Trotzdem gewann Meta mit der Begründung, dass die Autoren nicht beweisen konnten, dass Llama ihre spezifischen Bücher reproduzieren konnte. Meta kam davon – diesmal.
Die Entscheidung wirkt sich auch auf andere Kreativindustrien aus. Getty Images zog ihre Copyright-Klage gegen Stability AI zurück. Getty hatte gehofft, einen Präzedenzfall zu schaffen – aber die Chancen stehen schlecht, wenn andere Gerichte bereits zugunsten der KI-Firmen entschieden haben.
Andere Prozesse laufen noch, z. B. von den NYTimes gegen OpenAI aus ähnlichen Gründen. Auf Basis dieser Entscheidungen sitzt Sam Altman aber nun am längeren Hebel, den er auch direkt ausnutzte. Bei einem Live-Podcast der NYTimes war Sam Altman zu Gast. In diesem Podcast wehrte sich Altman gegen "überzogene Datenschutzforderungen".
Deutschland ist kein Amerika
All diese "Fair Use"-Entscheidungen gelten nur in den USA. In Deutschland gibt es kein Fair Use-Konzept. Wir haben stattdessen Schrankenregelungen im Urheberrecht – und die sind deutlich enger gefasst. Hätten wir AI Peanuts ein paar Jahre früher gestartet, könnten wir jetzt mit unserer Leserschaft eine Sammelklage organisieren – als erstes Teamevent quasi. Wäre doch mal was!
Eine Frage haben wir uns natürlich gestellt: Wenn OpenAI & Co. wirklich glauben, dass das Training mit urheberrechtlich geschützten Inhalten legal ist – warum schließen sie dann ständig teure Publishing-Deals ab?
Mögliche Erklärungen gibt es viele. PR-Management, um negative Schlagzeilen zu vermeiden. Qualität der Daten, da lizenzierte Inhalte oft sauberer und besser strukturiert sind. Rechtssicherheit bei lizenzierten Daten ohne Klage-Risiko. Oder schlicht Zukunftssicherung, falls sich die Rechtslage ändert.
Die Copyright-Debatte ist alles andere als vorbei. KI-Firmen dürfen in jedem Fall weiter mit urheberrechtlich geschützten Werken trainieren – aber nur, wenn sie dafür bezahlt haben. Das bevorzugt die großen Player und könnte Innovation bei kleineren Unternehmen und bei Open Source bremsen.
Hilf uns dabei, besser zu werden! Was war schlecht? Was war gut? Wie fandest Du diese Ausgabe von AI Peanuts? |
Login oder Abonnieren um an umfragen teilzunehmen. |

🛠️ Trai it out:
Airtable wandelt sich zur Enterprise App Building Plattform
Das beliebte “Spreadsheet”-Tool Airtable erfindet sich im Lichte der neuen Möglichkeiten, die die aktuelle KI-Welle bietet neu und bringt einen KI-Assistenten namens Omni an den Start.
Wer Airtable noch nicht kennt - man kann es informell als “Excel auf Steroiden” bezeichnen - ein Tabellen-basiertes Tool, das aber dank diverser Plugin und Automations-Features sehr stark erweiterbar und individualisierbar ist.
Jetzt bringt es seine bisherigen Fähigkeiten mit einer Art “Vibe-Coding” Interface zusammen, das man bereits von Services wie Bolt, Lovable oder v0 kennt. Mittels Prompt lassen sich “Apps” erstellen. Der klare Fokus liegt dabei auf Business Software Anwendungen - die Beispiele umfassen z.B. Nichen-CRMs, Produktkonfiguratoren, Logistik-Tracker.

Die Apps, die man mit Airtable erzeugen kann entstehen im bisherigen Rahmen der Airtable Platform.
Der Clou dahinter: Die Apps entstehen nicht einfach im luftleeren Raum, sondern in den klaren Begrenzungen der Airtable Platform. Das macht die Ergebnisse deutlich robuster und sicherer. Airtable will sich damit noch klarer in den Enterprise Software Markt positionieren und wirbt u.a. mit der Erfüllung von Regulatorik-Anforderungen (ISO, HIPAA, SOC 2), Datensicherheit und - gerade auch für Deutsche Kunden spannend: EU-Data Residency.
Wir finden das Update sieht vielversprechend aus und erzeugt in unseren ersten Tests auch wirklich gute Ergebnisse. Was einem bewusst sein muss - der “Magie-Effekt”, den andere Vibe Coding Tools mitbringen bleibt durch die klaren Guardrails etwas aus - dafür wirken die Ergebnisse wirklich deutlich näher dran an echter Produktiv-Software.
Zusammengefasst:
Airtable erfindet sich mit seinem “Vibe Coding” Tool Omni neu
Klarer Fokus auf Enterprise Software Anwendungen
ISO-Compliance, Datensicherheit und EU-Data Residency heben es von anderen Tools ab
Weitere Infos und viele interaktive Demos gibt es hier auf der Airtable Website.
Spannende Demos:
Auch ElevenLabs steigt in das Voice Assistant Geschäft ein. Die direkte MCP Integration ist ein Top-Feature. Link
Introducing 11ai - the AI personal assistant that's voice-first and supports MCP.
This is an experiment to show the potential of Conversational AI:
1. Plan your day and add your tasks to Notion
2. Use Perplexity to research a customer
3. Search and create Linear issues— ElevenLabs (@elevenlabsio)
5:24 PM • Jun 23, 2025
Tools kurz & knackig:
Kontext Realtime — Open Source Projekt - Bilder mit Sprache bearbeiten
Automaticall — Spam Anrufe einfach von einer KI beschäftigen lassen
Google Gemini CLI — Googles Antwort auf Codex und Claude Code
Mighty — oOath Fähigkeiten für KI-Agenten
Warp — Noch ein neuer “Agentic IDE” für’s Coden

🍭🍬 Gemischte Tüte
📖 Must Reads:
Unsere Gemischte Tüte ist immer vollgepackt - in dieser neuen Sektion kuratieren wir zukünftig die aus unserer Sicht wichtigsten 3 Links:
Microsoft vs. OpenAI: Der Kampf um AGI und die Zukunft der KI-Partnerschaft: OpenAI und Microsoft befinden sich in einer hochbrisanten Verhandlung. Ein Streitpunkt ist OpenAIs heimliche Entwicklung eines direkten Konkurrenten zu Microsoft Office und Google Workspace. Parallel wird die Situation durch eine Klausel im bestehenden Vertrag brisant: Sobald OpenAI "Artificial General Intelligence" (AGI) erreicht, erlöschen automatisch Microsofts Rechte an den OpenAI-Modellen. OpenAI möchte diese AGI-Klausel nun nutzen, um sich aus der Vereinbarung zu lösen. Microsoft argumentiert, dass der wahre Maßstab darin liegt, ob die Technologie einen echten Unterschied im Leben der Menschen macht. OpenAI droht mit Kartellvorwürfen. Link
DeepMind und spanischer Mathematiker greifen nach dem Million-Dollar-Preis: Die Millennium Prize Problems sind die schwierigsten ungelösten mathematischen Probleme überhaupt. Für die Lösung jedes dieser sieben Probleme (eines wurde bereits gelöst) gibt es eine Million Dollar sowie "unsterblichen Ruhm". Javier Gómez Serrano und das Team von Google DeepMind arbeiten bereits seit drei Jahren an diesem Problem. Laut Berichten sind sie einem Durchbruch sehr nahe. Das würde beweisen, dass KI bei den schwierigsten wissenschaftlichen Herausforderungen der Menschheit helfen kann. Link
Wie akkurat waren Leopold Aschenbrenners AGI-Vorhersagen? Leopold Aschenbrenner, ein deutscher Ex-OpenAI-Mitarbeiter, veröffentlichte letztes Jahr einen detaillierten 165-seitigen Bericht. In diesem Dokument argumentierte er, dass künstliche Intelligenz bis 2027 das Niveau der Artificial General Intelligence (AGI) und sogar Superintelligenz erreichen könnte. Ein Jahr nach der Veröffentlichung, wurden Aschenbrenners Vorhersagen mit der tatsächlichen Entwicklung verglichen. Das Ergebnis: Die KI-Entwicklung folgt in bemerkenswertem Maße dem vorhergesagten Trend. Link
🇪🇺 EU-News:
Meta lockt OpenAI-Talente mit 100-Millionen-Angeboten in die Superintelligence-Abteilung – u. a. den Deutschen Lucas Beyer. Link
👩💻 Tech-News:
OpenAIs Open-Source-Modell sorgt für riesige Erwartungen – erste Tests klingen euphorisch. Link
Geleakte Infos zeigen: Grok soll bald Excel-Tabellen bearbeiten können. Elon Musks XAI-Modell wird offensichtlich produktiver. Link
Reinforcement Learning wird aktuell smarter skaliert: Statt immer neue menschliche Beispiele zu sammeln, lassen Unternehmen jetzt KI-Modelle einander beurteilen – quasi KI als Lehrer für KI. Link
Apple will sich unabhängiger von Google machen und arbeitet an einer eigenen KI-Suchmaschine. Die Übernahme von Perplexity wäre dabei ein kleverer Move. Link
Sam Altman geht Trademark-Streit um „io“ öffentlich an – mit geleakten Mails und Ansagen. Link
Amazons Ring-Türklingel verschickt jetzt KI-generierte Sicherheitswarnungen. Link
Google bringt Gemini auf Roboter – das Modell läuft lokal und optimiert direkt am Gerät. Link
Nvidia-Aktie auf Rekordhoch – Analysten sprechen von einer „Goldenen Welle“ durch KI. Link
👷 Work & Education:
Goldman Sachs rollt genAI-Assistent unternehmensweit aus – 46.000 Mitarbeitende nutzen ihn bald, auch in Hochrisiko-Jobs. Link
Walmart stellt neue KI-Tools für 1,5 Millionen Mitarbeitende vor. Link
Ex-OpenAI-Manager Peter Deng: KI verändert, wie Kinder denken – wichtiger wird nicht Wissen, sondern das Stellen guter Fragen. Link
In den Philippinen nutzen 60 Schulen Microsofts Reading Progress – Feedback beim lesen lernen in Sekunden. Link
Prompt-Tipp: Statt „Prompt Engineering“ geht’s laut Andrej Karpathy jetzt um „Context Engineering“ – also darum, deiner KI möglichst alle Infos zu geben, die sie braucht, um gute Ergebnisse zu liefern. Link
82 % der Restaurant-CEOs wollen KI-Investitionen ausbauen – trotz langsamer Umsetzung. Link
Lehrkräfte nutzen KI für Korrekturen und Unterricht – und sagen, sie werden dadurch bessere Lehrer. Link
🆕 Neue Anwendungsfelder:
🔐 AI Safety:
Anthropic-Mitgründer warnt US-Kongress: Bis Ende 2026 kommen transformative Modelle – jetzt sei der Moment für Regulierung. Link
🏥 Health & Science:
Google DeepMind bringt „AlphaGenome“ – ein neues KI-Modell, das vorhersagen kann, wie kleine Mutationen unsere Gene beeinflussen. Damit sollen aufwendige Labor-Experimente ersetzt werden. Link
🖼️ Kreativindustrie:
Die Musikindustrie arbeitet gerade an Tools zur Erkennung von KI-generierten Songs – Lizenzierungen und Urheberrecht sollen automatisiert geprüft werden. Link
Deezer: 18 % aller Uploads sind komplett KI-generiert – neue Tools sollen Fake-Tracks erkennen. Link
Disney spricht mit OpenAI über mögliche KI-Partnerschaften rund um Disney-Charaktere. Link
Higgsfield veröffentlicht „Soul“ – ein fotorealistisches Modell mit über 50 Stilpresets für KI-Fotografie. Link
🔥 Takes:
John Oliver widmet eine ganze Folge dem Thema „AI Slop“ – also dem Schrott, den viele KI-Systeme aktuell produzieren. Unterhaltsam. Link
📊 Charts:
ChatGPT wurde in den letzten 28 Tagen 29 Mio. × auf iOS heruntergeladen – fast mehr als TikTok, Insta und Facebook zusammen. Link


🧂 Salty Memes:


Du hast Fragen, Anmerkungen oder brauchst unsere Hilfe?
Schreib uns einfach an:
[email protected]
Willkommen!
Hat dir das ein Freund oder eine Kollegin geschickt? Melde dich an und erhalte 2x Woche deine eigene Ausgabe mit den wichtigsten KI News direkt in dein Postfach.

Bis Dienstag!