Was hat The Atlantic eigentlich veröffentlicht?
Zwei Jahre lang stritt die Musikbranche über KI-Trainingsdaten, ohne je darauf zeigen zu können. Das hat sich geändert. Der AI Watchdog von The Atlantic, ein Projekt des Journalisten Alex Reisner, machte aus vier undurchsichtigen Trainingsdatenbanken ein einziges öffentliches Suchfeld. Tippe einen Künstler oder einen Titel ein, und es nennt dir die Zahl der Treffer in jedem Datensatz. Das Projekt startete 2025 mit Büchern, Forschungsarbeiten und Video; die Erweiterung auf Musik im Juni 2026 macht aus einem Gerücht, das alle nachplapperten, etwas, das man in zehn Sekunden prüfen kann.
Die Zahlen sind unmissverständlich. In den vier Sammlungen liegen mehr als 21 Millionen Aufnahmen. Zwei überschreiten je 100 000 Tracks; die anderen beiden sind gewaltig, bei rund 9 und 12 Millionen. Der Katalog reicht von Taylor Swift, Bad Bunny, Nirvana, Billie Eilish und den Beatles bis zu Jazz, Klassik und Zehntausenden Namen, die niemand außerhalb ihrer Bandcamp-Follower kennt.
Wie ist diese Musik dort gelandet?
Den größten Datensatz, LAION-DISCO-12M, veröffentlichte im November 2024 LAION, die deutsche Organisation hinter den Bilddatensätzen, die eine ganze Generation von Bildgeneratoren trainierten. Es ist eine Liste von rund 12 Millionen YouTube-Tracks, abgegriffen und an jeden weitergereicht, der ein Modell bauen will. Ein zweiter Datensatz entstand, indem Songtexte und Metadaten direkt von Genius gezogen wurden. Das ist das Rohmaterial, mit dem Firmen wie Suno und Udio trainiert haben sollen, und die Klagen der Majors drehen sich genau um diese Frage: Was ist in die Maschine geflossen?
Jahrelang war "deine Musik ist wahrscheinlich da drin" ein Schulterzucken. Jetzt ist es ein Suchergebnis mit einer Zahl daneben.
Warum es Underground-Producer am härtesten trifft
Ein Major-Label hat eine Rechtsabteilung, die einen Vergleich verfolgt. Der Producer, der 2019 eine Deep-House-EP auf YouTube geladen hat, hat nichts, und genau er starrt jetzt auf einen Eintrag in einer Datenbank. Hainbach, der bei der Modular-Szene beliebte Berliner Instrumententüftler, gab seinen Namen ein und fand 151 Songs in einem einzigen Datensatz. Rechne das auf jeden kleinen Elektronik-Künstler hoch, der je ein Set oder ein Loop-Pack gepostet hat, und du verstehst, warum die Stimmung online binnen eines Tages von Neugier in Wut umschlug. Das Werkzeug sorgt weder für Bezahlung noch für Löschung. Es beendet das Abstreiten, und in einem Streit, der diesen Sommer endlich vor Gericht kommt, ist ein Beleg ein Hebel.



