Cosa ha pubblicato davvero The Atlantic?
Per due anni l'industria musicale ha parlato dei dati di addestramento dell'IA senza poterli mai indicare. Ora è cambiato. L'AI Watchdog di The Atlantic, progetto guidato dal giornalista Alex Reisner, ha trasformato quattro banche dati opache in un'unica barra di ricerca pubblica. Digiti un artista o un titolo e ti dice quante corrispondenze ci sono in ogni set. Il progetto è nato nel 2025 sui libri, gli articoli scientifici e il video; l'estensione alla musica, a giugno 2026, trasforma una voce che tutti ripetevano in qualcosa di verificabile in dieci secondi.
I numeri sono netti. Le quattro raccolte contano più di 21 milioni di registrazioni. Due superano i 100 000 brani ciascuna; le altre due sono enormi, intorno ai 9 e ai 12 milioni. Il catalogo va da Taylor Swift, Bad Bunny, Nirvana, Billie Eilish e i Beatles fino al jazz, alla classica e a decine di migliaia di nomi che nessuno riconoscerebbe fuori dai loro follower su Bandcamp.
Come ci è finita quella musica?
Il set più grande, LAION-DISCO-12M, è stato pubblicato a novembre 2024 da LAION, l'organizzazione tedesca dietro i set di immagini che hanno addestrato una generazione di generatori visivi. È una lista di circa 12 milioni di brani YouTube, aspirati e passati a chiunque voglia costruire un modello. Una seconda banca dati è stata messa insieme estraendo testi e metadati direttamente da Genius. È la materia prima su cui aziende come Suno e Udio sono accusate di essersi addestrate, e le cause delle major ruotano proprio attorno a questa domanda: cosa è entrato nella macchina?
Per anni "la tua musica è probabilmente lì dentro" era un'alzata di spalle. Ora è un risultato di ricerca con un numero accanto.
Perché colpisce di più i producer underground
Una major ha un ufficio legale che insegue un accordo. Il producer che ha caricato una EP deep house su YouTube nel 2019 non ha nulla, ed è lui che oggi fissa una riga in una banca dati. Hainbach, lo sperimentatore di strumenti berlinese amato dalla scena modulare, ha cercato il suo nome e trovato 151 brani in un solo set. Moltiplicalo per ogni piccolo artista elettronico che ha mai postato un set o un pacchetto di loop e capisci perché online il tono è passato dalla curiosità alla rabbia in un giorno. Lo strumento non fa pagare né rimuovere nessuno. Quello che fa è togliere ogni possibilità di negare, e in una battaglia che finalmente arriva in tribunale quest'estate, una prova è una leva.



