O que a The Atlantic publicou afinal?
Durante dois anos a indústria discutiu os dados de treino da IA sem nunca conseguir apontá-los. Isso acabou de mudar. O AI Watchdog da The Atlantic, um projeto do jornalista Alex Reisner, transformou quatro bases opacas numa única caixa de pesquisa pública. Escreve um artista ou um título e ela diz quantas correspondências há em cada base. O projeto nasceu em 2025 a rastrear livros, artigos científicos e vídeo; a extensão à música, em junho de 2026, transforma um boato que toda a gente repetia em algo verificável em dez segundos.
Os números são duros. Nas quatro coleções há mais de 21 milhões de gravações. Duas passam das 100 000 faixas cada; as outras duas são enormes, à volta de 9 e 12 milhões. O catálogo vai de Taylor Swift, Bad Bunny, Nirvana, Billie Eilish e os Beatles ao jazz, ao clássico e a dezenas de milhares de nomes que ninguém reconheceria fora dos seus seguidores no Bandcamp.
Como foi essa música parar ali?
A maior base, LAION-DISCO-12M, foi publicada em novembro de 2024 pela LAION, a organização alemã por trás dos conjuntos de imagens que treinaram uma geração de geradores visuais. É uma lista de cerca de 12 milhões de faixas do YouTube, aspiradas e passadas a quem quiser construir um modelo. Uma segunda base foi montada extraindo letras e metadados diretamente do Genius. É essa a matéria-prima com que empresas como a Suno e a Udio são acusadas de ter treinado, e os processos das editoras giram exatamente em torno desta pergunta: o que entrou na máquina?
Durante anos, "a tua música deve estar lá" era um encolher de ombros. Agora é um resultado de pesquisa com um número ao lado.
Porque é que isto atinge mais os produtores underground
Uma grande editora tem um departamento jurídico para correr atrás de um acordo. O produtor que pôs uma EP de deep house no YouTube em 2019 não tem nada, e é ele que hoje olha para uma entrada numa base de dados. Hainbach, o experimentador de instrumentos berlinense adorado pela cena modular, pesquisou o seu nome e encontrou 151 faixas num só conjunto. Multiplica isto por cada pequeno artista eletrónico que alguma vez publicou um set ou um pack de loops e percebes porque é que o tom, online, passou da curiosidade à raiva num dia. A ferramenta não faz com que ninguém receba nem que nada seja removido. O que faz é acabar com a negação, e numa luta que finalmente chega a tribunal neste verão, uma prova é uma alavanca.



