¿Qué publicó realmente The Atlantic?

Durante dos años la industria discutió sobre los datos de entrenamiento de la IA sin poder señalarlos. Eso acaba de cambiar. El AI Watchdog de The Atlantic, un proyecto del periodista Alex Reisner, convirtió cuatro bases opacas en una única caja de búsqueda pública. Escribes un artista o un título y te dice cuántas coincidencias hay en cada set. El proyecto nació en 2025 rastreando libros, artículos científicos y vídeo; su ampliación a la música, en junio de 2026, convierte un rumor que todos repetían en algo verificable en diez segundos.

Las cifras son contundentes. Entre las cuatro colecciones hay más de 21 millones de grabaciones. Dos superan los 100 000 temas cada una; las otras dos son enormes, en torno a 9 y 12 millones. El catálogo abarca a Taylor Swift, Bad Bunny, Nirvana, Billie Eilish y los Beatles, junto a jazz, clásica y decenas de miles de nombres que nadie reconocería fuera de sus seguidores de Bandcamp.

¿Cómo acabó ahí esa música?

La base mayor, LAION-DISCO-12M, la publicó en noviembre de 2024 LAION, la organización alemana detrás de los sets de imágenes que entrenaron a toda una generación de generadores visuales. Es una lista de unos 12 millones de temas de YouTube, aspirados y repartidos a cualquiera que quiera construir un modelo. Una segunda base se montó extrayendo letras y metadatos directamente de Genius. Esa es la materia prima con la que se acusa de entrenar a empresas como Suno y Udio, y las demandas de los sellos giran justo en torno a esa pregunta: ¿qué entró en la máquina?

Durante años, "tu música seguramente esté ahí" era un encogimiento de hombros. Ahora es un resultado de búsqueda con un número al lado.

Por qué golpea más fuerte a los productores underground

Una gran discográfica tiene un departamento legal para perseguir un acuerdo. El productor que subió una EP de deep house a YouTube en 2019 no tiene nada, y es él quien hoy mira una entrada en una base de datos. Hainbach, el experimentador berlinés adorado por la escena modular, buscó su nombre y encontró 151 temas en un solo set. Multiplícalo por cada pequeño artista electrónico que alguna vez colgó un set o un pack de loops y entenderás por qué el ánimo en redes pasó de la curiosidad a la rabia en un día. La herramienta no hace que cobren ni que retiren nada a nadie. Lo que hace es acabar con la negación, y en una pelea que por fin llega a los tribunales este verano, una prueba es una palanca.