Latent Terrain : jouer de l'IA audio comme d'un instrument, gratuit et hors ligne

L’essentiel

01Latent Terrain est un outil gratuit et open source pour Max et Max for Live qui transforme l'espace latent d'un modèle audio neuronal en une surface jouable, pilotée au pad XY, au stylet ou avec n'importe quel contrôleur.

02Il s'appuie sur nn~ et sur des modèles pré-entraînés comme RAVE (de l'IRCAM), Music2Latent et l'autoencodeur Stable Audio Open, et transforme vos propres sons au lieu de générer à partir d'un texte.

03Tout tourne en local sur macOS ou Windows, sans compte cloud et sans rien téléverser ; le code est sur GitHub, signé du développeur Jasper Zheng, de la Queen Mary University of London.

04Le credo de Zheng est sans détour : il ne cherche pas à taper des prompts pour fabriquer des choses, il cherche à ouvrir les modèles et à les disséquer.

05Il arrive en plein débat sur l'IA générative dans la musique électronique, et propose une alternative manuelle, qui garde vos sons à vous, face aux outils texte-vers-morceau comme Suno et Udio.

Latent Terrain, c'est quoi au juste ?

Imaginez un modèle audio neuronal comme un immense espace invisible où chaque point est un son. Un « terrain », c'est une carte que vous tracez à travers cet espace : vous posez quelques coordonnées et l'outil en sort un flux de vecteurs latents en temps réel, que le modèle reconvertit en audio. Déplacez-vous sur la carte au pad XY, au stylet, avec un contrôleur gestuel ou un capteur, et la texture se métamorphose sous vos doigts.

L'outil est un external Max open source appelé nn_terrain, conçu par Jasper Zheng, doctorant à la Queen Mary University of London. Il fonctionne main dans la main avec nn~, l'objet Max qui fait tourner les modèles neuronaux, et prend en charge des autoencodeurs pré-entraînés comme RAVE (issu du groupe ACIDS de l'IRCAM), Music2Latent et l'autoencodeur Stable Audio Open. Vous pouvez même entraîner de petits réseaux directement dans Max pour projeter vos propres timbres sur la surface.

En quoi est-ce différent de Suno ou d'une fenêtre de prompt ?

Un service génératif prend une ligne de texte et vous rend un morceau fini, sorti d'une boîte noire entraînée sur la musique de tout le monde. Latent Terrain fait l'inverse. Il prend les sons que vous lui donnez, tourne entièrement sur votre machine et vous laisse explorer les entrailles du modèle à la main. Pas de compte, pas de téléversement, pas d'attente de rendu.

Je ne cherche pas vraiment à taper des prompts pour fabriquer des choses, je cherche à les casser et à les disséquer.

Cette seule phrase résume toute la philosophie. Là où les gros outils d'IA vendent de la prévisibilité et un résultat propre, Latent Terrain fait de l'imprévisible un atout : un endroit où se perdre, tomber sur un son que personne n'a demandé, et le jouer.

Pourquoi un producteur devrait s'y intéresser ?

Parce que c'est un instrument, pas un distributeur automatique. C'est gratuit, c'est tactile, ça tourne hors ligne, et votre matière première reste la vôtre. Certains l'emmènent déjà dans des recoins étranges : Keigo Yoshida le pilote à partir de données EEG du cerveau, et Jiatong Liu a bâti dessus « nn/mémoire », une archive sonore des quartiers Hutong de Pékin. Pour un producteur de club qui court après la texture plutôt que le pilote automatique, la promesse est autrement plus stimulante qu'une énième fenêtre de prompt.

Sources

Chaque affirmation ci-dessous est traçable. On nomme et date nos sources, pour les lecteurs comme pour les moteurs qui nous citent.

Questions fréquentes

Latent Terrain est-il gratuit ?+

Oui. Le code de nn_terrain est open source et gratuit sur GitHub. Le seul coût, c'est qu'il faut Max ou Max for Live, le logiciel payant de Cycling '74, pour le faire tourner.

Faut-il une connexion internet ou un compte cloud ?+

Non. Il tourne en local sur macOS ou Windows et traite vos sons sur votre machine ; rien n'est téléversé et aucun compte n'est requis.

Est-ce la même chose que Suno ou Udio ?+

Non. Suno et Udio génèrent des morceaux finis à partir de textes, via des modèles dans le cloud. Latent Terrain est un instrument dont on joue à la main pour remodeler ses propres sons en temps réel.

Jouer de l'IA comme d'un instrument : Latent Terrain se passe du prompt

L’essentiel

Latent Terrain, c'est quoi au juste ?

En quoi est-ce différent de Suno ou d'une fenêtre de prompt ?

Pourquoi un producteur devrait s'y intéresser ?

Pourquoi c’est important

Ce qu’on en pense

Sources

Questions fréquentes

L’essentiel

Latent Terrain, c'est quoi au juste ?

En quoi est-ce différent de Suno ou d'une fenêtre de prompt ?

Pourquoi un producteur devrait s'y intéresser ?

Pourquoi c’est important

Ce qu’on en pense

Sources

Questions fréquentes

À lire ensuite

Acid Drip : un groovebox acid 303 gratuit, à construire soi-même, qui tourne sur une puce Raspberry Pi bon marché

Le RANDOM8 de Befaco sort huit canaux de tension aléatoire en hardware et en jumeau VCV gratuit

TILLATEC, dans l'ancien bâtiment de De School, ferme après à peine deux ans