Latent Terrain: KI-Audiomodelle wie ein Instrument spielen, kostenlos und offline

Das Wesentliche

01Latent Terrain ist ein kostenloses Open-Source-Werkzeug für Max und Max for Live, das den latenten Raum eines neuronalen Audiomodells in eine spielbare Fläche verwandelt, gesteuert per XY-Pad, Stift oder beliebigem Controller.

02Es läuft auf nn~ und vortrainierten Modellen wie RAVE (vom IRCAM), Music2Latent und dem Autoencoder von Stable Audio Open und formt deine eigenen Klänge um, statt aus einem Text zu generieren.

03Alles läuft lokal auf macOS oder Windows, ohne Cloud-Konto und ohne dass etwas hochgeladen wird; der Code liegt auf GitHub, vom Entwickler Jasper Zheng von der Queen Mary University of London.

04Zhengs Ansage ist unmissverständlich: Ihn interessiert nicht, Prompts zu tippen, um Dinge herzustellen, sondern die Modelle aufzubrechen und zu sezieren.

05Es kommt mitten im Streit der elektronischen Musik um generative KI und bietet eine handgemachte Alternative, die deine Klänge dir lässt, gegen Text-zu-Track-Werkzeuge wie Suno und Udio.

Was ist Latent Terrain eigentlich?

Stell dir ein neuronales Audiomodell als riesigen, unsichtbaren Raum vor, in dem jeder Punkt ein Klang ist. Ein «Terrain» ist eine Karte, die du quer durch diesen Raum zeichnest: Du setzt ein paar Koordinaten, und das Werkzeug gibt in Echtzeit einen Strom latenter Vektoren aus, den das Modell wieder in Klang verwandelt. Bewege dich mit XY-Pad, Tablet-Stift, Gesten-Controller oder Sensor über die Karte, und die Textur verwandelt sich unter deinen Fingern.

Das Werkzeug ist ein quelloffenes Max-External namens nn_terrain, gebaut von Jasper Zheng, Doktorand an der Queen Mary University of London. Es arbeitet Hand in Hand mit nn~, dem Max-Objekt, das neuronale Modelle laufen lässt, und unterstützt vortrainierte Autoencoder wie RAVE (aus der ACIDS-Gruppe des IRCAM), Music2Latent und den Autoencoder von Stable Audio Open. Du kannst sogar kleine Netze direkt in Max trainieren, um eigene Klangfarben auf die Fläche zu legen.

Worin unterscheidet sich das von Suno oder einem Prompt-Feld?

Ein generativer Dienst nimmt eine Textzeile und reicht dir einen fertigen Track aus einer Blackbox, trainiert auf der Musik aller anderen. Latent Terrain macht das Gegenteil. Es nimmt die Klänge, die du ihm gibst, läuft komplett auf deinem Rechner und lässt dich von Hand durch das Innenleben des Modells kriechen. Kein Konto, kein Upload, kein Warten auf das Rendering.

Mich interessiert nicht besonders, Prompts zu tippen, um Sachen zu machen, mich interessiert, sie aufzubrechen und zu sezieren.

Dieser eine Satz ist die ganze Philosophie. Wo die großen KI-Werkzeuge Berechenbarkeit und ein sauberes Ergebnis verkaufen, macht Latent Terrain das Unberechenbare zum Sinn der Sache: ein Ort, um sich zu verlieren, einen Klang zu finden, den niemand verlangt hat, und ihn zu spielen.

Warum sollte das einen Produzenten interessieren?

Weil es ein Instrument ist, kein Automat. Es ist kostenlos, es ist haptisch, es läuft offline, und dein Rohmaterial bleibt deins. Manche treiben es schon in seltsame Ecken: Keigo Yoshida steuert es aus EEG-Hirndaten, und Jiatong Liu hat darauf «nn/mémoire» gebaut, ein Klangarchiv der Hutong-Viertel von Peking. Für einen Club-Produzenten, der Textur statt Autopilot sucht, ist das ein deutlich reizvolleres Versprechen als noch ein Prompt-Fenster.

Quellen

Jede Aussage ist nachvollziehbar. Wir nennen und datieren unsere Quellen, für Leser und für die Engines, die uns zitieren.

Häufige Fragen

Ist Latent Terrain kostenlos?+

Ja. Der nn_terrain-Code ist quelloffen und kostenlos auf GitHub. Der einzige Kostenpunkt: Du brauchst Max oder Max for Live, die kostenpflichtige Software von Cycling '74, um es laufen zu lassen.

Braucht es eine Internetverbindung oder ein Cloud-Konto?+

Nein. Es läuft lokal auf macOS oder Windows und verarbeitet deine Klänge auf deinem Rechner; nichts wird hochgeladen, und es ist kein Konto nötig.

Ist das dasselbe wie Suno oder Udio?+

Nein. Suno und Udio erzeugen fertige Tracks aus Texten mit Cloud-Modellen. Latent Terrain ist ein Instrument, das man von Hand spielt, um die eigenen Klänge in Echtzeit umzuformen.

KI spielen wie ein Instrument: Latent Terrain kommt ohne Prompt aus

Das Wesentliche

Was ist Latent Terrain eigentlich?

Worin unterscheidet sich das von Suno oder einem Prompt-Feld?

Warum sollte das einen Produzenten interessieren?

Warum es zählt

Was wir denken

Quellen

Häufige Fragen

Das Wesentliche

Was ist Latent Terrain eigentlich?

Worin unterscheidet sich das von Suno oder einem Prompt-Feld?

Warum sollte das einen Produzenten interessieren?

Warum es zählt

Was wir denken

Quellen

Häufige Fragen

Weiterlesen

Acid Drip: eine kostenlose, selbst zu bauende 303-Acid-Groovebox auf einem günstigen Raspberry-Pi-Chip

Befacos RANDOM8 liefert acht Kanäle Zufallsspannung als Hardware und als kostenlosen VCV-Zwilling

TILLATEC, im alten De-School-Gebäude, schließt nach knapp zwei Jahren