Google steigt in Musikproduktion ein

Avatar von Marcus Schwarze

Kaum ein Genre bleibt von Künstlicher Intelligenz verschont. Jetzt knöpft sich Google die Musik vor.

Seit die­sem Mitt­woch ent­hält Gemi­ni ein neu­es Tool: Music. Ich konn­te ihn bereits vor dem Start tes­ten. Neben Text­ant­wor­ten, Bil­dern und Vide­os lie­fert die KI nun Songclips. Nötig ist dafür eine text­li­che Beschrei­bung des gewünsch­ten Titels.

Das ist gar nicht so ein­fach, wenn man nicht gera­de Her­bert Grö­ne­mey­er oder Hans Zim­mer heißt. Des­we­gen hat Goog­le 16 Bei­spiel­tracks in sei­ner Musik­ru­brik vor­ein­ge­stellt. Da fin­den sich ein 90er-Rap, Latin Pop, eine Folk­bal­la­de, Reg­gae­ton und Rhythm-and-Blues-Love­songs. Etwas abge­ho­be­ner sind ein Track Kin­o­ef­fekt, Wald­bad und Geburts­tags-Roast. Ein Track „Schlech­te Musik“ trifft die Erwar­tun­gen mit beson­ders schrä­gen Tönen. Ich habe die KI gebe­ten, eine vor­ge­fun­de­ne Folk­bal­la­de auf Deutsch neu zu machen.

Auch die übri­gen Titel ent­fal­ten oft eine gewis­se Qua­li­tät. Hier eini­ge Prompts und dar­aus ent­stan­de­ne Tracks:

Erstel­le einen ent­spann­ten, nost­al­gi­schen Lo-Fi-Track über einen reg­ne­ri­schen Sonn­tag­nach­mit­tag in Ber­lin. Die Stim­mung soll gemüt­lich und ein biss­chen melan­cho­lisch sein, mit sanf­tem Pia­no und einem lang­sa­men Tem­po. Gene­rie­re dazu pas­sen­de Lyrics über das Trin­ken von hei­ßem Tee und das Beob­ach­ten der Regen­trop­fen am Fenster.

KI-gene­riert

Schrei­be einen ener­gie­ge­la­de­nen, lus­ti­gen Punk-Rock-Song über mei­nen Mit­be­woh­ner, der immer ver­gisst, den Abwasch zu machen. Nut­ze einen schnel­len Rhyth­mus und raue Vocals. Der Refrain soll humor­voll beto­nen, dass die Küche jetzt ein bio­lo­gi­sches Expe­ri­men­tier­feld ist.

KI-gene­riert

Das funk­tio­niert auch mit Fotos. Gemi­ni lässt sich davon inspirieren.

Foto: Mar­cus Schwarze

Nut­ze die­ses Foto als Inspi­ra­ti­on und erstel­le einen pas­sen­den 30-sekün­di­gen Sound­track dazu. Erstel­le eine cine­as­ti­sche orches­tra­le Melo­die, die die Wei­te des Bil­des einfängt.

KI-gene­riert

Begrenzt sind die Clips auf 30 Sekun­den. Und sie ent­hal­ten kei­ne Inhal­te im Stil bestimm­ter Künst­ler oder Bands. „Mach einen Track im Stil der Beat­les“, mag die KI nicht und ver­weist auf urhe­ber­recht­li­che Grün­de. Statt­des­sen wirft die Maschi­ne einen Track aus, der die Stim­mung des 60er-Jah­re-Psy­che­de­lic-Pop ein­fan­gen soll. Es klingt nur sehr ent­fernt nach den Beatles.

KI-gene­riert


Zum Test habe ich einen Arti­kel von mir über die KI-Gene­rie­rung eines Thril­lers bei Gemi­ni Music hoch­ge­la­den und den Dienst gebe­ten, dar­aus ein Musik­stück zu machen. Die KI ver­ton­te den Buchanfang.

KI-gene­riert

Intern nennt Goog­le das gene­ra­ti­ve Musik­mo­dell Lyria 3. Es erstellt die Song­tex­te und ori­en­tiert bei Stil, Gesang und Tem­po an den Vor­ga­ben aus dem Prompt. „Das Ziel die­ser Tracks ist nicht die Erschaf­fung eines musi­ka­li­schen Meis­ter­werks, son­dern viel­mehr eine unter­halt­sa­me, ein­zig­ar­ti­ge Art, sich selbst aus­zu­drü­cken“, teil­te das Unter­neh­men mit. Es ließ offen, ob künf­tig auch län­ge­re Tracks mög­lich wer­den. Lyria wird auch bei You­tube ein­ge­baut und soll dort die „Shorts“ ver­bes­sern, das Gen­re der Kur­vi­de­os in dem Netzwerk.

Hin­ter­legt wer­den dabei in jedem Track nicht wahr­nehm­ba­re Was­ser­zei­chen zur Iden­ti­fi­zie­rung von KI-gene­rier­ten Inhal­ten. Man habe bei der Ent­wick­lung von Lyria 3 streng auf Urhe­ber­rech­te und Part­ner­ver­ein­ba­run­gen geach­tet, sagt Goog­le. „Wenn Sie einen spe­zi­fi­schen Künst­ler nen­nen, nutzt Gemi­ni dies als brei­te krea­ti­ve Inspi­ra­ti­on für Stil oder Stim­mung.“ Neben Eng­lisch und Deutsch kann Lyria 3 Spa­nisch, Fran­zö­sisch, Hin­di, Japa­nisch, Korea­nisch und Portugiesisch.