Seit diesem Mittwoch enthält Gemini ein neues Tool: Music. Ich konnte ihn bereits vor dem Start testen. Neben Textantworten, Bildern und Videos liefert die KI nun Songclips. Nötig ist dafür eine textliche Beschreibung des gewünschten Titels.
Das ist gar nicht so einfach, wenn man nicht gerade Herbert Grönemeyer oder Hans Zimmer heißt. Deswegen hat Google 16 Beispieltracks in seiner Musikrubrik voreingestellt. Da finden sich ein 90er-Rap, Latin Pop, eine Folkballade, Reggaeton und Rhythm-and-Blues-Lovesongs. Etwas abgehobener sind ein Track Kinoeffekt, Waldbad und Geburtstags-Roast. Ein Track „Schlechte Musik“ trifft die Erwartungen mit besonders schrägen Tönen. Ich habe die KI gebeten, eine vorgefundene Folkballade auf Deutsch neu zu machen.
Auch die übrigen Titel entfalten oft eine gewisse Qualität. Hier einige Prompts und daraus entstandene Tracks:
Erstelle einen entspannten, nostalgischen Lo-Fi-Track über einen regnerischen Sonntagnachmittag in Berlin. Die Stimmung soll gemütlich und ein bisschen melancholisch sein, mit sanftem Piano und einem langsamen Tempo. Generiere dazu passende Lyrics über das Trinken von heißem Tee und das Beobachten der Regentropfen am Fenster.
KI-generiert
Schreibe einen energiegeladenen, lustigen Punk-Rock-Song über meinen Mitbewohner, der immer vergisst, den Abwasch zu machen. Nutze einen schnellen Rhythmus und raue Vocals. Der Refrain soll humorvoll betonen, dass die Küche jetzt ein biologisches Experimentierfeld ist.
KI-generiert
Das funktioniert auch mit Fotos. Gemini lässt sich davon inspirieren.
Foto: Marcus Schwarze
Nutze dieses Foto als Inspiration und erstelle einen passenden 30-sekündigen Soundtrack dazu. Erstelle eine cineastische orchestrale Melodie, die die Weite des Bildes einfängt.
KI-generiert
Begrenzt sind die Clips auf 30 Sekunden. Und sie enthalten keine Inhalte im Stil bestimmter Künstler oder Bands. „Mach einen Track im Stil der Beatles“, mag die KI nicht und verweist auf urheberrechtliche Gründe. Stattdessen wirft die Maschine einen Track aus, der die Stimmung des 60er-Jahre-Psychedelic-Pop einfangen soll. Es klingt nur sehr entfernt nach den Beatles.
KI-generiert
Zum Test habe ich einen Artikel von mir über die KI-Generierung eines Thrillers bei Gemini Music hochgeladen und den Dienst gebeten, daraus ein Musikstück zu machen. Die KI vertonte den Buchanfang.
KI-generiert
Intern nennt Google das generative Musikmodell Lyria 3. Es erstellt die Songtexte und orientiert bei Stil, Gesang und Tempo an den Vorgaben aus dem Prompt. „Das Ziel dieser Tracks ist nicht die Erschaffung eines musikalischen Meisterwerks, sondern vielmehr eine unterhaltsame, einzigartige Art, sich selbst auszudrücken“, teilte das Unternehmen mit. Es ließ offen, ob künftig auch längere Tracks möglich werden. Lyria wird auch bei Youtube eingebaut und soll dort die „Shorts“ verbessern, das Genre der Kurvideos in dem Netzwerk.
Hinterlegt werden dabei in jedem Track nicht wahrnehmbare Wasserzeichen zur Identifizierung von KI-generierten Inhalten. Man habe bei der Entwicklung von Lyria 3 streng auf Urheberrechte und Partnervereinbarungen geachtet, sagt Google. „Wenn Sie einen spezifischen Künstler nennen, nutzt Gemini dies als breite kreative Inspiration für Stil oder Stimmung.“ Neben Englisch und Deutsch kann Lyria 3 Spanisch, Französisch, Hindi, Japanisch, Koreanisch und Portugiesisch.
Die KI kennt in ihrem Weltwissen allerlei Dramen, Spiele, Drehbücher aus Filmen, Rezepte. Die kann man sich zur anstehenden Familienfeier zunutze machen. Für Gastgeber, Familien-CEOs und Friedenswahrer lässt sich so der Stress reduzieren, logistische Präzision planen und hoffentlich Harmonie erzeugen. Die Maschine liefert alltagstaugliche Beratung, wenn man sie mit den richtigen Prompts befragt.
Um 19 Uhr gibt’s Essen
Zeitplan fürs Heiligabend-Menü: Die KI hat errechnet, dass es um 16.30 Uhr mit der Zubereitung fürs 19-Uhr-Essen losgehen sollte. (Screenshot: Marcus Schwarze/Gemini, KI-generiert)
Kochplan erstellen: „Ich serviere an Heiligabend um 19 Uhr folgendes Menü: Kartoffelgratin, Garzeit 50 Minuten, Schweinemedaillons, Garzeit 15 Minuten im Ofen, und als Beilage frischer Feldsalat. Erstelle mir einen rückwärts gerechneten Zeitplan. Beginne beim Servierzeitpunkt. Sage mir genau, wann ich was schneiden, vorheizen, in den Ofen schieben oder ruhen lassen muss, damit alles gleichzeitig heiß auf den Tisch kommt. Plane 15 Minuten Puffer ein.“
Gemini erstellt draus einen generalstabsmäßigen Kochplan. Los geht es um 16.30 Uhr damit, Kartoffeln zu schälen und in dünne Scheiben zu schneiden, Knoblauch zu hacken und den Salat zu waschen. Ab 17.25 Uhr soll der Ofen vorgeheizt werden, ab 17.40 Uhr das Gratis auf die mittlere Schiene geschoben werden. Ab 18.25 Uhr wird das Fleisch vorbereitet, um 18.30 Uhr das Gratin aus dem Ofen genommen und mit dem Fleisch getauscht. Gegen 18.50 finalisiert man den Salat, um 19 Uhr gibt es Essen. Wer will, ergänzt im Prompt die Namen der Familienmitglieder und bittet die Maschine, die Aufgaben aufzuteilen, samt Küche putzen und Abwasch. Ein Vorteil des KI-generierten Küchenplans: Er liegt einfach vor, schafft Tatsachen und muss nicht mühsam diskutiert werden.
Diplomatie und Grenzziehung
Heikle Themen umschiffen: „Beim Familienessen könnte das Thema AfD aufkommen, besonders durch Onkel Werner. Er argumentiert gerne, dass man die AfD wählen müsse, um es „denen da oben mal richtig zu zeigen“, weil die etablierten Parteien versagt hätten (Thema Migration, Heizungsgesetz und Gendern). Gib mir drei elegante Sätze, um das Thema zu wechseln, ohne unhöflich zu wirken. Schlage danach drei ‚sichere’ Gesprächsthemen vor, die sowohl die 16-jährige Nichte als auch die 80-jährige Großmutter interessieren könnten.“
Gemini empfiehlt zur Entschärfung, Diplomatie gepaart mit klarer Grenzziehung einzusetzen. Die KI schlägt einen Appell an die Gemütlichkeit vor: „Werner, ich merke, wie sehr dich das ärgert, und im Alltag ist das alles ja auch belastend. Aber lass uns doch heute Abend mal eine bewusste politikfreie Zone ausrufen und die Zeit nutzen, um zu hören, wie es uns eigentlich geht – ganz ohne Nachrichten.“ Für den Wechsel des Gesprächsthemas schlägt die KI unter anderem vor, die Oma zu befragen, welche Mode sie mit 16 trug trug, die ihre Eltern schrecklich fanden, und die Nichte, was gerade Trend ist und die Alten nicht verstehen. Die Nichte fühlt sich als Die Nichte fühlt sich als Expertin für das „Jetzt“ ernst genommen, und die Großmutter kann oft überraschend wilde Geschichten aus ihrer Jugend erzählen.
Schnell umsetzbare Geschenkidee
Gemini hat die Kurzgeschichte und ein Bild für eine Weinrolle entworfen. (Screenshot: Marcus Schwarze/Gemini, KI-generiert)
Geschenk in letzter Minute: „Ich brauche noch ein Geschenk für den Schwiegervater. Er ist pragmatisch, mag Wein, hasst Staubfänger, liebt Geschichte. Das Budget liegt bei 50 Euro. Nenne mir 5 konkrete Ideen, die ich entweder digital sofort besorgen kann oder die in einem gut sortierten Geschäft noch verfügbar sind. Bitte keine generischen Gutscheine.“
Gemini entwirft eine Grundregel: Verbrauch statt Besitz oder Wissen und Erlebnis statt Dekoration. Unter den fünf Vorschlägen ist ein „historischer“ Wein von einem der ältesten Weingüter, die KI nennt Kloster Eberbach im Rheingau. Als Clou schlägt Gemini vor, kurz die Geschichte des Weinguts über die Zisterziensermönche auf einem schönen Papier auszudrucken und es als Schriftrolle um den Flaschenhals zu hängen. „Warum es passt: Es ist Wein (mag er), hat Geschichte (liebt er) und wird getrunken (kein Staubfänger)“, argumentiert die Maschine.
Mit dem richtigen Prompt stellt Gemini die Weinrolle frei, illustriert sie und liefert eine druckbare Datei. (Screenshot: Marcus Schwarze/Gemini, KI-generiert)
Die Geschichte des Klosters kann Gemini gleich dazu erstellen: „Mach mir eine kurze Geschichte über das Weingut Kloster Eberbach und die Zisterziensermönche für einen Ausdruck auf einem schönen Papier, um es als Schriftrolle um den Flaschenhals zu hängen.“ Bei dem Ergebnis zeigt Gemini eine Funktion „Antwort überprüfen“, mit der sie eigenständig nach Kernaussagen im Text googelt. Schwenkt man dann im Chat zu „Bild erstellen“, kann man mit dem Prompt „Mach das als Illustration“ ein Bild über die Geschichte des Weinguts erzeugen. Üblicherweise erzeugt Gemini Bilder im Querformat, in diesem Beispiel als Szene mit einem umgebenden Weinkeller. Wer nur das Dokument haben möchte, kann nachschärfen: „Gib mir nur das Dokument in der Mitte, ohne die Szene drumherum, im Hochformat zum Ausdrucken auf A4.“ Voilà, fertig ist eine druckbare Fassung von „Ora et Labora – das Erbe von Eberbach“.
Spiel für die Zeit bis zur Bescherung
Ratespiel für die Familienfeier: Welches Sprichwort steckt in diesen Emojis? (Screenshot: Marcus Schwarze/Gemini, KI-generiert)
Generationenquiz erfinden: „Erstelle ein Konzept für ein 30-minütiges Familienquiz, das gleichermaßen für die Großeltern (Boomer) und die Enkel (Gen Z/Alpha) fair ist. Gib mir 3 Kategorien (zum Beispiel ‚Technik von damals vs. heute‘, ‚Musik-Hits‘, ‚Familien-Mythen‘) und für jede Kategorie drei Beispielfragen, die generationenübergreifendes Wissen erfordern oder Teamarbeit fördern.“
Gemini erfindet ein 30-minütiges Familienquiz, bei dem die Großeltern gegen die Enkel spielen. Die Enkel müssen das „Speichern“-Symbol in Word erklären (eine 3,5‑Zoll-Diskette, wieviel Speicher sie hatte und mehr), die Großeltern sollen den Begriff „Cloud“ erklären. Andere Fragen aus dem KI-Vorschlag drehen sich um Begriffe wie „Bandsalat“, „Cringe“ und „Ghosting“. Im Teamduell zeigt der Moderator alte Sprichwörter („Reden ist Silber, Schweigen ist Gold“), die nur als Emojis dargestellt werden und von den Spielern übersetzt werden müssen. Im dritten Teil spielt man auf dem Handy ausgewählte Songs nur kurz an, die einerseits auf TikTok viral gegangen sind und andererseits der älteren Generation bekannt sind – wie zum Beispiel „Running up that Hill“ von Kate Bush aus den achtziger Jahren, das kürzlich durch die Serie „Stranger Things“ einen neuen Höhenflug erlebte. Die Gemini-App auf dem Handy kann für alle Quizfragen neue Beispiele finden. Wer vermeiden möchte, lange auf dem Handy herumzutippen, kann die KI per gesprochener Sprache ansprechen.
Die Kinder beschäftigen, ohne Bildschirm
Kinder-Management: „Bis zur Bescherung sind es noch zwei Stunden, die Kinder (Alter 6 bis 10 Jahre) werden unruhig, und die Erwachsenen wollen sich unterhalten. Schlage drei Spiele oder Aktivitäten vor, die die Kinder beschäftigen, aber keine Vorbereitung und keine Bildschirme (Tablets/Handys) erfordern. Nutze nur Dinge, die an Weihnachten ohnehin herumliegen (Geschenkpapier-Reste, Nüsse, Kartons, Stifte).“
Gemini schlägt ein Nuss-Boccia vor: Jedes Kind bekommt eine Handvoll Walnüsse. Aufgabe ist, sie möglichst nah an eine kleine Haselnuss zu rollen. In einem anderen Spiel bekommt der Nachwuchs die Aufgabe, aus Resten von Geschenkpapier, leeren Kartons, Klebeband und Geschenkband die verrücktesten Hüte für Weihnachswichtel zu designen, Krawatten, Armbänder und Kostüme. Sie bekommen dafür 45 Minuten Zeit im Kinderzimmer und sollen die Kreationen danach den Erwachsenen auf einem Laufsteg im Wohnzimmer vorführen.
Nicht erreichbar sein
Abwesenheitsnotiz: „Entwirf eine Abwesenheitsnotiz für meine geschäftliche E‑Mail (Zeitraum 24. Dezember bis 2. Januar). Der Ton soll professionell und souverän sein, aber mit einem charmanten, winterlichen Twist, der im Gedächtnis bleibt. Signalisiere klar, dass ich nicht erreichbar bin und E‑Mails nicht weitergeleitet werden, ohne dabei abweisend zu klingen.“
Gemini schlägt drei Optionen vor, darunter eine Betreffzeile „Winterruhe & Frischer Wind für 2025 ❄️“, am Ende mit einem Emoji für eine Schneeflocke. Solch ein Emoji sei inzwischen auch im Business-Kontext akzeptiert, solange es sparsam eingesetzt wird. Im freundlichen Ton erklärt die Abwesenheitsnotiz, dass man für ein paar Tage den Bildschirm gegen Winterluft und Festtagsruhe austauscht. Verbindlichkeit erzeugt die Nachricht dennoch: „Ich nutze diese Zeit, um abzuschalten und neue Energie zu tanken, damit wir im neuen Jahr wieder gemeinsam Projekte voranbringen können.“
„Niemand, schon gar keine KI, wäre in der Lage, all die Assoziationen, Volten und Haken hinzubekommen, die eine durchschnittliche ‚Post [von Wagner]‘ ausmachen.“ So schrieb Lukas Heinser in der „Frankfurter Allgemeinen Sonntagszeitung“ kurz vor dem Tod Wagners über die Stimme der Vernunft, wie Heinser ihn bezeichnete.
Fünfmal die Woche verfasste Wagner Briefe an Protagonisten unserer Zeit. Er knöpfte sich Kanzler, Putin und gefühlskalte Fußballer vor, pries eine abgesägte Verfassungsgericht-Kandidatin und huldigte einer abgestürzten Bergsteigerin.
Die simplen Sätze Wagners waren oft erhaben. Seine Gedanken erfrischend. Wagner überraschte als Opi mit gesundem Menschenverstand, schrieb Heinser. „An guten Tagen waren Sie tatsächlich der Seismograf für das gesunde Volksempfinden. An anderen Tagen hatten Sie immerhin interessante Gedanken. Immer, sagten Sie, suchten Sie den ‚perfekten Satz‘.“ So schreibt Micky Beisenherz in seinem Nachruf bei der „Süddeutschen Zeitung“.
„Was hättest Du in Deinem letzten Brief an Dich selbst geschrieben? ✍️“, fragt der frühere „Bild“-Chefredakteur Kai Diekmann. Das weiß niemand. Doch lässt sich die KI füttern mit Wagners Texten, mit seinen Nachrufen, seiner Biografie, mit Beurteilungen von außen.
Zu meiner Überraschung erstellte Künstliche Intelligenz eine Ode an die Worte:
Post von Wagner
Liebe Worte,
ihr wart mein Sauerstoff. Ohne euch war ich nichts.
Heute seid ihr still. Mein weißer Stuhl ist leer.
Ist das der Tod? Ein Zimmer, in dem keiner mehr tippt.
Ich war ein alter Mann und wurde zum Überraschungsfeministen.
Warum haben sie Angst vor klugen Frauen?
Ich glaube: Solche Frauen brauchen wir.
Das lernte ich von meiner Mutter auf der Flucht. Stärke hat ein Gesicht.
Ich habe oft falsch gelegen, manchmal richtig.
Drei von fünf Sätzen – das war ein guter Tag.
Glück ist ein Kuss, der nichts kostet. Ich reiche Ihnen die Hand.
Auch wenn wir streiten.
Ich hatte Angst vor dem Tod.
Jetzt sehe ich ihn wie einen vollen Mond über St. Tropez.
Der Todesstern repräsentiert in Filmen der Star-Wars-Reihe autoritäre Kontrolle und totalitäre Macht. Er verkörpert eine dunkle Kraft, die vernichtet, aber letztlich durch die „gute“ Seite besiegt wird. So geschieht es zwei Mal in den Science-Fiction-Filmen. „Beim Testen von GPT‑5 hatte ich Angst. Ich schaute es mir an und dachte: Was haben wir da getan? Es ist wie das Manhattan-Projekt“, sagte Altman in einem Podcast. Er spielte damit auf das streng geheime US-Forschungsprogramm während des Zweiten Weltkriegs zur Entwicklung der ersten Atombombe an. Die Entwickler des Manhattan-Projekts waren später erschüttert von dem, was ihre Technologie angerichtet hatte. Altman signalisiert damit, ungewöhnlich für einen Unternehmer einer neuen KI, ein ähnliches Unbehagen: eine Technologie, die womöglich über das hinausgeht, was kontrollierbar ist. Es gebe niemanden, der hier wirklich die Verantwortung übernimmt: „There are no adults in the room.“
Unabhängig von solch einem gewiss auch dramatisierenden Werbe-Stunt: GPT‑5 ist das fortschrittlichste Modell von OpenAI und bietet laut Ankündigung erhebliche Verbesserungen in Bezug auf Argumentation, Codequalität und Benutzererfahrung. Es bewältigt komplexe Programmieraufgaben mit minimalen Aufforderungen, liefert klare Erklärungen und führt verbesserte Agentenfunktionen ein, was es zu einem leistungsstarken Programmierpartner und intelligenten Assistenten für alle Benutzer macht. Die KI steht dabei als einheitliches integriertes Modell bereit, ohne dass man eine der Modellvarianten auswählen muss.
Wie ein erster Tester schrieb (ich habe es selbst zurzeit noch nicht getestet, das folgt ausgeruht für die nächste F.A.Z.-PRO-Digitalwirtschaft), sollen besonders die Programmierfähigkeiten herausragen: Die KI befolgt „autistisch“ die Anweisungen und ruft interne Werkzeuge ab. Ein einziger Aufruf hat bei diesem Test bis zu elf Dateibearbeitungen bewirkt. Für Aufgaben mit vielen Schritten bleibt die KI „auf Kurs“ und erledigt alles selbstständig. Die KI habe Code geschrieben, „der einfach funktioniert“. Wenn sich das bewahrheitet, konkurriert GPT‑5 direkt mit Startups wie Lovable, die KI-basierte Programmierung zu neuen Fertigkeiten entwickelt haben.
(Screenshot: OpenAI)
Dazu kommen Fähigkeiten für gesundheitsbezogene Fragen. „Es erkennt proaktiv potenzielle Probleme, stellt Rückfragen und hilft dabei, Ergebnisse zu verstehen“, kündigte das Unternehmen an. Wichtig sei aber, dass ChatGPT keine medizinische Fachkraft ersetzt.
GPT‑5 steht der Mitteilung zufolge in einer eingeschränkten Fassung bereits kostenlos bei ChatGPT zur Verfügung. Nutzer des Tarifs Plus für 20 Dollar im Monat erhalten erweitertes Reasoning („Nachdenken“). „Plus“-Nutzer bekommen für 200 Dollar im Monat Zugang zum vollen Modell mit maximalem KI-Gehirnschmalz und ohne Begrenzungen.
Voreingestellte Persönlichkeiten
In den nächsten Tagen will Open AI zudem neue Funktionen freischalten, etwa zur Markierung von Chats in verschiedenen Farben. Außerdem führt das Unternehmen voreingestellte Persönlichkeiten ein, die unterschiedliche Kommunikationsstile festlegen. Prägnant und professionell, nachdenklich und unterstützend oder sarkastisch sollen dann auswählbar werden. So holt man sich wahlweise einen Zyniker, Roboter, Zuhörer oder Nerd auf den Bildschirm.
Wahlweise lassen sich demnächst von der zahlenden Kundschaft das Gmail-Postfach, der Google-Kalender und Google-Kontakte verbinden. ChatGPT erkennt der Mitteilung zufolge, wann Mails und Kalenderdaten relevant sein könnten und ruft entsprechende Informationen ab.
Manches bei der digitalen Arbeit ist so kleinteilig, da will man sich nicht lange mit Details beschäftigen. Man klickt sich so durch, über die immer gleichen Wege, und fragt sich am Ende: Kann ich das nicht auf eine der Funktionstasten legen, die auf der Mac-Tastatur 19-fach vorhanden sind?
Wöchentlich benötige ich dreimal eine Bilddatei in ein 1100 Pixel breites Format mit 152 dpi umgewandelt. Also öffne ich das Bild in Pixelmator (früher war es Photoshop), wandle das Bild in 152 dpi und lasse es neu berechnen für die gewünschte Breite. Diverse Mausklicks sind dafür nötig. Das geht doch schneller?
Für Screenshots benötige ich gelegentlich den Hell-Modus statt dem von mir bevorzugten Darkmodus. Irgendwo in den Systemeinstellungen muss man da einen Haken setzen. Nur wo? Lässt sich die Umschaltung auf die Taste F16 legen?
Noch simpler: Auf dem Mac hätte ich gerne über die Taste F19 den Taschenrechner aufgerufen. In den Untiefen der Systemeinstellungen auf dem Mac ist dies hinterlegbar – nur wie?
Die Anleitungen für diese drei Aufgaben finden sich in den Untiefen des Webs. Man muss dafür googeln, das Problem mit den Fundstellen abgleichen, ausprobieren und weiterforschen. Oder man hangelt sich durch die Systemeinstellungen des Macs, die inzwischen so unübersichtlich wie die Menüführung in Microsoft Word ist.
Dank Künstlicher Intelligenz geht das jetzt schneller.
Die Aufgabe für die Umwandlung der Bilddatei samt angehängtem „-1100px“ im Dateinamen beschrieb mir ChatGPT o3 Schritt für Schritt. Meine Frage lautete: „Wie kann ich eine Automatisierung erzeugen, um aus Bilddateien eine neue Version mit dem Zusatz ‑1100px im Dateinamen zu erzeugen? Das Bild soll 152 dpi haben und 1100 Pixel breit sein. Es soll auf die Taste F17 reagieren.“ Punkt für Punkt ging die KI mit mir das Nötige durch, führte knapp in die Geheimnisse von Shell-Skripten ein und gab mir den nötigen Code. Es folgte eine Anleitung, wie man das in ein Programm Automator auf dem Mac einfügt. Und es gab eine Anleitung, die gewünschte Funktionstaste der Aufgabe zuzuweisen.
Wieder sind so ein paar Minuten am Tag gewonnen. Und das gelingt auch mit den anderen zwei Aufgaben minutenschnell.
ChatGPT o3 gibt’s nur kostenpflichtig bei OpenAI. Das ist inzwischen eine bessere Suchmaschine als Google: Sie berücksichtigt den Kontext der Frage, durchsucht Dutzende und manchmal Hunderte von Webseiten und macht sich einen Reim darauf.
Die dabei generierten Anleitungen sind nicht immer hundertprozentig korrekt. Mal heißen Menüpunkte anders. Oder sie sind nicht auffindbar. Dann hilft ein schneller Screenshot – und, ihn bei o3 hochzuladen. Messerscharf schließt die KI daraus, dass offenbar etwas nicht stimmt und der Screenshot mit der Anleitung abzugleichen ist. Wieder googelt o3 los, durchsucht das Web nach passenden Infos und bereitet eine neue Anleitung auf.
Wo das noch hinführen könnte, zeigt eine neue Anwendung von Google. Opal erstellt Prozesspläne für Aufgaben. In natürlichen menschlichen Worten beschreibt man die Aufgabe. Die Anwendung zerlegt das in ein Diagramm für erwartete Eingaben und Uploads, eine Google-Suche nach weiteren Informationen und eine anschließende Verarbeitung aller Erkenntnisse für Blogposts und ein Video. Die Machart erinnert an den deutschen Dienst n8n, bei dem man sich ähnliche Workflows zusammenklicken kann. Bei Googles Opal nur eben ohne Expertentum.
Google bezeichnet die KI-gestützte Technik ausdrücklich als Experiment. Wer weiß, ob daraus ein marktfähiges Produkt in Konkurrenz zu n8n und dem schwedischen Startup Lovable wird, das ebenfalls eine starke App zur Programmierung bereitstellt. Gegenwärtig ist Opal nur per VPN-Einwahl in die USA zugänglich und dort kostenlos. „Füge eine Funktion hinzu, das Video automatisch auf Social-Media-Kanälen des Nutzers zu veröffentlichen. Hole Dir für jeden Post seine Freigabe.“
Klare Anleitungen: Lernen Sie, wie Sie präzise Prompts formulieren und die KI gezielt steuern.
Fortgeschrittene Techniken: Nutzen Sie Methoden wie Few-Shot-Prompting und den Aufbau einer Prompt-Bibliothek.
Ethik im Fokus: Verstehen Sie die rechtlichen und ethischen Aspekte der KI-Nutzung.
Assistenten und Agenten im Einsatz: Eine Anleitung zum schnellen Erstellen eigener Helferlein für Alltagsarbeiten im Büro.
Ob Einsteiger oder Profi, dieses Buch ist Ihr Schlüssel zu einer erfolgreichen Zusammenarbeit mit KI.
Das PDF mit 157 Seiten gibt es hier und das Taschenbuch sowie das E‑Pub-Format im Amazon-Shop. Abonnenten meines persönlichen Newsletters erhalten das PDF hier vergünstigt.
Der beste Titel beim Eurovision Song Contest bricht alle Vorschriften. Er holt mehr als die erlaubten sechs Tänzer auf die Bühne, dauert doppelt so lang wie die zulässigen drei Minuten, und abstimmen darf man für ihn nicht. „Made in Switzerland“ singen da Hazel Brugger und Sandra Studer gekonnt im Stil eines Broadway-Musicals, unterstützt von Petra Mede als Armbrustschützin in der Gestalt von Wilhelm Tell. Der Ur-Schweizer hatte in den fünfziger Jahren des 13. Jahrhunderts das Land geeint. Er formte die Vision von einer Welt ohne Spaltung. Die Idee, wenn auch so noch nie erzählt: ein Musikwettbewerb. Die „Eurovision“ war geboren.
Mit viel Witz und Selbstironie besingen und betanzen die Schweizerinnen ihre Errungenschaften. Neben den Schweizer Uhren und der Schokolade rühmen sie sich des Schmelzkäses, des Kartoffelschälers und des Schweizer Taschenmessers. Die E‑Gitarre und das Müsli, das Internet und LSD stammen aus dem Alpenland. Die größte Leistung aber war die von Wilhelm Tell. Man sei so arm gewesen, dass sogar der Käse Löcher hatte. Doch Tell führte die Eidgenossen in eine neue Zeit. Nur 500 Jahre später wurde seine Eurovision Realität, gegründet, na klar, in der Schweiz.
Wäre so ein vergnüglicher Titel in Deutschland möglich?
Drei KIs habe ich daran dichten lassen. NotebookLM besorgte den Songtext aus dem YouTube-Video. ChatGPT o3 definierte die Klischees und Errungenschaften deutscher Dichter, Denker und Tüftler. Vorschläge reichten vom MP3-Musikformat bis zum Pfandflaschenperfektionismus, vom DSGVO-konformen Gesichtspixelfilter bei jeder Nahaufnahme des Song Contests bis zur VAR-Prüfung der gesungenen Tonhöhe mittels Videoschiedsrichtern aus dem Kölner Keller.
Und o3 ersann im dritten Durchlauf daraus einen neuen Text gemünzt auf die Deutschen. Im Metrum der Schweizer Melodie, mit den entsprechenden Verslängen und angepassten Zwischenspiele. Die Maschine erfand folgenden Text.
Gesprochenes Intro (gleiches Tempo, gleiche Taktzahl wie das Original)
In twenty-ten the ESC moved back to Germany after Lena’s little Satellite spun to the stars. And now the trophy circles once again above this land of beer foams and binary code. Hosting Eurovision is the perfect chance to polish clichés till they sparkle—then drop them on the floor. Because what comes to mind when somebody says “Germany”? Only highways with no speed limit, bratwurst bazaars and a schedule that scares the sun? Nein! There is more than lederhosen line-dancing and Oktoberfest selfies. The best inventions were hammered, printed or brewed right here. For example…
Gesungene Liste (Viertelnotentakt)
Instant coffee, pocket recorder, polycarbonate, the humble gummy bear, microchips that do the math while everyone still counts on fingers in the air! So—let’s sing it.
REFRAIN 1 (identische Taktstruktur zum Schweizer Refrain)
Made in Germany, like the printing press and Pils. Made in Germany, like the motorway for thrills. Made in Germany, and when a headache kills, just reach for Aspirin— that’s Made in Germany! The trusty air-bag, cue the crash-test dummy— it’s Made in Germany!
Vers 1 (gleiches Silbenmuster)
Think of punctual trains (okay, the myth still lives), of folders colour-coded, every stamp precisely gives. Yet backstage hums a techno-dream in fractal midnight light; MP3 shrinks heartache down to three oh-three tonight. (whisper) “Three extra seconds—don’t tell the EBU.”
Vorchor (über vier Takte gesprochen)
Behind each DIN-sized paper sheet hides a scientist with glitter on the lab coat.
REFRAIN 2
Made in Germany like the X‑ray’s ghostly gleam. Made in Germany like the zipper on your jeans. Made in Germany—chip-card pays the pyro beam, the safety check is free. LEDs that blind the jury— all Made in Germany!
Story-Interlude (gleiche komödiantische Kadenz wie der Abschnitt „William Tell“)
In the mid-fifteenth century Monks still hoarded scrolls; town criers strained their lungs. A restless goldsmith, Johannes Gutenberg, sighed: “These parchment dumbbells must go—let letters dance!” He cast fresh type, ink kissed the page, rumours found rhythm… Crowds shouted, “Print the score—make music a contest!” He named it ‘Print-Vision’. A typo dropped the P, and suddenly it read Euro-Vision. Historical fact—please don’t google it.
Promi-Cameo-Lauf (acht Takte, passendes Schweizer Tempo)
Angela Merkel struts on, whispers deadpan “Yes, we can measure that.” Albert Einstein raps, “Time dilates when twelve points hesitate.” Till Lindemann hoists a flame—immediately doused by TÜV officers in hi-vis vests. Helene Fischer back-flips with rainbow gummy bears raining down. Dirk Nowitzki slam-dunks an oversize 12 into the green-room basket.
SCHLUSSCHORUS (einen ganzen Ton höher, gleiche Länge)
Made in Germany, from diesel thump to drone, Made in Germany, from Beethoven’s metronome. Made in Germany, the voting system’s chrome—blame spreadsheet wizardry. Raise a Stein, align the beat, Euro-Vision, on repeat— Made… in… Ger-ma-ny-eeeee!
Outro gesprochen (Acht-Beat-Takt)
If any points go missing, chalk it up to Teutonic fine-tuning—never to bad arithmetic.
Da sitzt noch nicht jede Analogie. Nicht alles was hinkt, ist ein Vergleich. Und ob im Detail der Reißverschluss und der Instantkaffee aus Deutschland oder der Schweiz stammen, wissen die Neuseeländer und Amerikaner besser. Der Kaffeefilter von Melitta Bentz könnte besser passen.
Doch ist der KI-Text eine schöne Widerlegung der These, Künstliche Intelligenz könne keine Kreativität, und sie könne nur neu zusammenstellen, womit sie einmal trainiert wurde.
Das Schweizer Lied wurde von Lukas Hobi und Christian Knecht geschrieben, von Pele Loriano, Benji Alasu und Wojciech Kostrzewa arrangiert und von Jon Hallgren, Pele Loriano und Benji Alasu produziert. Über Wochen und Monate haben sie seit Januar mit den drei Sängerinnen, einem Chor und den Tänzern an „Made in Switzerland“ gearbeitet. Da kann eine halbe Stunde KI nicht mithalten.
Aber auf Gutenberg statt Wilhelm Tell, den Reim von Pils auf Autobahn-„Thrills“ und den TÜV-Prüfern am Feuerset der Bühne, da hätte auch menschliche Intelligenz länger drauf herumdenken müssen. Der Schuss Genialität, er bleibt der Schweiz unbenommen und zeugt von harter kreativer Arbeit. Doch die Einschüsse der Maschinen kommen näher. Gutenberg might approve this print-vision, made in Germany.
PS: Im Podcast Tech, KI und Schmetterlinge von Sascha Lobo in Zusammenarbeit mit Schwarz Digital stelle ich ein KI-Tool der Woche vor. Letzte Woche ging’s um ein Werkzeug zum Entlarven von Quatsch im Netz. An diesem Mittwoch voraussichtlich um eine KI, die eine heruntergekommene Junggesellenbude umgestaltet.
PPS: An jedem Monatsersten biete ich ein Seminar für den Einsatz von KI in der Praxis. Die Teilnahme per Zoom-Video kostet 90 Euro.