Kategorie: Allgemein

  • Google steigt in Musikproduktion ein

    Google steigt in Musikproduktion ein

    Seit die­sem Mitt­woch ent­hält Gemi­ni ein neu­es Tool: Music. Ich konn­te ihn bereits vor dem Start tes­ten. Neben Text­ant­wor­ten, Bil­dern und Vide­os lie­fert die KI nun Songclips. Nötig ist dafür eine text­li­che Beschrei­bung des gewünsch­ten Titels.

    Das ist gar nicht so ein­fach, wenn man nicht gera­de Her­bert Grö­ne­mey­er oder Hans Zim­mer heißt. Des­we­gen hat Goog­le 16 Bei­spiel­tracks in sei­ner Musik­ru­brik vor­ein­ge­stellt. Da fin­den sich ein 90er-Rap, Latin Pop, eine Folk­bal­la­de, Reg­gae­ton und Rhythm-and-Blues-Love­songs. Etwas abge­ho­be­ner sind ein Track Kin­o­ef­fekt, Wald­bad und Geburts­tags-Roast. Ein Track „Schlech­te Musik“ trifft die Erwar­tun­gen mit beson­ders schrä­gen Tönen. Ich habe die KI gebe­ten, eine vor­ge­fun­de­ne Folk­bal­la­de auf Deutsch neu zu machen.

    Auch die übri­gen Titel ent­fal­ten oft eine gewis­se Qua­li­tät. Hier eini­ge Prompts und dar­aus ent­stan­de­ne Tracks:

    Erstel­le einen ent­spann­ten, nost­al­gi­schen Lo-Fi-Track über einen reg­ne­ri­schen Sonn­tag­nach­mit­tag in Ber­lin. Die Stim­mung soll gemüt­lich und ein biss­chen melan­cho­lisch sein, mit sanf­tem Pia­no und einem lang­sa­men Tem­po. Gene­rie­re dazu pas­sen­de Lyrics über das Trin­ken von hei­ßem Tee und das Beob­ach­ten der Regen­trop­fen am Fenster.

    KI-gene­riert

    Schrei­be einen ener­gie­ge­la­de­nen, lus­ti­gen Punk-Rock-Song über mei­nen Mit­be­woh­ner, der immer ver­gisst, den Abwasch zu machen. Nut­ze einen schnel­len Rhyth­mus und raue Vocals. Der Refrain soll humor­voll beto­nen, dass die Küche jetzt ein bio­lo­gi­sches Expe­ri­men­tier­feld ist.

    KI-gene­riert

    Das funk­tio­niert auch mit Fotos. Gemi­ni lässt sich davon inspirieren.

    Foto: Mar­cus Schwarze

    Nut­ze die­ses Foto als Inspi­ra­ti­on und erstel­le einen pas­sen­den 30-sekün­di­gen Sound­track dazu. Erstel­le eine cine­as­ti­sche orches­tra­le Melo­die, die die Wei­te des Bil­des einfängt.

    KI-gene­riert

    Begrenzt sind die Clips auf 30 Sekun­den. Und sie ent­hal­ten kei­ne Inhal­te im Stil bestimm­ter Künst­ler oder Bands. „Mach einen Track im Stil der Beat­les“, mag die KI nicht und ver­weist auf urhe­ber­recht­li­che Grün­de. Statt­des­sen wirft die Maschi­ne einen Track aus, der die Stim­mung des 60er-Jah­re-Psy­che­de­lic-Pop ein­fan­gen soll. Es klingt nur sehr ent­fernt nach den Beatles.

    KI-gene­riert


    Zum Test habe ich einen Arti­kel von mir über die KI-Gene­rie­rung eines Thril­lers bei Gemi­ni Music hoch­ge­la­den und den Dienst gebe­ten, dar­aus ein Musik­stück zu machen. Die KI ver­ton­te den Buchanfang.

    KI-gene­riert

    Intern nennt Goog­le das gene­ra­ti­ve Musik­mo­dell Lyria 3. Es erstellt die Song­tex­te und ori­en­tiert bei Stil, Gesang und Tem­po an den Vor­ga­ben aus dem Prompt. „Das Ziel die­ser Tracks ist nicht die Erschaf­fung eines musi­ka­li­schen Meis­ter­werks, son­dern viel­mehr eine unter­halt­sa­me, ein­zig­ar­ti­ge Art, sich selbst aus­zu­drü­cken“, teil­te das Unter­neh­men mit. Es ließ offen, ob künf­tig auch län­ge­re Tracks mög­lich wer­den. Lyria wird auch bei You­tube ein­ge­baut und soll dort die „Shorts“ ver­bes­sern, das Gen­re der Kur­vi­de­os in dem Netzwerk.

    Hin­ter­legt wer­den dabei in jedem Track nicht wahr­nehm­ba­re Was­ser­zei­chen zur Iden­ti­fi­zie­rung von KI-gene­rier­ten Inhal­ten. Man habe bei der Ent­wick­lung von Lyria 3 streng auf Urhe­ber­rech­te und Part­ner­ver­ein­ba­run­gen geach­tet, sagt Goog­le. „Wenn Sie einen spe­zi­fi­schen Künst­ler nen­nen, nutzt Gemi­ni dies als brei­te krea­ti­ve Inspi­ra­ti­on für Stil oder Stim­mung.“ Neben Eng­lisch und Deutsch kann Lyria 3 Spa­nisch, Fran­zö­sisch, Hin­di, Japa­nisch, Korea­nisch und Portugiesisch.

  • Die besten Prompts für die Familienfeier

    Die besten Prompts für die Familienfeier

    Die KI kennt in ihrem Welt­wis­sen aller­lei Dra­men, Spie­le, Dreh­bü­cher aus Fil­men, Rezep­te. Die kann man sich zur anste­hen­den Fami­li­en­fei­er zunut­ze machen. Für Gast­ge­ber, Fami­li­en-CEOs und Frie­dens­wah­rer lässt sich so der Stress redu­zie­ren, logis­ti­sche Prä­zi­si­on pla­nen und hof­fent­lich Har­mo­nie erzeu­gen. Die Maschi­ne lie­fert all­tags­taug­li­che Bera­tung, wenn man sie mit den rich­ti­gen Prompts befragt.

    Um 19 Uhr gibt’s Essen

    Zeit­plan fürs Hei­lig­abend-Menü: Die KI hat errech­net, dass es um 16.30 Uhr mit der Zube­rei­tung fürs 19-Uhr-Essen los­ge­hen soll­te. (Screen­shot: Mar­cus Schwarze/Gemini, KI-generiert)

    Koch­plan erstel­len: „Ich ser­vie­re an Hei­lig­abend um 19 Uhr fol­gen­des Menü: Kar­tof­fel­gra­tin, Gar­zeit 50 Minu­ten, Schwei­ne­me­dail­lons, Gar­zeit 15 Minu­ten im Ofen, und als Bei­la­ge fri­scher Feld­sa­lat. Erstel­le mir einen rück­wärts gerech­ne­ten Zeit­plan. Begin­ne beim Ser­vier­zeit­punkt. Sage mir genau, wann ich was schnei­den, vor­hei­zen, in den Ofen schie­ben oder ruhen las­sen muss, damit alles gleich­zei­tig heiß auf den Tisch kommt. Pla­ne 15 Minu­ten Puf­fer ein.“

    Gemi­ni erstellt draus einen gene­ral­stabs­mä­ßi­gen Koch­plan. Los geht es um 16.30 Uhr damit, Kar­tof­feln zu schä­len und in dün­ne Schei­ben zu schnei­den, Knob­lauch zu hacken und den Salat zu waschen. Ab 17.25 Uhr soll der Ofen vor­ge­heizt wer­den, ab 17.40 Uhr das Gra­tis auf die mitt­le­re Schie­ne gescho­ben wer­den. Ab 18.25 Uhr wird das Fleisch vor­be­rei­tet, um 18.30 Uhr das Gra­tin aus dem Ofen genom­men und mit dem Fleisch getauscht. Gegen 18.50 fina­li­siert man den Salat, um 19 Uhr gibt es Essen. Wer will, ergänzt im Prompt die Namen der Fami­li­en­mit­glie­der und bit­tet die Maschi­ne, die Auf­ga­ben auf­zu­tei­len, samt Küche put­zen und Abwasch. Ein Vor­teil des KI-gene­rier­ten Küchen­plans: Er liegt ein­fach vor, schafft Tat­sa­chen und muss nicht müh­sam dis­ku­tiert werden.

    Diplomatie und Grenzziehung

    Heik­le The­men umschif­fen: „Beim Fami­li­en­es­sen könn­te das The­ma AfD auf­kom­men, beson­ders durch Onkel Wer­ner. Er argu­men­tiert ger­ne, dass man die AfD wäh­len müs­se, um es „denen da oben mal rich­tig zu zei­gen“, weil die eta­blier­ten Par­tei­en ver­sagt hät­ten (The­ma Migra­ti­on, Hei­zungs­ge­setz und Gen­dern). Gib mir drei ele­gan­te Sät­ze, um das The­ma zu wech­seln, ohne unhöf­lich zu wir­ken. Schla­ge danach drei ‚siche­re’ Gesprächs­the­men vor, die sowohl die 16-jäh­ri­ge Nich­te als auch die 80-jäh­ri­ge Groß­mutter inter­es­sie­ren könnten.“

    Gemi­ni emp­fiehlt zur Ent­schär­fung, Diplo­ma­tie gepaart mit kla­rer Grenz­zie­hung ein­zu­set­zen. Die KI schlägt einen Appell an die Gemüt­lich­keit vor: „Wer­ner, ich mer­ke, wie sehr dich das ärgert, und im All­tag ist das alles ja auch belas­tend. Aber lass uns doch heu­te Abend mal eine bewuss­te poli­tik­freie Zone aus­ru­fen und die Zeit nut­zen, um zu hören, wie es uns eigent­lich geht – ganz ohne Nach­rich­ten.“ Für den Wech­sel des Gesprächs­the­mas schlägt die KI unter ande­rem vor, die Oma zu befra­gen, wel­che Mode sie mit 16 trug trug, die ihre Eltern schreck­lich fan­den, und die Nich­te, was gera­de Trend ist und die Alten nicht ver­ste­hen. Die Nich­te fühlt sich als Die Nich­te fühlt sich als Exper­tin für das „Jetzt“ ernst genom­men, und die Groß­mutter kann oft über­ra­schend wil­de Geschich­ten aus ihrer Jugend erzählen.

    Schnell umsetzbare Geschenkidee

    Gemi­ni hat die Kurz­ge­schich­te und ein Bild für eine Wein­rol­le ent­wor­fen. (Screen­shot: Mar­cus Schwarze/Gemini, KI-generiert)

    Geschenk in letz­ter Minu­te: „Ich brau­che noch ein Geschenk für den Schwie­ger­va­ter. Er ist prag­ma­tisch, mag Wein, hasst Staub­fän­ger, liebt Geschich­te. Das Bud­get liegt bei 50 Euro. Nen­ne mir 5 kon­kre­te Ideen, die ich ent­we­der digi­tal sofort besor­gen kann oder die in einem gut sor­tier­ten Geschäft noch ver­füg­bar sind. Bit­te kei­ne gene­ri­schen Gutscheine.“

    Gemi­ni ent­wirft eine Grund­re­gel: Ver­brauch statt Besitz oder Wis­sen und Erleb­nis statt Deko­ra­ti­on. Unter den fünf Vor­schlä­gen ist ein „his­to­ri­scher“ Wein von einem der ältes­ten Wein­gü­ter, die KI nennt Klos­ter Eber­bach im Rhein­gau. Als Clou schlägt Gemi­ni vor, kurz die Geschich­te des Wein­guts über die Zis­ter­zi­en­ser­mön­che auf einem schö­nen Papier aus­zu­dru­cken und es als Schrift­rol­le um den Fla­schen­hals zu hän­gen. „War­um es passt: Es ist Wein (mag er), hat Geschich­te (liebt er) und wird getrun­ken (kein Staub­fän­ger)“, argu­men­tiert die Maschine.

    Mit dem rich­ti­gen Prompt stellt Gemi­ni die Wein­rol­le frei, illus­triert sie und lie­fert eine druck­ba­re Datei. (Screen­shot: Mar­cus Schwarze/Gemini, KI-generiert)

    Die Geschich­te des Klos­ters kann Gemi­ni gleich dazu erstel­len: „Mach mir eine kur­ze Geschich­te über das Wein­gut Klos­ter Eber­bach und die Zis­ter­zi­en­ser­mön­che für einen Aus­druck auf einem schö­nen Papier, um es als Schrift­rol­le um den Fla­schen­hals zu hän­gen.“ Bei dem Ergeb­nis zeigt Gemi­ni eine Funk­ti­on „Ant­wort über­prü­fen“, mit der sie eigen­stän­dig nach Kern­aus­sa­gen im Text goo­gelt. Schwenkt man dann im Chat zu „Bild erstel­len“, kann man mit dem Prompt „Mach das als Illus­tra­ti­on“ ein Bild über die Geschich­te des Wein­guts erzeu­gen. Übli­cher­wei­se erzeugt Gemi­ni Bil­der im Quer­for­mat, in die­sem Bei­spiel als Sze­ne mit einem umge­ben­den Wein­kel­ler. Wer nur das Doku­ment haben möch­te, kann nach­schär­fen: „Gib mir nur das Doku­ment in der Mit­te, ohne die Sze­ne drum­her­um, im Hoch­for­mat zum Aus­dru­cken auf A4.“ Voi­là, fer­tig ist eine druck­ba­re Fas­sung von „Ora et Labo­ra – das Erbe von Eberbach“.

    Spiel für die Zeit bis zur Bescherung

    Rate­spiel für die Fami­li­en­fei­er: Wel­ches Sprich­wort steckt in die­sen Emo­jis? (Screen­shot: Mar­cus Schwarze/Gemini, KI-generiert)

    Gene­ra­tio­nen­quiz erfin­den: „Erstel­le ein Kon­zept für ein 30-minü­ti­ges Fami­li­en­quiz, das glei­cher­ma­ßen für die Groß­el­tern (Boo­mer) und die Enkel (Gen Z/Alpha) fair ist. Gib mir 3 Kate­go­rien (zum Bei­spiel ‚Tech­nik von damals vs. heu­te‘, ‚Musik-Hits‘, ‚Fami­li­en-Mythen‘) und für jede Kate­go­rie drei Bei­spiel­fra­gen, die gene­ra­tio­nen­über­grei­fen­des Wis­sen erfor­dern oder Team­ar­beit fördern.“

    Gemi­ni erfin­det ein 30-minü­ti­ges Fami­li­en­quiz, bei dem die Groß­el­tern gegen die Enkel spie­len. Die Enkel müs­sen das „Speichern“-Symbol in Word erklä­ren (eine 3,5‑Zoll-Diskette, wie­viel Spei­cher sie hat­te und mehr), die Groß­el­tern sol­len den Begriff „Cloud“ erklä­ren. Ande­re Fra­gen aus dem KI-Vor­schlag dre­hen sich um Begrif­fe wie „Band­sa­lat“, „Crin­ge“ und „Ghos­ting“. Im Team­du­ell zeigt der Mode­ra­tor alte Sprich­wör­ter („Reden ist Sil­ber, Schwei­gen ist Gold“), die nur als Emo­jis dar­ge­stellt wer­den und von den Spie­lern über­setzt wer­den müs­sen. Im drit­ten Teil spielt man auf dem Han­dy aus­ge­wähl­te Songs nur kurz an, die einer­seits auf Tik­Tok viral gegan­gen sind und ande­rer­seits der älte­ren Gene­ra­ti­on bekannt sind – wie zum Bei­spiel „Run­ning up that Hill“ von Kate Bush aus den acht­zi­ger Jah­ren, das kürz­lich durch die Serie „Stran­ger Things“ einen neu­en Höhen­flug erleb­te. Die Gemi­ni-App auf dem Han­dy kann für alle Quiz­fra­gen neue Bei­spie­le fin­den. Wer ver­mei­den möch­te, lan­ge auf dem Han­dy her­um­zu­tip­pen, kann die KI per gespro­che­ner Spra­che ansprechen.

    Die Kinder beschäftigen, ohne Bildschirm

    Kin­der-Manage­ment: „Bis zur Besche­rung sind es noch zwei Stun­den, die Kin­der (Alter 6 bis 10 Jah­re) wer­den unru­hig, und die Erwach­se­nen wol­len sich unter­hal­ten. Schla­ge drei Spie­le oder Akti­vi­tä­ten vor, die die Kin­der beschäf­ti­gen, aber kei­ne Vor­be­rei­tung und kei­ne Bild­schir­me (Tablets/Handys) erfor­dern. Nut­ze nur Din­ge, die an Weih­nach­ten ohne­hin her­um­lie­gen (Geschenk­pa­pier-Res­te, Nüs­se, Kar­tons, Stifte).“

    Gemi­ni schlägt ein Nuss-Boc­cia vor: Jedes Kind bekommt eine Hand­voll Wal­nüs­se. Auf­ga­be ist, sie mög­lichst nah an eine klei­ne Hasel­nuss zu rol­len. In einem ande­ren Spiel bekommt der Nach­wuchs die Auf­ga­be, aus Res­ten von Geschenk­pa­pier, lee­ren Kar­tons, Kle­be­band und Geschenk­band die ver­rück­tes­ten Hüte für Weih­nach­s­wich­tel zu desi­gnen, Kra­wat­ten, Arm­bän­der und Kos­tü­me. Sie bekom­men dafür 45 Minu­ten Zeit im Kin­der­zim­mer und sol­len die Krea­tio­nen danach den Erwach­se­nen auf einem Lauf­steg im Wohn­zim­mer vorführen.

    Nicht erreichbar sein

    Abwe­sen­heits­no­tiz: „Ent­wirf eine Abwe­sen­heits­no­tiz für mei­ne geschäft­li­che E‑Mail (Zeit­raum 24. Dezem­ber bis 2. Janu­ar). Der Ton soll pro­fes­sio­nell und sou­ve­rän sein, aber mit einem char­man­ten, win­ter­li­chen Twist, der im Gedächt­nis bleibt. Signa­li­sie­re klar, dass ich nicht erreich­bar bin und E‑Mails nicht wei­ter­ge­lei­tet wer­den, ohne dabei abwei­send zu klingen.“

    Gemi­ni schlägt drei Optio­nen vor, dar­un­ter eine Betreff­zei­le „Win­ter­ru­he & Fri­scher Wind für 2025 ❄️“, am Ende mit einem Emo­ji für eine Schnee­flo­cke. Solch ein Emo­ji sei inzwi­schen auch im Busi­ness-Kon­text akzep­tiert, solan­ge es spar­sam ein­ge­setzt wird. Im freund­li­chen Ton erklärt die Abwe­sen­heits­no­tiz, dass man für ein paar Tage den Bild­schirm gegen Win­ter­luft und Fest­tags­ru­he aus­tauscht. Ver­bind­lich­keit erzeugt die Nach­richt den­noch: „Ich nut­ze die­se Zeit, um abzu­schal­ten und neue Ener­gie zu tan­ken, damit wir im neu­en Jahr wie­der gemein­sam Pro­jek­te vor­an­brin­gen können.“

  • Post vom KI-Wagner

    Post vom KI-Wagner

    „Nie­mand, schon gar kei­ne KI, wäre in der Lage, all die Asso­zia­tio­nen, Vol­ten und Haken hin­zu­be­kom­men, die eine durch­schnitt­li­che ‚Post [von Wag­ner]‘ aus­ma­chen.“ So schrieb Lukas Hein­ser in der „Frank­fur­ter All­ge­mei­nen Sonn­tags­zei­tung“ kurz vor dem Tod Wag­ners über die Stim­me der Ver­nunft, wie Hein­ser ihn bezeichnete.

    Fünf­mal die Woche ver­fass­te Wag­ner Brie­fe an Prot­ago­nis­ten unse­rer Zeit. Er knöpf­te sich Kanz­ler, Putin und gefühls­kal­te Fuß­bal­ler vor, pries eine abge­säg­te Ver­fas­sungs­ge­richt-Kan­di­da­tin und hul­dig­te einer abge­stürz­ten Berg­stei­ge­rin.

    Die simp­len Sät­ze Wag­ners waren oft erha­ben. Sei­ne Gedan­ken erfri­schend. Wag­ner über­rasch­te als Opi mit gesun­dem Men­schen­ver­stand, schrieb Hein­ser. „An guten Tagen waren Sie tat­säch­lich der Seis­mo­graf für das gesun­de Volks­emp­fin­den. An ande­ren Tagen hat­ten Sie immer­hin inter­es­san­te Gedan­ken. Immer, sag­ten Sie, such­ten Sie den ‚per­fek­ten Satz‘.“ So schreibt Micky Bei­sen­herz in sei­nem Nach­ruf bei der „Süd­deut­schen Zeitung“.

    „Was hät­test Du in Dei­nem letz­ten Brief an Dich selbst geschrie­ben? ✍️“, fragt der frü­he­re „Bild“-Chefredakteur Kai Diek­mann. Das weiß nie­mand. Doch lässt sich die KI füt­tern mit Wag­ners Tex­ten, mit sei­nen Nach­ru­fen, sei­ner Bio­gra­fie, mit Beur­tei­lun­gen von außen.

    Zu mei­ner Über­ra­schung erstell­te Künst­li­che Intel­li­genz eine Ode an die Worte:

    Post von Wagner

    Lie­be Worte,

    ihr wart mein Sau­er­stoff. Ohne euch war ich nichts.

    Heu­te seid ihr still. Mein wei­ßer Stuhl ist leer.

    Ist das der Tod? Ein Zim­mer, in dem kei­ner mehr tippt.

    Ich war ein alter Mann und wur­de zum Überraschungsfeministen.

    War­um haben sie Angst vor klu­gen Frauen?

    Ich glau­be: Sol­che Frau­en brau­chen wir.

    Das lern­te ich von mei­ner Mut­ter auf der Flucht. Stär­ke hat ein Gesicht.

    Ich habe oft falsch gele­gen, manch­mal richtig.

    Drei von fünf Sät­zen – das war ein guter Tag.

    Glück ist ein Kuss, der nichts kos­tet. Ich rei­che Ihnen die Hand.

    Auch wenn wir streiten.

    Ich hat­te Angst vor dem Tod.

    Jetzt sehe ich ihn wie einen vol­len Mond über St. Tropez.

    Ein Fels im Bran­dy – und ich schwim­me ruhig.

    Passt auf die klu­gen Frau­en auf.

    Auf die Kinder.

    Auf die Wahr­heit der ein­fa­chen Sätze.

    Heu­te schreibt das Schweigen.

    Ihr fehlt mir.

    Herz­lichst,

    Ihr Franz Josef Wagner

    (KI-gene­riert)

  • GPT‑5 ist da

    GPT‑5 ist da

    Der Todes­stern reprä­sen­tiert in Fil­men der Star-Wars-Rei­he auto­ri­tä­re Kon­trol­le und tota­li­tä­re Macht. Er ver­kör­pert eine dunk­le Kraft, die ver­nich­tet, aber letzt­lich durch die „gute“ Sei­te besiegt wird. So geschieht es zwei Mal in den Sci­ence-Fic­tion-Fil­men. „Beim Tes­ten von GPT‑5 hat­te ich Angst. Ich schau­te es mir an und dach­te: Was haben wir da getan? Es ist wie das Man­hat­tan-Pro­jekt“, sag­te Alt­man in einem Pod­cast. Er spiel­te damit auf das streng gehei­me US-For­schungs­pro­gramm wäh­rend des Zwei­ten Welt­kriegs zur Ent­wick­lung der ers­ten Atom­bom­be an. Die Ent­wick­ler des Man­hat­tan-Pro­jekts waren spä­ter erschüt­tert von dem, was ihre Tech­no­lo­gie ange­rich­tet hat­te. Alt­man signa­li­siert damit, unge­wöhn­lich für einen Unter­neh­mer einer neu­en KI, ein ähn­li­ches Unbe­ha­gen: eine Tech­no­lo­gie, die womög­lich über das hin­aus­geht, was kon­trol­lier­bar ist. Es gebe nie­man­den, der hier wirk­lich die Ver­ant­wor­tung über­nimmt: „The­re are no adults in the room.“

    Unab­hän­gig von solch einem gewiss auch dra­ma­ti­sie­ren­den Wer­be-Stunt: GPT‑5 ist das fort­schritt­lichs­te Modell von Ope­nAI und bie­tet laut Ankün­di­gung erheb­li­che Ver­bes­se­run­gen in Bezug auf Argu­men­ta­ti­on, Code­qua­li­tät und Benut­zer­er­fah­rung. Es bewäl­tigt kom­ple­xe Pro­gram­mier­auf­ga­ben mit mini­ma­len Auf­for­de­run­gen, lie­fert kla­re Erklä­run­gen und führt ver­bes­ser­te Agen­ten­funk­tio­nen ein, was es zu einem leis­tungs­star­ken Pro­gram­mier­part­ner und intel­li­gen­ten Assis­ten­ten für alle Benut­zer macht. Die KI steht dabei als ein­heit­li­ches inte­grier­tes Modell bereit, ohne dass man eine der Modell­va­ri­an­ten aus­wäh­len muss.

    Wie ein ers­ter Tes­ter schrieb (ich habe es selbst zur­zeit noch nicht getes­tet, das folgt aus­ge­ruht für die nächs­te F.A.Z.-PRO-Digitalwirtschaft), sol­len beson­ders die Pro­gram­mier­fä­hig­kei­ten her­aus­ra­gen: Die KI befolgt „autis­tisch“ die Anwei­sun­gen und ruft inter­ne Werk­zeu­ge ab. Ein ein­zi­ger Auf­ruf hat bei die­sem Test bis zu elf Datei­be­ar­bei­tun­gen bewirkt. Für Auf­ga­ben mit vie­len Schrit­ten bleibt die KI „auf Kurs“ und erle­digt alles selbst­stän­dig. Die KI habe Code geschrie­ben, „der ein­fach funk­tio­niert“. Wenn sich das bewahr­hei­tet, kon­kur­riert GPT‑5 direkt mit Start­ups wie Lova­ble, die KI-basier­te Pro­gram­mie­rung zu neu­en Fer­tig­kei­ten ent­wi­ckelt haben.

    (Screenshot: OpenAI)
    (Screen­shot: OpenAI)

    Dazu kom­men Fähig­kei­ten für gesund­heits­be­zo­ge­ne Fra­gen. „Es erkennt pro­ak­tiv poten­zi­el­le Pro­ble­me, stellt Rück­fra­gen und hilft dabei, Ergeb­nis­se zu ver­ste­hen“, kün­dig­te das Unter­neh­men an. Wich­tig sei aber, dass ChatGPT kei­ne medi­zi­ni­sche Fach­kraft ersetzt.

    GPT‑5 steht der Mit­tei­lung zufol­ge in einer ein­ge­schränk­ten Fas­sung bereits kos­ten­los bei ChatGPT zur Ver­fü­gung. Nut­zer des Tarifs Plus für 20 Dol­lar im Monat erhal­ten erwei­ter­tes Reaso­ning („Nach­den­ken“). „Plus“-Nutzer bekom­men für 200 Dol­lar im Monat Zugang zum vol­len Modell mit maxi­ma­lem KI-Gehirn­schmalz und ohne Begrenzungen.

    Voreingestellte Persönlichkeiten

    In den nächs­ten Tagen will Open AI zudem neue Funk­tio­nen frei­schal­ten, etwa zur Mar­kie­rung von Chats in ver­schie­de­nen Far­ben. Außer­dem führt das Unter­neh­men vor­ein­ge­stell­te Per­sön­lich­kei­ten ein, die unter­schied­li­che Kom­mu­ni­ka­ti­ons­sti­le fest­le­gen. Prä­gnant und pro­fes­sio­nell, nach­denk­lich und unter­stüt­zend oder sar­kas­tisch sol­len dann aus­wähl­bar wer­den. So holt man sich wahl­wei­se einen Zyni­ker, Robo­ter, Zuhö­rer oder Nerd auf den Bildschirm.

    Wahl­wei­se las­sen sich dem­nächst von der zah­len­den Kund­schaft das Gmail-Post­fach, der Goog­le-Kalen­der und Goog­le-Kon­tak­te ver­bin­den. ChatGPT erkennt der Mit­tei­lung zufol­ge, wann Mails und Kalen­der­da­ten rele­vant sein könn­ten und ruft ent­spre­chen­de Infor­ma­tio­nen ab.

  • Auf dem Weg zur Automatisierung

    Auf dem Weg zur Automatisierung

    Man­ches bei der digi­ta­len Arbeit ist so klein­tei­lig, da will man sich nicht lan­ge mit Details beschäf­ti­gen. Man klickt sich so durch, über die immer glei­chen Wege, und fragt sich am Ende: Kann ich das nicht auf eine der Funk­ti­ons­tas­ten legen, die auf der Mac-Tas­ta­tur 19-fach vor­han­den sind?

    • Wöchent­lich benö­ti­ge ich drei­mal eine Bild­da­tei in ein 1100 Pixel brei­tes For­mat mit 152 dpi umge­wan­delt. Also öff­ne ich das Bild in Pixel­ma­tor (frü­her war es Pho­to­shop), wand­le das Bild in 152 dpi und las­se es neu berech­nen für die gewünsch­te Brei­te. Diver­se Maus­klicks sind dafür nötig. Das geht doch schneller?
    • Für Screen­shots benö­ti­ge ich gele­gent­lich den Hell-Modus statt dem von mir bevor­zug­ten Dark­mo­dus. Irgend­wo in den Sys­tem­ein­stel­lun­gen muss man da einen Haken set­zen. Nur wo? Lässt sich die Umschal­tung auf die Tas­te F16 legen?
    • Noch simp­ler: Auf dem Mac hät­te ich ger­ne über die Tas­te F19 den Taschen­rech­ner auf­ge­ru­fen. In den Untie­fen der Sys­tem­ein­stel­lun­gen auf dem Mac ist dies hin­ter­leg­bar – nur wie?

    Die Anlei­tun­gen für die­se drei Auf­ga­ben fin­den sich in den Untie­fen des Webs. Man muss dafür goo­geln, das Pro­blem mit den Fund­stel­len abglei­chen, aus­pro­bie­ren und wei­ter­for­schen. Oder man han­gelt sich durch die Sys­tem­ein­stel­lun­gen des Macs, die inzwi­schen so unüber­sicht­lich wie die Menü­füh­rung in Micro­soft Word ist.

    Dank Künst­li­cher Intel­li­genz geht das jetzt schneller.

    Die Auf­ga­be für die Umwand­lung der Bild­da­tei samt ange­häng­tem „-1100px“ im Datei­na­men beschrieb mir ChatGPT o3 Schritt für Schritt. Mei­ne Fra­ge lau­te­te: „Wie kann ich eine Auto­ma­ti­sie­rung erzeu­gen, um aus Bild­da­tei­en eine neue Ver­si­on mit dem Zusatz ‑1100px im Datei­na­men zu erzeu­gen? Das Bild soll 152 dpi haben und 1100 Pixel breit sein. Es soll auf die Tas­te F17 reagie­ren.“ Punkt für Punkt ging die KI mit mir das Nöti­ge durch, führ­te knapp in die Geheim­nis­se von Shell-Skrip­ten ein und gab mir den nöti­gen Code. Es folg­te eine Anlei­tung, wie man das in ein Pro­gramm Auto­ma­tor auf dem Mac ein­fügt. Und es gab eine Anlei­tung, die gewünsch­te Funk­ti­ons­tas­te der Auf­ga­be zuzuweisen.

    Wie­der sind so ein paar Minu­ten am Tag gewon­nen. Und das gelingt auch mit den ande­ren zwei Auf­ga­ben minutenschnell. 

    ChatGPT o3 gibt’s nur kos­ten­pflich­tig bei Ope­nAI. Das ist inzwi­schen eine bes­se­re Such­ma­schi­ne als Goog­le: Sie berück­sich­tigt den Kon­text der Fra­ge, durch­sucht Dut­zen­de und manch­mal Hun­der­te von Web­sei­ten und macht sich einen Reim darauf.

    Die dabei gene­rier­ten Anlei­tun­gen sind nicht immer hun­dert­pro­zen­tig kor­rekt. Mal hei­ßen Menü­punk­te anders. Oder sie sind nicht auf­find­bar. Dann hilft ein schnel­ler Screen­shot – und, ihn bei o3 hoch­zu­la­den. Mes­ser­scharf schließt die KI dar­aus, dass offen­bar etwas nicht stimmt und der Screen­shot mit der Anlei­tung abzu­glei­chen ist. Wie­der goo­gelt o3 los, durch­sucht das Web nach pas­sen­den Infos und berei­tet eine neue Anlei­tung auf.

    Wo das noch hin­füh­ren könn­te, zeigt eine neue Anwen­dung von Goog­le. Opal erstellt Pro­zess­plä­ne für Auf­ga­ben. In natür­li­chen mensch­li­chen Wor­ten beschreibt man die Auf­ga­be. Die Anwen­dung zer­legt das in ein Dia­gramm für erwar­te­te Ein­ga­ben und Uploads, eine Goog­le-Suche nach wei­te­ren Infor­ma­tio­nen und eine anschlie­ßen­de Ver­ar­bei­tung aller Erkennt­nis­se für Blog­posts und ein Video. Die Mach­art erin­nert an den deut­schen Dienst n8n, bei dem man sich ähn­li­che Work­flows zusam­men­kli­cken kann. Bei Goo­gles Opal nur eben ohne Expertentum.

    Goog­le bezeich­net die KI-gestütz­te Tech­nik aus­drück­lich als Expe­ri­ment. Wer weiß, ob dar­aus ein markt­fä­hi­ges Pro­dukt in Kon­kur­renz zu n8n und dem schwe­di­schen Start­up Lova­ble wird, das eben­falls eine star­ke App zur Pro­gram­mie­rung bereit­stellt. Gegen­wär­tig ist Opal nur per VPN-Ein­wahl in die USA zugäng­lich und dort kos­ten­los. „Füge eine Funk­ti­on hin­zu, das Video auto­ma­tisch auf Social-Media-Kanä­len des Nut­zers zu ver­öf­fent­li­chen. Hole Dir für jeden Post sei­ne Freigabe.“ 

    Mei­ne Tas­te F15 wäre dafür noch frei.

  • Neues Buch: Perfektes Prompten – über den Einsatz von Künstlicher Intelligenz im Berufsalltag

    Neues Buch: Perfektes Prompten – über den Einsatz von Künstlicher Intelligenz im Berufsalltag

    Die­ses Buch bie­tet Ihnen:

    • Kla­re Anlei­tun­gen: Ler­nen Sie, wie Sie prä­zi­se Prompts for­mu­lie­ren und die KI gezielt steuern.
    • Fort­ge­schrit­te­ne Tech­ni­ken: Nut­zen Sie Metho­den wie Few-Shot-Promp­ting und den Auf­bau einer Prompt-Bibliothek.
    • Ethik im Fokus: Ver­ste­hen Sie die recht­li­chen und ethi­schen Aspek­te der KI-Nutzung.
    • Assis­ten­ten und Agen­ten im Ein­satz: Eine Anlei­tung zum schnel­len Erstel­len eige­ner Hel­fer­lein für All­tags­ar­bei­ten im Büro.

    Ob Ein­stei­ger oder Pro­fi, die­ses Buch ist Ihr Schlüs­sel zu einer erfolg­rei­chen Zusam­men­ar­beit mit KI.

    Das PDF mit 157 Sei­ten gibt es hier und das Taschen­buch sowie das E‑Pub-For­mat im Ama­zon-Shop. Abon­nen­ten mei­nes per­sön­li­chen News­let­ters erhal­ten das PDF hier vergünstigt.

    Leseprobe

    (22 von 157 Seiten)

  • Made in Germany?

    Made in Germany?

    Der bes­te Titel beim Euro­vi­si­on Song Con­test bricht alle Vor­schrif­ten. Er holt mehr als die erlaub­ten sechs Tän­zer auf die Büh­ne, dau­ert dop­pelt so lang wie die zuläs­si­gen drei Minu­ten, und abstim­men darf man für ihn nicht. „Made in Switz­er­land“ sin­gen da Hazel Brug­ger und San­dra Stu­der gekonnt im Stil eines Broad­way-Musi­cals, unter­stützt von Petra Mede als Arm­brust­schüt­zin in der Gestalt von Wil­helm Tell. Der Ur-Schwei­zer hat­te in den fünf­zi­ger Jah­ren des 13. Jahr­hun­derts das Land geeint. Er form­te die Visi­on von einer Welt ohne Spal­tung. Die Idee, wenn auch so noch nie erzählt: ein Musik­wett­be­werb. Die „Euro­vi­si­on“ war geboren.

    Mit viel Witz und Selbst­iro­nie besin­gen und betan­zen die Schwei­ze­rin­nen ihre Errun­gen­schaf­ten. Neben den Schwei­zer Uhren und der Scho­ko­la­de rüh­men sie sich des Schmelz­kä­ses, des Kar­tof­fel­schä­lers und des Schwei­zer Taschen­mes­sers. Die E‑Gitarre und das Müs­li, das Inter­net und LSD stam­men aus dem Alpen­land. Die größ­te Leis­tung aber war die von Wil­helm Tell. Man sei so arm gewe­sen, dass sogar der Käse Löcher hat­te. Doch Tell führ­te die Eid­ge­nos­sen in eine neue Zeit. Nur 500 Jah­re spä­ter wur­de sei­ne Euro­vi­si­on Rea­li­tät, gegrün­det, na klar, in der Schweiz.

    Wäre so ein ver­gnüg­li­cher Titel in Deutsch­land möglich?

    Drei KIs habe ich dar­an dich­ten las­sen. Note­book­LM besorg­te den Song­text aus dem You­Tube-Video. ChatGPT o3 defi­nier­te die Kli­schees und Errun­gen­schaf­ten deut­scher Dich­ter, Den­ker und Tüft­ler. Vor­schlä­ge reich­ten vom MP3-Musik­for­mat bis zum Pfand­fla­schen­per­fek­tio­nis­mus, vom DSGVO-kon­for­men Gesicht­spi­xel­fil­ter bei jeder Nah­auf­nah­me des Song Con­tests bis zur VAR-Prü­fung der gesun­ge­nen Ton­hö­he mit­tels Video­schieds­rich­tern aus dem Köl­ner Keller.

    Und o3 ersann im drit­ten Durch­lauf dar­aus einen neu­en Text gemünzt auf die Deut­schen. Im Metrum der Schwei­zer Melo­die, mit den ent­spre­chen­den Vers­län­gen und ange­pass­ten Zwi­schen­spie­le. Die Maschi­ne erfand fol­gen­den Text.


    Gesprochenes Intro (gleiches Tempo, gleiche Taktzahl wie das Original)

    In twen­ty-ten the ESC moved back to Ger­ma­ny after Lena’s litt­le Satel­li­te spun to the stars.
    And now the tro­phy cir­cles once again abo­ve this land of beer foams and bina­ry code.
    Hos­ting Euro­vi­si­on is the per­fect chan­ce to polish cli­chés till they sparkle—then drop them on the flo­or.
    Becau­se what comes to mind when some­bo­dy says “Ger­ma­ny”?
    Only high­ways with no speed limit, brat­wurst bazaars and a sche­du­le that sca­res the sun?
    Nein! The­re is more than leder­ho­sen line-dancing and Okto­ber­fest sel­fies.
    The best inven­ti­ons were ham­me­red, prin­ted or bre­wed right here. For example…

    Gesungene Liste (Viertelnotentakt)

    Instant cof­fee, pocket recor­der, poly­car­bo­na­te, the hum­ble gum­my bear,
    micro­chips that do the math while ever­yo­ne still counts on fin­gers in the air!
    So—let’s sing it.

    REFRAIN 1 (identische Taktstruktur zum Schweizer Refrain)

    Made in Ger­ma­ny, like the prin­ting press and Pils.
    Made in Ger­ma­ny, like the motor­way for thrills.
    Made in Ger­ma­ny, and when a hea­da­che kills, just reach for Aspi­rin—
    that’s Made in Ger­ma­ny!
    The trus­ty air-bag, cue the crash-test dum­my—
    it’s Made in Germany!

    Vers 1 (gleiches Silbenmuster)

    Think of punc­tu­al trains (okay, the myth still lives),
    of fol­ders colour-coded, every stamp pre­cis­e­ly gives.
    Yet back­stage hums a tech­no-dream in frac­tal mid­night light;
    MP3 shrinks hearta­che down to three oh-three tonight.
    (whisper) “Three extra seconds—don’t tell the EBU.”

    Vorchor (über vier Takte gesprochen)

    Behind each DIN-sized paper sheet hides a sci­en­tist with glit­ter on the lab coat.

    REFRAIN 2

    Made in Ger­ma­ny like the X‑ray’s ghost­ly gleam.
    Made in Ger­ma­ny like the zip­per on your jeans.
    Made in Germany—chip-card pays the pyro beam, the safe­ty check is free.
    LEDs that blind the jury—
    all Made in Germany!

    Story-Interlude (gleiche komödiantische Kadenz wie der Abschnitt „William Tell“)

    In the mid-fif­te­enth cen­tu­ry
    Mon­ks still hoard­ed scrolls; town criers strai­ned their lungs.
    A rest­less golds­mith, Johan­nes Guten­berg, sig­hed:
    “The­se parch­ment dumb­bells must go—let let­ters dance!”
    He cast fresh type, ink kissed the page, rumours found rhythm…
    Crowds shou­ted, “Print the score—make music a con­test!”
    He named it ‘Print-Visi­on’. A typo drop­ped the P,
    and sud­den­ly it read Euro-Visi­on.
    His­to­ri­cal fact—please don’t goog­le it.

    Promi-Cameo-Lauf (acht Takte, passendes Schweizer Tempo)

    Ange­la Mer­kel struts on, whis­pers dead­pan “Yes, we can mea­su­re that.”
    Albert Ein­stein raps, “Time dila­tes when twel­ve points hesi­ta­te.”
    Till Lin­de­mann hoists a flame—immediately dou­sed by TÜV offi­cers in hi-vis ves­ts.
    Hele­ne Fischer back-flips with rain­bow gum­my bears rai­ning down.
    Dirk Nowitz­ki slam-dunks an over­si­ze 12 into the green-room basket.

    SCHLUSSCHORUS (einen ganzen Ton höher, gleiche Länge)

    Made in Ger­ma­ny, from die­sel thump to dro­ne,
    Made in Ger­ma­ny, from Beethoven’s metro­no­me.
    Made in Ger­ma­ny, the voting system’s chrome—blame spreadsheet wizar­dry.
    Rai­se a Stein, ali­gn the beat,
    Euro-Visi­on, on repeat—
    Made… in… Ger-ma-ny-eeeee!

    Outro gesprochen (Acht-Beat-Takt)

    If any points go miss­ing, chalk it up to Teu­to­nic fine-tuning—never to bad arithmetic.


    Da sitzt noch nicht jede Ana­lo­gie. Nicht alles was hinkt, ist ein Ver­gleich. Und ob im Detail der Reiß­ver­schluss und der Instant­kaf­fee aus Deutsch­land oder der Schweiz stam­men, wis­sen die Neu­see­län­der und Ame­ri­ka­ner bes­ser. Der Kaf­fee­fil­ter von Melit­ta Bentz könn­te bes­ser passen.

    Doch ist der KI-Text eine schö­ne Wider­le­gung der The­se, Künst­li­che Intel­li­genz kön­ne kei­ne Krea­ti­vi­tät, und sie kön­ne nur neu zusam­men­stel­len, womit sie ein­mal trai­niert wurde.

    Das Schwei­zer Lied wur­de von Lukas Hobi und Chris­ti­an Knecht geschrie­ben, von Pele Loria­no, Ben­ji Ala­su und Wojciech Kostrze­wa arran­giert und von Jon Hall­gren, Pele Loria­no und Ben­ji Ala­su pro­du­ziert. Über Wochen und Mona­te haben sie seit Janu­ar mit den drei Sän­ge­rin­nen, einem Chor und den Tän­zern an „Made in Switz­er­land“ gear­bei­tet. Da kann eine hal­be Stun­de KI nicht mithalten.

    Aber auf Guten­berg statt Wil­helm Tell, den Reim von Pils auf Autobahn-„Thrills“ und den TÜV-Prü­fern am Feu­er­set der Büh­ne, da hät­te auch mensch­li­che Intel­li­genz län­ger drauf her­um­den­ken müs­sen. Der Schuss Genia­li­tät, er bleibt der Schweiz unbe­nom­men und zeugt von har­ter krea­ti­ver Arbeit. Doch die Ein­schüs­se der Maschi­nen kom­men näher. Guten­berg might appro­ve this print-visi­on, made in Germany.

    PS: Im Pod­cast Tech, KI und Schmet­ter­lin­ge von Sascha Lobo in Zusam­men­ar­beit mit Schwarz Digi­tal stel­le ich ein KI-Tool der Woche vor. Letz­te Woche ging’s um ein Werk­zeug zum Ent­lar­ven von Quatsch im Netz. An die­sem Mitt­woch vor­aus­sicht­lich um eine KI, die eine her­un­ter­ge­kom­me­ne Jung­ge­sel­len­bu­de umgestaltet.

    PPS: An jedem Monats­ers­ten bie­te ich ein Semi­nar für den Ein­satz von KI in der Pra­xis. Die Teil­nah­me per Zoom-Video kos­tet 90 Euro.