Schlagwort: Künstliche Intelligenz

  • Das Ende des Gewohnten, wie wir es kennen

    Das Ende des Gewohnten, wie wir es kennen

    Der Prompt für die­ses Bild bestand nur aus einem Wort: „Wiki­pe­dia“. (illus­tra­ti­on: Mar­cus Schwarze/Midjourney, KI-generiert)

    Wer wei­ter­hin alles von mir im News­let­ter lesen möch­te, der zah­le bit­te 8,88 Euro im Monat oder 88 Euro im Jahr. Wer nicht zahlt, erhält nur die kos­ten­frei­en News­let­ter und muss auf min­des­tens einen Bei­trag im Monat von mir verzichten.

    Das ist teu­er? Stimmt. Ande­rer­seits haben eini­ge Posts in den ver­gan­ge­nen sechs Mona­ten eine erstaun­li­che Kraft ent­wi­ckelt – und zwar bei einem Teil mei­ner Kund­schaft, Medi­en­un­ter­neh­men. Der eine und der ande­re woll­te an mei­nem erwor­be­nen Wis­sen teil­ha­ben, kauf­te auf­grund mei­ner Posts mei­ne redak­tio­nel­le Leis­tung für eige­ne Ver­öf­fent­li­chun­gen ein. Auch in der Bera­tung tat sich für mich eini­ges: Was soll­te wohl jetzt ein Ver­lag im Zuge der künst­li­chen Intel­li­genz, die an allen Orten auf­kommt, unter­neh­men? Wie ändert sich unser Arbei­ten? Unser Geschäfts­mo­dell? Ich dan­ke der neu­en gefun­de­nen Kund­schaft – und ins­be­son­de­re jenem Kol­le­gen, der frei­wil­lig für ein Jah­res­abo von mir zah­len wollte.

    Die Erschei­nungs­wei­se mei­nes News­let­ters bleibt bei „dann und wann“. Ich will nicht in den Click­bait­mo­dus ver­fal­len, auf Bie­gen und Bre­chen regel­mä­ßig Inhal­te lie­fern zu müs­sen. Statt­des­sen schrei­be ich wei­ter­hin aus Lust und Lau­ne, wenn ich mei­ne, etwas Gro­ßem auf der Spur zu sein.

    Das gro­ße The­ma wird eine Wei­le lang Künst­li­che Intel­li­genz sein. Aber beschrän­ken will ich mich im News­let­ter auf tat­säch­lich bemer­kens­wer­te Ent­wick­lun­gen. Man­che Bei­trä­ge blei­ben dann der zah­len­den Kund­schaft vor­be­hal­ten. So wie der fol­gen­de Text hier unter­halb die­ser Linie – zu sehen bekom­men ihn nur Abon­nen­tin­nen und Abon­nen­ten. Titel: Das Ende der Wiki­pe­dia, wie wir sie kennen.

    Blei­ben Sie mir gewogen.

    Mar­cus Schwarze

    P.S.: Bei der Preis­bil­dung 8,88 Euro im Monat bezie­hungs­wei­se 88 Euro im Jahr hat mir übri­gens ChatGPT‑4 gehol­fen – aus psy­cho­lo­gi­schen Grün­den sei dies ein bes­se­rer Preis als 9,99 bezie­hungs­wei­se 99,99 Euro.

    P.P.S: Ich bit­te um Ent­schul­di­gung wegen des Mixes aus Eng­lisch und Deutsch bei man­chen Funk­tio­na­li­tä­ten mei­nes News­let­ters. Der Dienst Sub­stack, den ich hier nut­ze, hat mir noch kei­ne Über­set­zungs­mög­lich­keit gezeigt.

    Illus­tra­ti­on: Midjourney/Schwarze, KI-gene­riert. Prompt: „Wiki­pe­dia“.

    Das Ende der Wikipedia, wie wir sie kennen

    Alex­an­der Cae­d­mon Karp hat vor einem Monat einen bemer­kens­wer­ten, fürch­ter­li­chen Gedan­ken über künst­li­che Intel­li­genz (KI) veröffentlicht:

    Es ist klar, dass die Raf­fi­nes­se und Kom­ple­xi­tät die­ser neu­es­ten Sys­te­me nur wei­ter zuneh­men wird. Die Her­aus­for­de­rung wird dar­in bestehen, sicher­zu­stel­len, dass sol­che Tech­no­lo­gien unse­rem kol­lek­ti­ven Wil­len unter­wor­fen blei­ben. Wir müs­sen der von uns erstell­ten Soft­ware unse­re Wer­te auf­er­le­gen, sonst kann sie uns einen auf­stre­ben­den und unein­ge­schränk­ten Satz von Wer­ten auferlegen.

    Die­se Über­set­zung sei­nes eng­li­schen Tex­tes gab mir Siri, die KI von Apple. Karp wirbt in sei­nem Bei­trag eigent­lich für AIP, eine Arti­fi­ci­al intel­li­gence Plat­form, die in Kür­ze herauskommt.

    Alex­an­der Karp ist nicht irgend­je­mand. Er ist Mil­li­ar­där und CEO von Palan­tir. Der gebür­ti­ge New Yor­ker pro­mo­vier­te an der Goe­the-Uni­ver­si­tät in Frank­furt am Main. 2003 grün­de­te er in Kali­for­ni­en zusam­men mit Peter Thiel Palan­tir. Das inzwi­schen mil­li­ar­den­schwe­re Unter­neh­men erstell­te eine Daten­ana­ly­se-Soft­ware, die ins­be­son­de­re US-Geheim­diens­te ver­wen­den. Sie ist in der Lage, aus gro­ßen Daten­men­gen Zusam­men­hän­ge und Fol­ge­run­gen zu erken­nen. Auch das baye­ri­sche Lan­des­kri­mi­nal­amt und das hes­si­sche Innen­mi­nis­te­ri­um wol­len die Pro­gram­me neu­er­dings ein­set­zen. Wäre da nur nicht das Bun­des­ver­fas­sungs­ge­richt: Es hat Rege­lun­gen als ver­fas­sungs­wid­rig unter­sagt, auf deren Grund­la­ge die Poli­zei gespei­cher­te per­so­nen­be­zo­ge­ne Daten in einer auto­ma­ti­sier­ten Daten­aus­wer­tung für die vor­beu­gen­de Bekämp­fung von Straf­ta­ten wei­ter ver­ar­bei­tet. Genau das, was die Palan­tir-Pro­gram­me ermög­li­chen. Auch Air­bus, BMW und Merck nut­zen die Software.

    Seit zwei Jahr­zehn­ten forscht und ver­kauft Palan­tir die­se Vor­läu­fer von künst­li­cher Intel­li­genz an Behör­den, Mili­tärs und ande­re. Nun kommt die neue Fas­sung auf den Markt, ver­knüpft sie mit den soge­nann­ten „Lar­ge Lan­guage Moduls“ (LLMs) – und ermög­licht dann Ant­wor­ten auf Fra­gen wie:

    Wel­che unse­rer Spe­zi­al­ein­hei­ten sind den feind­li­chen Pan­zer­po­si­tio­nen am nächs­ten und ver­fü­gen über aus­rei­chen­de Vor­rä­te an Jave­lin-Rake­ten, um eine Offen­si­ve zu star­ten? Und wel­che spe­zi­fi­schen Pan­zer sind auf dem Schlacht­feld am anfäl­ligs­ten für Angriffe?

    „Für Momen­te wie die­sen ist unser Unter­neh­men und unse­re Soft­ware gemacht“, beschreibt Karp in bes­tem ame­ri­ka­ni­schen Wer­be­sprech die rie­si­ge Bedeu­tung der rund­erneu­er­ten Soft­ware. Und doch warnt aus­ge­rech­net der heim­li­che Markt­füh­rer, wie ich ver­mu­te, in sei­nem pro­mi­nen­ten State­ment davor, dass die Soft­ware „uns ihre Wer­te“ auf­er­le­gen könn­te – und zwar unein­ge­schränkt. Die War­nung vor den Gefah­ren wirkt fast wich­ti­ger als die Wer­bung für das Pro­dukt: „Künst­li­che Intel­li­genz unse­rem kol­lek­ti­ven Wil­len unter­wer­fen“ lau­tet die Überschrift.

    (Illus­tra­ti­on: Midjourney/Schwarze)

    Was hat das alles mit Wiki­pe­dia zu tun?

    Das in der Wiki­pe­dia gesam­mel­te ein­zig­ar­ti­ge Welt­wis­sen ist beson­ders anfäl­lig für künst­li­che Intelligenzen.

    Bereits jetzt haben sich die Wiki­pe­dia­ner eini­ge Regeln auf­er­legt, wie die Lar­ge Lan­guage Models benutzt und nicht benutzt wer­den dür­fen. Die Kurz­fas­sung: KI darf beim Tex­ten assis­tie­ren, aber sämt­li­che Aus­sa­gen und Quel­len müs­sen über­prüft wer­den. Zudem müs­sen ent­spre­chend von Maschi­nen her­ge­stell­te Tex­te gekenn­zeich­net wer­den. Und: Auto­ma­ti­sier­te Text­ver­bes­se­run­gen sind untersagt.

    Letz­te­res aller­dings dürf­te sich kaum auf­hal­ten lassen.

    Das hat auch die Wiki­me­dia-Stif­tung erkannt, die hin­ter der Wiki­pe­dia steht:

    Die Fähig­keit, unse­re Pro­jek­te zu stö­ren, erfor­dert sehr wenig tech­ni­sches Know-how – der Haupt­schutz davor war in der Ver­gan­gen­heit der Man­gel an Wil­len. His­to­risch gese­hen war die Stö­rung meist leicht zu erken­nen. LLMs könn­ten die Fähig­keit besei­ti­gen, groß ange­leg­ten Miss­brauch zu iden­ti­fi­zie­ren, ins­be­son­de­re wenn er pro­du­ziert und auto­ma­ti­siert ist.

    Wie das geht, haben eini­ge KI-Enthu­si­as­ten mit­hil­fe der frei ver­füg­ba­ren Soft­ware AutoGPT demons­triert: Die­se Wei­ter­ent­wick­lung von ChatGPT ver­sucht, bestimm­te Auf­ga­ben zu lösen. Der KI-Agent könn­te bei­spiels­wei­se ange­wie­sen wer­den, eine Piz­za zu bestel­len, dann selb­stän­dig her­aus­fin­den, an wel­che Adres­se sie gelie­fert wer­den soll und wel­cher Lie­fer­dienst in der Nähe dazu in der Lage ist. Als letz­ten Schritt schließt die Maschi­ne die Bestel­lung eigen­stän­dig ab. Soweit die Theorie.

    In der Pra­xis ist die Soft­ware nicht leicht in Gang zu set­zen, fragt bei Arbeits­schrit­ten nach (was sich aus­schal­ten lässt) und löscht schon mal bei all­zu viel ein­ge­räum­ten Rech­ten unge­wünscht Datei­en. Der Auto­ma­tis­mus hol­pert noch.

    Das Grund­di­lem­ma ist damit jedoch bewie­sen. Es ist nur eine Fra­ge der Zeit, bis irgend­je­mand in der welt­wei­ten Wiki­pe­dia-Gemein­de den ers­ten AutoGPT-Kum­pel auf Wiki­pe­dia-Arti­kel ansetzt. Und dabei „ver­gisst“, die womög­lich sinn­vol­le Ände­rung durch den KI-Bot zu kenn­zeich­nen. Noch ist das nach mei­ner Kennt­nis nicht pas­siert, aber wie woll­te man dem bei täg­lich Tau­sen­den und Zehn­tau­sen­den von Text­än­de­run­gen auf die Schli­che kommen?

    Oder wie John Nos­ta for­mu­lier­te: Die Zahn­pas­ta ist aus der Tube und lässt sich nicht wie­der zurück­pres­sen. „Die größ­te Gefahr ist, dass ver­wen­de­te Quel­len durch künst­li­che Intel­li­genz gene­riert sein könn­ten und ent­spre­chen­de Medi­en­be­rich­te dar­auf basie­ren könn­ten“, sag­te Foto­graf Mar­tin Kraft bei einem Tref­fen von deut­schen Wiki­pe­dia­nern kürz­lich, wie Ziko van Dijk anschlie­ßend auf­schrieb. Ande­re tun dage­gen die Mög­lich­kei­ten des groß­flä­chi­gen Ein­sat­zes von künst­li­cher Intel­li­genz eher als Van­da­lis­mus ab. Und der kön­ne eben­so unter­bun­den wer­den wie bis­he­ri­ge Van­da­len­ta­ten – mit­hil­fe von Auto­ma­tis­men (sic!). Sie wür­de den Geist ja ger­ne zurück in die Fla­sche ste­cken, aber das sei eben nicht mög­lich, sag­te Amy Bruck­mann, Pro­fes­so­rin und Autorin des Buchs „Should You Belie­ve Wiki­pe­dia?“. So blei­be die ein­zi­ge Lösung, wie bis­her jeg­li­che Ände­run­gen durch die Wiki­pe­dia-Gemein­de über­prü­fen zu lassen.

    (Illus­tra­ti­on: Midjourney/Schwarze)

    Wer schon mal eine Lösch­dis­kus­si­on auf Wiki­pe­dia mit­er­lebt hat, weiß um die Deu­tungs­ho­heit von Wiki­pe­dia-Admins. An ihren PCs hocken da Men­schen, vor­wie­gend Män­ner, die mit gro­ßem Ernst und oft wenig Empa­thie über Mei­nun­gen ande­rer urtei­len. „Rele­vanz­kri­te­ri­en“ grei­fen häu­fig, ob ein Begriff über­haupt einen Wert hat, in die hei­li­ge Wiki­pe­dia auf­ge­nom­men zu werden.

    Da wird dann einer „Bun­des­gar­ten­schau“ eines bestimm­ten Jah­res schon mal von eini­gen Wiki­pe­dia­nern die Rele­vanz abge­spro­chen, obwohl sie längst beschlos­sen und mit einem mil­lio­nen­schwe­ren Etat aus­ge­stat­tet ist. (Gera­de so eben konn­te ich damals die Löschung des Ein­trags ver­hin­dern, als ich ein biss­chen digi­ta­le Öffent­lich­keits­ar­beit für das Pro­jekt über­nahm.) Jede Bau­rei­he der Deut­schen Bahn erfährt mehr Wür­di­gung, neh­men wir nur mal die DB-Bau­rei­he 605: „Spur­wei­te 1435“ mm, „Anzahl: 20“, „Aus­mus­te­rung: bis 2017“, „Achs­for­mel: 2’Bo’+Bo’2’+2’Bo’+Bo’2’“. Zitat aus dem ellen­lan­gen Arti­kel: „Wäh­rend der Fuß­ball-WM 2006 wur­de ein Teil der Züge im Char­ter­ver­kehr für aus­län­di­sche Fuß­ball­fan-Grup­pen ein­ge­setzt. Unter ande­rem beför­der­ten die zunächst neun reak­ti­vier­ten Züge Fuß­ball­fans aus Bra­si­li­en und Mexiko.[49]“ Da schnalzt der Wiki­pe­dia­ner vor Won­ne mit der Zun­ge, und der Laie wun­dert sich. Wie rele­vant ist das denn?

    Künst­li­che Intel­li­genz ist in der Lage, die Arti­kel nach gewis­sen Regeln zu über­ar­bei­ten. Sie könn­te im posi­ti­ven Sin­ne auch das gele­gent­lich gestör­te Ver­hält­nis man­cher frei­wil­li­ger Macher der Wiki­pe­dia zu Fra­gen der Rele­vanz zurecht­stut­zen. Ein biss­chen kür­ze­re Eisen­bahn­spie­le­rei hier, aus­führ­li­che­re The­ma­ti­sie­rung „wirk­lich rele­van­ter“ Themen.

    Fragt man aller­dings die KI von Bing nach den zehn rele­van­tes­ten und signi­fi­kan­ten The­men unse­rer Zeit, folgt die­se Liste:

    • Sta­tis­ti­sche Signifikanz (?)
    • Nach­hal­tig­keit
    • Kli­ma­wan­del
    • Digi­ta­li­sie­rung
    • Demo­kra­tie
    • Migra­ti­on
    • Gesund­heit
    • Kunst
    • Bil­dung
    • Sport

    „Sta­tis­ti­sche Signi­fi­kanz“ scheint mir ja eher ein Gesprächs­the­ma für AI-Bots unter­ein­an­der zu sein, aber was weiß ich schon.

    Und bei der Fra­ge, wel­ches The­ma die Maschi­ne „selbst“ am meis­ten inter­es­siert, nennt sie: die Digi­ta­li­sie­rung. Nicht etwa den Kli­ma­wan­del. Wel­che der bei­den Ent­wick­lun­gen ist wohl gefähr­li­cher für den Menschen?

    Oder wie es Palan­tir-Chef Karp formulierte:

    Die Risi­ken die­ser auf­kom­men­den Fähig­kei­ten der künst­li­chen Intel­li­genz für die indi­vi­du­el­len Rech­te und viel­leicht sogar für unse­re eige­ne phy­si­sche Sicher­heit sind für die meis­ten erheb­lich und offen­sicht­lich. Es kann sein, dass ein Bewusst­sein oder eine Eigen­wahr­neh­mung nicht das Ergeb­nis einer dis­kre­ten oder spe­zi­fi­schen Rei­he von Bezie­hun­gen inner­halb eines Netz­werks von Ver­bin­dun­gen dar­stellt, wie dem mensch­li­chen Gehirn, son­dern ledig­lich eine auf­kom­men­de Eigen­schaft eines aus­rei­chend kom­ple­xen Systems.

    • Tei­le die­ses Bei­trags wur­den mit Hil­fe der künst­li­chen Intel­li­gen­zen von Siri, ChatGPT‑4, Bing, dem Lan­guage­Tool und Mid­jour­ney erstellt oder verbessert.
  • Wie man auf die Schnelle mehrstündige Videos zusammengefasst bekommt

    Wie man auf die Schnelle mehrstündige Videos zusammengefasst bekommt

    (Illus­tra­ti­on: Mar­cus Schwarze/Midjourney, KI-generiert)

    Ja, ein­drei­vier­tel Stun­den. Zeitgewinn.

    Den ent­spre­chen­den Wow-Moment über künst­li­che Intel­li­genz hat­te ich am Wochen­en­de nach einem Tweet von Rowan Cheung.

    Man stel­le sich vor, eine Grup­pe Men­schen dis­ku­tie­re vor lau­fen­der Kame­ra eine Stun­de über ein gera­de ergan­ge­nes Gerichts­ur­teil. Auf Face­book und You­Tube gibt es bekannt­lich der­art lang­at­mi­ge Vide­os, auch ARD und ZDF fül­len so man­ches Abend­pro­gramm mit rei­nen Dis­kus­sio­nen. Nicht jeder hat die Zeit oder Lust, sich das alles anzu­se­hen. Eine Zusam­men­fas­sung fällt da schwer. Oder auch nur ein Durch­su­chen des Vide­os nach bestimm­ten getrof­fe­nen Aussagen.

    Auf tritt sum​ma​ri​ze​.tech.

    Der künst­li­chen Intel­li­genz speist man die You­Tube-Adres­se des gewünsch­ten Vide­os ein. 40 Sekun­den spä­ter ist der ein­stün­di­ge Small­talk zusam­men­ge­fasst. Auf Eng­lisch zwar, aber das lässt sich von ChatGPT oder DeepL übersetzen.

    Wie kann die Maschi­ne so schnell eine Stun­de Dis­kus­si­on erfas­sen? Sie holt sich aus dem Video ledig­lich die Unter­ti­tel. Und die­se Tex­te wie­der­um kann eine Maschi­ne zusam­men­fas­sen. So wird aus einem lan­gen Video auf die Schnel­le ein Absatz mit den wesent­li­chen gespro­che­nen Infor­ma­tio­nen. Was fehlt, sind im Video zu sehen­de Informationen.

    Jetzt stel­len Sie sich ein­mal vor, dass Fern­seh­sen­dun­gen und Inter­net­vi­de­os durch­such­bar wer­den. Nun sind sie es. Zumin­dest die mit Untertiteln.

    Aller­dings: Auch hier kann die Tücke im Detail lie­gen. Denn wenn der You­Tuber die Unter­ti­tel auto­ma­tisch erstel­len ließ (You­Tube und Face­book machen das ja mög­lich) und sie nicht im Nach­hin­ein über­prüft, kön­nen sich Feh­ler bei der Sprach­er­ken­nung erge­ben. Und die set­zen sich dann auch in der Zusam­men­fas­sung von sum​ma​ri​ze​.tech fort.

    In mei­nem Bei­spiel des Vide­os der Men­schen vor einem Gerichts­ge­bäu­de hat die Maschi­ne den Namen der ange­klag­ten Per­son fälsch­lich mit dem eines Zeu­gen ver­wech­selt. (Was aus Grün­den des Per­sön­lich­keits­schut­zes ver­mut­lich aus­nahms­wei­se hilf­reich ist.)

    Der Dienst sum​ma​ri​ze​.tech möch­te nach der ers­ten Abfra­ge für ein Video auf die kos­ten­pflich­ti­ge Pre­mi­um­ver­si­on wech­seln. Dann heißt es, ein neu­es pri­va­tes Brow­ser­fens­ter zu wählen.

    Bei Vide­os ohne Unter­ti­tel schei­tert die Maschi­ne. So schal­ten auch man­che Face­book-Live-Stars die Unter­ti­tel wohl bewusst aus. Zudem ist es auf Face­book nicht ohne Wei­te­res mög­lich, frem­de Vide­os herunterzuladen.

    Mit dem Unter­ti­tel-Trick ist noch mehr mög­lich: Die Tex­te las­sen sich über Sei­ten wie Down­sub (Ach­tung, fie­se Wer­be­fens­ter) als Datei auf die eige­ne Fest­plat­te laden. Mit Copy-and-pas­te und dem Prompt

    Fasse mir den folgenden Text zusammen

    ent­steht in ChatGPT‑4 eine qua­li­ta­tiv bes­se­re Zusam­men­fas­sung als mit sum​ma​ri​ze​.tech. Und es wird mög­lich, gezielt nach Details aus dem Gespro­che­nen zu suchen: Wie lau­te­te das Urteil? Die Maschi­ne fin­det eine ent­spre­chen­de Text­pas­sa­ge und spuckt sie aus.

    Bei beson­ders lan­gen Doku­men­ten gerät aber auch ChatGPT in der kos­ten­pflich­ti­gen Ver­si­on an sei­ne Gren­zen. Denn jede über­mit­tel­te Sil­be kos­tet die Her­stel­ler der künst­li­chen Intel­li­genz Geld für Rechen­kraft. Dar­um ist die Län­ge der über­mit­tel­ten Fra­ge wie auch die der Ant­wort begrenzt, auf soge­nann­te Tokens. Wer dann mal eben den 600-sei­ti­gen Bericht zum Zusam­men­fas­sen über­mit­teln möch­te, wird scheitern.

    Aber auch dafür gibt es einen Trick. Nor­ma­ler­wei­se liegt die Gren­ze von GPT‑3 bei 4.000 Token und die des kos­ten­pflich­ti­gen GPT‑4 bei 8.000 Token (= ca. 12,5 Sei­ten). Wie Mike Kim auf Twit­ter schrieb, kann über die KIs Play​ground​.ai oder Bing oder Goog­le Bard das Limit aus­ge­wei­tet werden.

    Ein ande­rer Weg besteht dar­in, das Doku­ment stück­wei­se nach­ein­an­der zusam­men­zu­fas­sen – und am Ende die Maschi­ne zu bit­ten, alle Zusam­men­fas­sun­gen zusam­men­zu­fas­sen. Aller­dings begrenzt die KI wie­der­um das eige­ne Erin­ne­rungs­ver­mö­gen an die ers­ten Zusam­men­fas­sun­gen. So könn­ten zusätz­li­che „zusam­men­fas­sen­de Zusam­men­fas­sun­gen von Zusam­men­fas­sun­gen“ nötig wer­den. Künf­tig soll das Limit auf 32.000 Token erhöht werden.

    Wei­te­re Mög­lich­kei­ten beschreibt Die­go.

    Des Wei­te­ren soll es mög­lich sein, das Text­ein­ga­be­feld von ChatGPT mit­tels der vom Brow­ser ein­ge­blen­de­ten Web­in­for­ma­tio­nen zu ver­grö­ßern. Das habe ich aller­dings nicht im Detail ausprobiert.

    Die drei Screen­shots im Bild zei­gen das berühm­te 55-minü­ti­ge Video „Die Zer­stö­rung der CDU“ von Rezo aus 2019, die Zusam­men­fas­sung von sum​ma​ri​ze​.tech und die Über­set­zung von DeepL.
  • Nächste Stufe der KI: Rewind macht fast alles durchsuchbar, was Du digital tust

    Nächste Stufe der KI: Rewind macht fast alles durchsuchbar, was Du digital tust

    (Illus­tra­ti­on: Mar­cus Schwarze/Midjourney, KI-generiert)

    Rewind, eine Soft­ware, erin­nert mich an den älte­ren Kol­le­gen, dem ich im zar­ten Alter von 26 als Volon­tär an den Kat­zen­tisch in sei­nem Büro in Han­no­ver zuge­ord­net wur­de: Sorg­fäl­tig hef­te­te der Redak­teur regel­mä­ßig die Visi­ten­kar­ten sei­ner Gesprächs­part­ner der ver­gan­ge­nen Tage ab. Es war ihm unge­mein wich­tig, dem jun­gen Bur­schen Ähn­li­ches bei­zu­brin­gen, von wegen jour­na­lis­ti­sches Kapi­tal: Ein gut geführ­tes per­sön­li­ches Adress­buch ist, wer weiß wann, nützlich.

    Rewind macht Ver­gleich­ba­res. Nur, ähm, größer.

    Die Soft­ware klinkt sich in die Akti­vi­tä­ten am Rech­ner ein. Sie zeich­net auf. Und zwar nicht nur das Gespro­che­ne in Video­kon­fe­ren­zen. Son­dern auch ver­sand­te und emp­fan­ge­ne Mails. Auf­ge­ru­fe­ne Web­sei­ten. Word-Doku­men­te und Prä­sen­ta­tio­nen. Sämt­li­che gezeig­te oder gese­he­ne Bildschirminhalte.

    Und zwar im Sekundentakt.

    Rewind legt eine Tex­terken­nung über die Bild­schirm­in­hal­te. Sie tran­skri­biert gespro­che­ne Inhal­te zu les­ba­ren Tex­ten. Und legt sie in eine Daten­bank. In drei Tagen kamen bei mir sechs Giga­byte an Daten zusammen.

    Ein Tran­skript einer Video­kon­fe­renz hält auch Bana­les fest, wie das Lachen eines Gesprächs­part­ners vor dem Klin­geln des Paket­bo­ten an der Haus­tür. Jedoch ist die KI in der Lage, eine sinn­vol­le Zusam­men­fas­sung des Tran­skripts zu erstel­len. Rewind zeich­net zunächst alles auf und macht dies dann durch­such­bar. (Screen­shot: Schwarze)

    Und sie macht sämt­li­che Inhal­te durch­such­bar. In ein­fa­cher Spra­che. Eine Künst­li­che Intel­li­genz eben (KI).

    „Was habe ich am ver­gan­ge­nen Mon­tag gemacht?“

    Ant­wort Rewind: Sie haben eine Stel­lung­nah­me des Bis­tums Trier zum Fall Edmund Dil­lin­ger her­un­ter­ge­la­den. (Link zu den Screenshots)

    Sie haben sich Infor­ma­tio­nen zur BUGA 2029 und zum Blog­gen über das Mit­tel­rhein­tal ange­se­hen. (Link zu den Screenshots)

    Sie haben eine E‑Mail von [XY] erhal­ten und beant­wor­tet. (Links zu den bei­den Mails)

    Sie haben den Text „E‑Book […]“ bear­bei­tet. (Link zu dem Dokument)

    Klar habe ich digi­tal noch mehr gemacht, aber so unge­fähr zumin­dest waren das die ers­ten Din­ge des Tages. Die Fra­ge lässt sich ver­fei­nern und bringt sinn­vol­le Ant­wor­ten: „Was habe ich mit [XY] gemacht?“ Die Maschi­ne sucht für den Tag ent­spre­chen­de Mails und Chat-Inhal­te heraus.

    Als das „per­fek­te Gedächt­nis“ bezeich­nen die Macher von Rewind ihre Soft­ware. Gegen­wär­tig funk­tio­niert sie nur auf Macs mit neu­es­tem Pro­zes­sor. Denn die Tex­terken­nung auf den sekünd­lich erstell­ten Screen­shots und die Sprach­er­ken­nung von Ton­auf­nah­men erfor­dert beson­ders schnel­le Pro­zes­so­ren – mit ein­ge­bau­ten Funk­tio­nen der künst­li­chen Intel­li­genz, die Apple bereits hin­ter­legt hat. Angeb­lich erkennt die KI auch Moti­ve in Bil­dern, wie Kevin Chen her­aus­ge­fun­den hat.

    Von der Apple-KI im Pro­gramm „Fotos“ ist die Funk­ti­on bereits bekannt. Da zeigt die Suchen-Funk­ti­on nach „Ele­fant“ dann alle Bil­der mit einem Ele­fan­ten, selbst wenn das Wort nir­gends in den Meta­da­ten oder Datei­na­men ent­hal­ten ist – son­dern das Tier nur zu sehen ist.

    Was ist das für eine mäch­ti­ge Suchen-Funk­ti­on für die eige­nen digi­ta­len Akti­vi­tä­ten? In den Ein­stel­lun­gen erlaubt Rewind, die Daten „für immer“ zu spei­chern. Sprich: bis der Spei­cher­platz nicht mehr aus­reicht. Wahl­wei­se kön­nen auch eine Woche oder meh­re­re Mona­te oder ein Jahr ein­ge­stellt wer­den. Ein­zel­ne Apps kön­nen von der Spei­che­rung aus­ge­schlos­sen wer­den, angeb­lich auch der Priv­at­mo­dus von Brow­ser­fens­tern (was aller­dings nicht funktioniert).

    Der Her­stel­ler ver­spricht, Daten­schutz zu beach­ten. Kei­ne Ton­auf­nah­men oder Bild­schirm­fo­tos wür­den den eige­nen Rech­ner ver­las­sen. Jedoch wider­spricht er sich bereits ein paar Sät­ze spä­ter: Um auf Fra­gen zu ant­wor­ten, über­mit­telt Rewind die ver­tex­te­ten Inhal­te, auf einen Kern redu­ziert, an die Künst­li­che Intel­li­genz von Rewind im Netz und von dort wei­ter an Ope­nAI. Sicher ein Geht-ja-gar-nicht-Kri­te­ri­um für Jour­na­lis­ten und vie­le ande­re. Dass Ton­auf­zeich­nun­gen aus Video­kon­fe­ren­zen tran­skri­biert wer­den, soll­te mit jedem Teil­neh­men­den bespro­chen wer­den. Heim­li­che Ton­auf­nah­men sind strafbar.

    Die Funk­ti­on aber ist mäch­tig. Rewind hat sich im Grun­de als poten­zi­el­ler Über­nah­me­kan­di­dat durch Apple posi­tio­niert. Das rie­si­ge Unter­neh­men hat in sei­nen Daten­schutz­er­klä­run­gen stets die Wah­rung von Pri­vat­sphä­re und Ach­tung des Daten­schut­zes her­vor­ge­ho­ben. Wenn die Kali­for­ni­er nicht selbst an etwas Gro­ßem zur per­sön­li­chen Durch­such­bar­keit von digi­ta­len Erin­ne­run­gen arbei­ten – hier hät­ten sie mit Rewind einen Kan­di­da­ten. Wenn jemand das Rewind-Modell daten­schutz­kon­form wei­ter­ent­wi­ckeln kann, dann wäre es wohl Apple.

    Über­haupt dürf­te die Daten­schutz­grund­ver­ord­nung im gegen­wär­ti­gen Zustand ein gewich­ti­ger Ver­bots­grund für den Ein­satz der Rewind-App in ihrem jet­zi­gen Zustand in Euro­pa wer­den. Und die Daten­schutz­re­ge­lung von Unter­neh­men erst recht. Wenn Geschäfts­ge­heim­nis­se den eige­nen PC im Sekun­den­takt Rich­tung USA ver­las­sen, dürf­ten über­all Alarm­glo­cken klingen.

    Ande­rer­seits gibt es eine rei­ne Pri­vat­nut­zung von Rech­nern. Und ein nahe­lie­gen­des Geschäfts­mo­dell für Rewind und die Unter­neh­men könn­te sein, die Daten auf eine unter­neh­mens­ei­ge­ne KI zu begren­zen. Die ille­ga­le Über­wa­chung von Mit­ar­bei­ten­den steht dabei auf einem ande­ren Blatt.

    Das „per­fek­te Gedächt­nis“ wird so im Grun­de nur durch die phy­si­ka­li­schen Spei­cher­gren­zen von Fest­plat­ten begrenzt. „Woher ken­ne ich noch mal Georg XY?“, ist als Fra­ge nach einer Freund­schafts­an­fra­ge gar nicht mal unge­wöhn­lich und von Rewind schnell beant­wor­tet: Teil­neh­mer eines Lehr­gangs im Jahr 2015.

    Als hät­te man sich damals eine Visi­ten­kar­te ein­ge­holt und sie sorg­sam abgeheftet.

    Im Grun­de ent­steht so eine mäch­ti­ge Suchen­funk­ti­on für die digi­ta­le Krims­krams­schub­la­de. Man stel­le sie sich wei­ter­ent­wi­ckelt für das Han­dy vor: Wo hat­te ich noch mal die Bil­der von der kaput­ten und nun repa­rier­ten Brü­cke im Ahrtal gese­hen, die für einen Arti­kel taugen?

    In einer Web­kon­fe­renz war vor ein paar Wochen dies-und-das bespro­chen wor­den, wer hat da genau was gesagt und wie wur­de es entschieden?

    Oder: Zei­ge mir die jeweils fünf wich­tigs­ten E‑Mails, Snap­chat- und Whats­App-Nach­rich­ten von XY, beur­teilt nach der Zeit, die ich dar­auf ver­wen­det habe.

    Die Suchen-Funk­ti­on von Rewind fin­det auf die Schnel­le Inhal­te von auf­ge­ru­fe­nen Web­sei­ten oder selbst erstel­len Doku­men­ten – im Sekun­den­takt macht die Maschi­ne Screen­shots von ange­zeig­ten Sachen auf dem Moni­tor. Bis­her ist die Soft­ware begrenzt auf den Haupt­mo­ni­tor. (Screen­shot: Schwarze)

    Die Selbst­op­ti­mie­rung und Selbst­ver­mes­sung geht mit die­ser Art von künst­li­cher Intel­li­genz wei­ter. Sie erin­nert mich (sic!) an Jill Pri­ce, eine US-Ame­ri­ka­ne­rin. Sie lei­det und erfreut sich am Hyper­thy­mes­ti­schen Syn­drom. Das bedeu­tet: Sie kann nichts ver­ges­sen. Sie erin­nert sich an jeden Tag seit dem 5. Febru­ar 1980 – was in den Zei­tun­gen stand und in der Welt pas­sier­te, was sie mach­te und fühl­te. Alle guten und auch alle schlech­ten Sachen.

    Rewind macht nun das glei­che, zumin­dest bei den digi­ta­len Akti­vi­tä­ten. Die nächs­te Tür, die hier ein­mal mehr die künst­li­che Intel­li­genz im rasan­ten Jahr 2023 öff­net, weist in eine neue Welt. Ob wir sie öff­nen wol­len oder nur einen Spalt weit, wird jeder anders beant­wor­ten – aber irgend­je­mand da drau­ßen öff­net sie.

    Du willst womög­lich gar nicht so sehr an jedes Detail erin­nert wer­den kön­nen. Doof, wenn das dann jemand anders für dich ent­schie­den hat. Ein Recht auf Ver­ges­sen beinhal­tet im Grun­de auch eine Pflicht zum Ver­ges­sen für neue KI-Dienste.

    Aber suchen Sie dafür mal die ladungs­fä­hi­gen Adres­sen der Daten­schutz­be­auf­trag­ten auf den Web­sei­ten von Rewind und Co. Oder die­je­ni­gen unter ihren Freun­den, Kol­le­gin­nen und Geschäfts­part­nern, die sol­che Soft­ware bereits heim­lich in Video­kon­fe­ren­zen und auf ihren eige­nen Rech­nern ein­set­zen und somit eine bald voll­stän­di­ge Samm­lung der Kom­mu­ni­ka­ti­on mit Ihnen durch­such­bar machen.

  • Das Herz auf der Zunge

    Das Herz auf der Zunge

    Wer die bei­den nicht kennt, also für die älte­ren unter uns: Das sind so unge­fähr der Howard Car­penda­le und der Roland Kai­ser von Kana­da. Ich bin noch nicht sicher, ob das Lied viral geht. Aber die Zugriffs­zah­len nach einem Tag sind schon beachtlich.

    Das Beson­de­re: Die Musik stammt angeb­lich aus Maschi­nen und wur­de dem beglei­ten­den Text und den Kom­men­ta­ren zufol­ge aus künst­li­cher Intel­li­genz (KI) erstellt. Jemand mit dem Pseud­onym ghostwriter977 rekla­miert, ihn her­ge­stellt zu haben.

    Ich sage das so vor­sich­tig, weil ich nicht über­prü­fen konn­te, ob es tat­säch­lich ein KI-Pro­dukt ist – oder eine geschick­te Wer­be­kam­pa­gne der bei­den Sän­ger. Der Titel heißt übri­gens „Heart on my Slee­ve“, zu Deutsch in etwa: Das Herz auf der Zun­ge.

    Wahr ist jeden­falls, dass mitt­ler­wei­le auch Schnip­sel von Ton­auf­nah­men von Stim­men hoch­ge­la­den wer­den kön­nen, um KIs zu trai­nie­ren. Und Musik-KIs künst­li­che Songs „im Sti­le von“ generieren.

    Ein Urhe­ber­recht an Stim­men? Die Musik­in­dus­trie dürf­te ein­mal mehr umge­krem­pelt wer­den. Stand Sonn­tag­nach­mit­tag waren die bei­den Auf­nah­men noch nicht von Tik­Tok und You­Tube gelöscht.

    Der Song ist für mei­nen Geschmack und den vie­ler Kom­men­ta­to­ren nicht schlecht, und wer weiß, viel­leicht tun sich die Sän­ger ja tat­säch­lich zusam­men und neh­men ihn „in echt“ auf.

    Das aller­dings wäre eine Vol­te, mit der sich die Musi­ker kaum vor finan­zi­el­len Ein­bu­ßen und dem Dieb­stahl ihrer Stim­men und künst­le­ri­schen Leis­tun­gen durch KIs (und man­che KI-Jün­ger) schüt­zen wür­den. Auch hier wer­den gewiss die Gesetz­ge­ber gegen­über der KI aktiv wer­den müs­sen – mit einer Art Leis­tungs­schutz­recht für Musik und Stim­men und einer Defi­ni­ti­on von Schöpfungshöhe.

    Ande­rer­seits – ein Duett von Mari­lyn Mon­roe, lizen­ziert durch ihre Erben­ge­mein­schaft, mit Shaki­ra oder John F. Ken­ne­dy, das könn­te „inter­es­sant“ wer­den. Und gru­se­lig zugleich.

    Tik­tok: https://​www​.tik​tok​.com/​@​g​h​o​:​s​t​w​r​i​t​e​r​9​7​7​?​_​t​=​8​b​X​h​i​1​b​D​0​y​s​&​_​r=1

    You­Tube:

  • Irren ist nicht nur menschlich

    Irren ist nicht nur menschlich

    (Illus­tra­ti­on: Mar­cus Schwarze/Midjourney, KI-generiert)

    Neu­lich stell­te mir in einem Klub fei­ner Men­schen eine Dame eine beson­de­re Fra­ge zu die­sem KI-Gedöns, den noch immer all­zu vie­le, vor allem Jour­na­lis­ten, für über­hypt hal­ten, und eini­ge ande­re – dazu zäh­le ich mich – für grob unter­schätzt ein­stu­fen: Ob es denn bei die­sen Künst­li­che-Intel­li­genz-Maschi­nen lin­ke und rech­te Strö­mun­gen gibt, wie bei den eins­ti­gen Zeitungen?

    In der Tat. Ein ver­rück­ter Mil­li­ar­där wie Elon Musk hat bereits ange­kün­digt, eine alter­na­ti­ve KI zu erfin­den, die nur „basics“ aus­spuckt, in der Ten­denz eher kon­ser­va­ti­ves bewah­ren­des Gedan­ken­gut. ChatGPT, der schil­lernds­te Star unter den KI-Model­len, sei ihm zu woke, zu links­an­ge­passt, über­kan­di­delt poli­tisch korrekt.

    Auch die Bil­der-KI Mid­jour­ney ver­bie­tet mitt­ler­wei­le die Nut­zung von Begrif­fen wie Hit­ler oder fest­ge­nom­men und nach Inter­ven­ti­on von Chi­na gegen­über dem US-Unter­neh­men die Dar­stel­lung von Staats­prä­si­dent Xi Jin­ping. Donald Trump hin­ge­gen darf wei­ter­hin in erfun­de­nen Bil­dern dar­ge­stellt wer­den, ich habe das mit ihm und einem ande­ren mut­maß­li­chen Ver­bre­cher in einem erdach­ten gemein­sa­men Gefäng­nis­auf­ent­halt getestet.

    (Erstellt mit Midjourney/Künstliche Intelligenz.) 

    Es kommt eben dar­auf an, was man dar­aus macht.

    Noch kann man in der Regel bei genaue­rem Hin­schau­en den Fake erken­nen. Doch das ganz oben ein­ge­füg­te Bild zeigt bereits: Es wird immer schwieriger.

    So nut­zen Trumps Anhän­ger die Fake-KI bereits für poli­ti­sche Bil­der, auf denen ver­meint­lich Men­schen­mas­sen dem frü­he­ren US-Prä­si­den­ten auf der Stra­ße zu sei­nem Gang vor Gericht in New York fol­gen: er in stol­zer, erha­be­ner Pose, die Men­schen hin­ter ihm in Stär­ke, unter­stüt­zend, fried­lich, devot und auf­recht. Die Reak­tio­nen auf die­ses Bild in Social Media zei­gen, dass vie­le die Fäl­schung nicht erken­nen. Die­se Sze­ne gab es aus­weis­lich des CNN-Live­streams nicht.

    Quel­le: https://​twit​ter​.com/​T​h​e​_​T​r​u​m​p​_​T​r​a​i​n​/​s​t​a​t​u​s​/​1​6​4​3​1​9​9​2​3​0​7​3​3​9​6​3​264

    Täg­lich ver­bes­sern die Fir­men ihre KI-Sys­te­me wei­ter. Noch bes­se­re foto­rea­lis­ti­sche Dar­stel­lun­gen wur­den einen Tag nach der Ver­öf­fent­li­chung der Text-KI GPT‑4 in der Bil­der-KI Mid­jour­ney in der Ver­si­on 5 ermög­licht. Doch selbst in der sach­ver­stän­di­gen Fach­öf­fent­lich­keit wur­de die­ser mar­kan­te Ent­wick­lungs­schritt kaum gebüh­rend begleitet.

    Zu viel pas­siert jeden Tag in der KI.

    Quel­le: https://​twit​ter​.com/​s​k​y​f​e​r​r​o​r​i​/​s​t​a​t​u​s​/​1​6​3​9​6​4​7​7​0​8​1​5​4​6​7​5​200

    Der Papst im wei­ßen Dau­nen­man­tel, ein ande­res die­ser künst­li­chen Fake-Bil­der, geht der­weil zur Belus­ti­gung vie­ler um die Welt. Kurz dar­auf kann die KI wie­der­um mehr: Man lade das Bild bei Mid­jour­ney hoch, und Zack!, erstellt die KI mit einem neu­en Befehl /describe eine weit­ge­hend tref­fen­de Bildbeschreibung:

    pope francis wears a white puffy coat, in the style of street style realism, 32k uhd, quadratura, xmaspunk, ferrania p30, foampunk, warmcore --ar 9:11 --v 5 --q 2  

    Weil die Maschi­ne gie­rig ist, schlägt sie sogar vier Beschrei­bun­gen vor: Der Mensch am Schirm wird ein­ge­la­den, die tref­fends­te aus­zu­wäh­len. Der­art ana­ly­siert, kann jeder­mann neue Bil­der von dem Herrn in weiß erstel­len las­sen, aus ver­meint­lich ande­rer Per­spek­ti­ve, mit Son­nen­bril­le oder vor Leu­ten. Und das machen die Men­schen dann auch. Und ver­stär­ken so den Ein­druck: Das gab es wirk­lich. Es gibt ja meh­re­re Bilder.

    Quel­le: https://​twit​ter​.com/​S​c​h​a​t​z​M​i​k​k​e​l​s​e​n​/​s​t​a​t​u​s​/​1​6​3​9​9​8​8​0​4​1​1​9​9​6​2​4​192

    Glau­ben kann man künf­tig nichts mehr. Jeden­falls nicht auf Anhieb.

    Vom Bild zum Video ist es nicht weit. „Schreib mir das Skript für ein Video von Hum­phrey Bogart mit Mari­lyn Mon­roe. Die Geschich­te soll im Stil von Stan­ley Kubrick im Welt­raum spie­len. Die bei­den ver­lie­ben sich. Und wer­den dann durch einen Meteo­ri­ten­ein­schlag getrennt. Kom­po­nie­re dazu Musik im Stil von Bea­to­ven, majes­tä­tisch, erin­nernd an die Musik aus dem bekann­tes­ten Film von Stan­ley Kubrick. Die Geschich­te soll Dra­ma und Witz ent­wi­ckeln, teil­wei­se Slap­stick. Raum­schiff Enter­pri­se soll als Umge­bung wir­ken. Nimm das Skript anschlie­ßend mit zur KI D‑ID. Lass die Figu­ren nicht nur spre­chen, son­dern auch agie­ren. Mach dar­aus ein Video von 50 Minuten.“

    Sie glau­ben nicht, dass das funk­tio­niert? Sie haben recht. Noch.

    Die Ant­wort der KI doku­men­tie­re ich hier kom­plett – Sie kön­nen natür­lich Absät­ze überfliegen:

    Als KI-Textmodell kann ich leider kein Video erstellen oder Musik komponieren. Allerdings kann ich Ihnen ein Skript für ein 50-minütiges Video vorschlagen, das auf Ihren Vorgaben basiert. Sie können die folgende Zusammenfassung und das Skript nutzen, um das Video mit geeigneten Softwaretools oder einer KI wie D-ID zu erstellen.Titel: "Galaktische Romanze"Zusammenfassung:Humphrey Bogart spielt den erfahrenen Raumschiff-Kapitän Rick Blain, und Marilyn Monroe ist die bezaubernde Wissenschaftlerin Stella Maris. In einer Geschichte im Stil von Stanley Kubrick verlieben sich Rick und Stella an Bord der Raumschiff Enterprise, während sie gemeinsam eine Mission durch den Weltraum bestreiten. Drama, Witz und Slapstick prägen ihre Beziehung, bis ein Meteoriteneinschlag sie trennt. Das Skript enthält majestätische, an die Musik aus Kubricks bekanntesten Filmen erinnernde Musik von Beatoven.Skript (Auszug):Szene 1: Auf der Brücke der Raumschiff Enterprise[Die Kamera fängt Rick (Humphrey Bogart) ein, der auf dem Kapitänssitz sitzt. Die Crew arbeitet auf ihren Stationen.]Rick: (entschlossen) Navigator, setzen Sie Kurs auf den Asteroidengürtel Alpha-7.Szene 2: Im Labor[Stella (Marilyn Monroe) arbeitet an einem Mikroskop, während majestätische Musik von Beatoven im Hintergrund spielt.]Rick: (betritt das Labor) Stella, wir nähern uns dem Asteroidengürtel. Was gibt es Neues bei der Forschung?Stella: (blickt auf) Oh, Kapitän Blain, ich habe gerade eine faszinierende Entdeckung gemacht! Dieser Asteroid hat ungewöhnliche Kristalle, die uns helfen könnten, unser Energiesystem zu verbessern.[Die beiden lächeln sich an, und es entsteht eine spürbare Chemie zwischen ihnen.]Szene 10: In der Messe[Rick und Stella sitzen nebeneinander und genießen ihr Essen. Sie unterhalten sich, während die Crew im Hintergrund miteinander scherzt.]Stella: (lacht) Oh, Rick, du bist so witzig!Rick: (lächelt) Nun, ich habe mein Bestes getan, um diesen langen Weltraummissionen etwas Unterhaltung zu bieten.[Die beiden kommen sich näher, und ihre Hände berühren sich zufällig. Sie schauen sich tief in die Augen.]Szene 20: Meteoriteneinschlag[Ein Alarm ertönt. Die Crew eilt auf ihre Stationen. Rick und Stella trennen sich widerstrebend.]Rick: (besorgt) Stella, geh in den Sicherheitsraum! Ich muss auf die Brücke!Stella: (ängstlich) Pass auf dich auf, Rick![Rick rennt auf die Brücke, während Stella sich in den Sicherheitsraum zurückzieht. Die Kamera zeigt die Enterprise, die von einem Meteoriten getroffen wird, und es kommt zu einer gewaltigen Explosion.]Szene 30-49: Trennung und Slapstick[Rick und Stella sind nun auf verschiedenen Teilen der Enterprise getrennt und kämpfen darum, sich wiederzufinden. Während ihrer Abenteuer an Bord des beschädigten Raumschiffs begegnen sie verschiedenen humorvollen und skurrilen Situationen.]Szene 31: Rick in der Kantine[Rick stolpert in die Kantine und findet sie in völligem Chaos vor. Er sieht einen Roboter, der in Slapstick-Manier über den Boden rutscht und versucht, das verschüttete Essen aufzuwischen.]Rick: (schüttelt den Kopf) Manchmal frage ich mich, wie wir es schaffen, das Universum zu erkunden.Szene 35: Stella in den Lüftungsschächten[Stella kriecht durch die Lüftungsschächte, um zum anderen Teil des Schiffs zu gelangen. Plötzlich stößt sie auf ein außerirdisches Tier, das sie erschreckt. Sie fällt rückwärts und landet in einer lustigen Position.]Stella: (kichert) Nun, das habe ich nicht kommen sehen.Szene 42: Rick und die defekte Tür[Rick versucht, eine defekte Tür zu öffnen, indem er verschiedene komische Methoden anwendet, einschließlich des Einsatzes von Wissenschaft und Technik, um sie zu überlisten. Schließlich gibt er auf und tritt die Tür ein.]Rick: (atmet schwer) Manchmal muss man eben die altmodische Art wählen.Szene 49: Wiedervereinigung[Rick und Stella finden sich endlich wieder und umarmen sich erleichtert. Die majestätische Musik von Beatoven spielt im Hintergrund, während sie sich tief in die Augen schauen.]Rick: (emotional) Stella, ich dachte, ich hätte dich für immer verloren.Stella: (lächelt) Ich habe nie aufgehört, nach dir zu suchen, Rick.Szene 50: Ende[Die Enterprise erreicht ihre Basis, und die Crew feiert ihre Rückkehr. Rick und Stella stehen auf der Brücke, Hand in Hand, und blicken hoffnungsvoll in die Zukunft.]Rick: (zu Stella) Was hältst du davon, gemeinsam ein neues Abenteuer zu beginnen?Stella: (lächelt) Solange es mit dir ist, bin ich dabei.[Dramatische Musik ertönt, während die Kamera langsam von Rick und Stella wegfährt und die Enterprise in den Weiten des Weltraums zeigt.]ENDESie können dieses Skript verwenden, um Ihre 50-minütige Videoidee zu erstellen, indem Sie es an Ihre Bedürfnisse anpassen und ggf. weitere Szenen und Dialoge hinzufügen. Leider kann ich als KI-Textmodell keine Musik komponieren oder das Video selbst erstellen, aber ich hoffe, dass dieser Vorschlag Ihnen als Grundlage für Ihr Projekt dient.

    Ich hake nach: Was könn­ten das für skur­ri­le, lus­ti­ge Situa­tio­nen in Sze­nen 30 bis 49 sein? Mach drei Vor­schlä­ge. Aber streng dich an, es soll wirk­lich lus­tig sein.

    Die Maschi­ne antwortet:

    Vorschlag 1: Die außerirdische "Tanzparty"Szene 36:Während Stella versucht, sich durch die beschädigten Korridore des Schiffs zu navigieren, entdeckt sie einen Raum, in dem eine Gruppe von kleinen, bunten außerirdischen Kreaturen eine spontane Tanzparty veranstaltet. Die Kreaturen bemerken Stella und laden sie ein, mitzutanzen. Stella zögert zunächst, lässt sich aber schließlich darauf ein und zeigt einige ihrer besten Tanzbewegungen, was zu einer urkomischen und unerwarteten Tanzszene führt.Vorschlag 2: Ricks improvisiertes Raumanzug-UpgradeSzene 40:Rick benötigt dringend einen Raumanzug, um eine beschädigte Außenstruktur des Schiffs zu reparieren. Er findet einen alten, defekten Raumanzug, der jedoch nicht vollständig funktioniert. Um den Raumanzug einsatzbereit zu machen, greift Rick auf eine Reihe von lächerlichen, improvisierten "Upgrades" zurück. Er benutzt Gummibänder, um die Dichtungen abzudichten, klebt einen Spiegel an den Helm, um seine Sicht zu erweitern, und befestigt Haushaltsgeräte wie einen Staubsauger an seinem Anzug, um sich im All fortzubewegen. Die Szene zeigt Rick, der komische Manöver im Weltraum vollführt, während er versucht, seine Aufgabe zu erfüllen.Vorschlag 3: Die schwerelose EssensschlachtSzene 45:In der schwerelosen Umgebung eines beschädigten Teils des Schiffs treffen sich Rick und Stella zufällig wieder. Um ihre Wiedersehen zu feiern und sich von der angespannten Situation abzulenken, beginnen sie spontan eine schwerelose Essensschlacht. Die beiden werfen sich gegenseitig Lebensmittel zu, die in der Schwerelosigkeit schweben und um sie herum wirbeln, während sie lachen und versuchen, sich gegenseitig auszuweichen. Die Szene endet damit, dass die beiden, vollkommen mit Essen bedeckt, schließlich aufgeben und gemeinsam über das Chaos lachen, das sie verursacht haben.

    Als Dreh­buch­schrei­ber für Vor­abend­se­ri­en wür­de ich mich spä­tes­tens jetzt mit der KI beschäf­ti­gen. Das ist hier alles nicht oscar­ver­däch­tig, ande­rer­seits sind das die wenigs­ten TV-Seri­en. Und jede Sze­ne lässt sich aus­schmü­cken, denn die Maschi­ne merkt sich die Zusam­men­hän­ge. Schau­spie­ler wie den Bogart oder die Mon­roe neu leben zu las­sen – wer woll­te auf die­ses Poten­zi­al ver­zich­ten? Schon wei­se ich die Text-KI an, einen Prompt, also eine Anwei­sung, für die Bil­der-KI zu schrei­ben. Her­aus kommt:

    Erschaffe eine weibliche Hauptfigur namens Stella Maris für ein Science - Fiction - Abenteuer im Weltraum, die von Marilyn Monroe inspiriert ist. Stella ist eine talentierte Wissenschaftlerin und Expertin für Astrophysik und Raumfahrttechnologie. Sie ist klug, entschlossen und hat ein Auge für Details. Mit ihrem strahlenden Lächeln, ihrer warmen Persönlichkeit und ihrer verführerischen Ausstrahlung zieht sie die Menschen um sich herum an. Stella ist immer bereit, ein Rätsel zu lösen oder eine Herausforderung anzunehmen. Sie trägt eine schicke, futuristische Uniform, die ihre Rolle an Bord des Raumschiffs Enterprise unterstreicht, und ihre Frisur erinnert an den ikonischen Stil von Marilyn Monroe. Stelle dir Stella vor, wie sie gemeinsam mit dem erfahrenen Kapitän Rick Blain spannende Abenteuer im Weltraum besteht und dabei sowohl ihre intellektuellen Fähigkeiten als auch ihre charmante und mitfühlende Natur einsetzt, um die Herausforderungen der unendlichen Weiten des Universums zu meistern.

    Die Bil­der-KI macht dann aus die­sem Prompt vier Vorschläge:

    (Erstellt mit Midjourney/Künstliche Intelligenz.)

    Bis­lang waren es meist nur spre­chen­de Ava­tare, in denen Mimik und Lip­pen künst­lich bewegt wer­den. Doch wer Com­pu­ter­spie­le kennt, kann sich eine Umset­zung in flüs­si­ge Bewe­gun­gen vorstellen.

    Oder er war­tet auf „Gen‑2“, die zwei­te Gene­ra­ti­on einer Video-KI des Unter­neh­mens Run­way aus New York. Die­se KI macht bereits aus kur­zen Text­an­wei­sun­gen Video­schnip­sel. Run­way-Chef Ana­sta­sis Ger­ma­ni­dis teil­te gera­de eine Demo von Vide­os, die damit ent­stan­den sind.

    Bei Mid­jour­ney arbei­ten übri­gens elf Men­schen. Bei Run­way nicht mehr als zehn.

    Und es hört nicht auf.

    Ges­tern hat jemand die Text-KI GPT‑4 mit der Bild-KI Mid­jour­ney per Auto­ma­tis­mus ver­knüpft. Die steu­ern sich dann gegen­sei­tig. Und Bea­to­ven als Musik­her­stel­ler für künst­lich gene­rier­te Beet­ho­ven-ähn­li­che Musik (und auch ande­re Melo­dien) gibt es wirk­lich.

    Wie die Ver­bin­dung zu einer Video-Gestal­tungs­soft­ware aus­se­hen könn­te, zeigt D‑ID. Da ste­hen dann unter­schied­li­che Ava­tare zur Ver­fü­gung, bei Bedarf etwa eine hoch­ge­la­de­ne Mari­lyn (das habe ich nun nicht gemacht, aber mit dem eige­nen Bild funk­tio­nier­te es auch). Die KI erstellt aus dem gewünsch­ten Kon­ter­fei und einem dahin geschrie­be­nen Text ein Video, in dem die Per­son lip­pen­syn­chron und mit Ges­ten den Text ein­spricht – wie in dem Video oben zu sehen. Je nach Wunsch auf Eng­lisch, Deutsch oder mit Schwei­zer Akzent.

    D‑ID erstellt aus Ava­ta­ren spre­chen­de Menschen.

    Die Erben der Mon­roe dürf­ten das wahr­schein­lich doof fin­den und finan­zi­el­le Ansprü­che an der Nut­zung gel­tend machen (und dann ver­mut­lich wie­der­um gut fin­den – der toten Schau­spie­le­rin fol­gen allein auf Insta­gram 1,9 Mil­lio­nen Men­schen). Irgend­wer dürf­te also tat­säch­lich bald einen sol­chen Film erfin­den. Und irgend­je­mand ihn gegen ent­spre­chen­de Lizenz­ge­büh­ren der Mon­roe-Erben auch senden.

    Es sind gol­de­ne Zei­ten für Medi­en­ma­cher, Pro­mi­nen­te, Rechts­an­wäl­te. Und das Publi­kum. Nicht aller­dings so sehr für die Dar­stel­lung von Wahrheit.

    Den­noch sind wir immer noch am Anfang der KI. Gera­de hat jemand Auto-GPT erfun­den – eine auto­nom ablau­fen­de Künst­li­che Intel­li­genz, der man Zie­le und Arbeits­schrit­te vor­gibt und die im Hin­ter­grund auf diver­se KIs zurück­greift. „Suche mir die zehn bes­ten Stand­or­te welt­weit, wo man als digi­ta­ler Noma­de gut leben und arbei­ten kann, sor­tie­re sie nach den Lebens­hal­tungs­kos­ten und ergän­ze eine Spal­te mit der mitt­le­ren Tem­pe­ra­tur im Janu­ar.“ Die Maschi­ne spricht und erklärt, was sie macht.

    Sie goo­gelt also los und sucht zehn Web­sei­ten mit ein­schlä­gi­gen Samm­lun­gen von „guten“ Orten für digi­tal arbei­ten­de Men­schen. Dar­aus stellt sie die am häu­figs­ten genann­ten zehn Orte zusam­men. Lebens­hal­tungs­kos­ten und Tem­pe­ra­tu­ren sind eben­falls schnell zusam­men­ge­goo­gelt. Her­aus kommt eine Excel-Datei – alles auf Wunsch vollautomatisch.

    Der Macher von Auto-GPT hat sei­nen Pro­gramm­code bei Git­hub ver­öf­fent­licht, einer welt­weit stark genutz­ten Code-Daten­bank, die mitt­ler­wei­le zu Micro­soft gehört. Damit kann sich jeder­mann einen per­sön­li­chen Assis­ten­ten bau­en, der bestimm­te Auf­ga­ben über­nimmt. Die Macher haben den Code mit einer War­nung ver­se­hen: Es ist mög­lich, die Soft­ware end­los lau­fen zu las­sen, ohne mensch­li­che Bestä­ti­gung von Zwi­schen­schrit­ten. Mög­li­cher­wei­se macht sie dann aller­dings Din­ge, die nicht gewünscht sind. So könn­te man die Maschi­ne anwei­sen, sich nach benach­bar­ten Sys­te­men umzu­schau­en – und zu ver­su­chen, sich dort fort­zu­pflan­zen. Frü­her nann­te man das: Virus.

    In einem ande­ren Bei­spiel lässt jemand die Maschi­ne die zehn wich­tigs­ten Unter­neh­men aus dem Ener­gie­sek­tor her­aus­su­chen und eine „Markt­stim­mung“ (Mood) dem Unter­neh­men gegen­über cha­rak­te­ri­sie­ren. Von hier bis zum auto­ma­ti­sier­ten Akti­en­kauf ist es nicht mehr weit. Ein drit­tes Bei­spiel weist die Maschi­ne zum Stal­king an.

    Und hier demons­triert jemand, wie er die Maschi­ne anwies, eine App zu bau­en, für die aller­dings ein bestimm­ter Pro­gramm­schnip­sel fehl­te. Der digi­ta­le Gesel­le such­te sich dann eigen­stän­dig die feh­len­de Pro­gram­mier­bi­blio­thek im Netz, instal­lier­te sie und setz­te die Pro­gram­mie­rung fort. Kom­men­tar des „Ent­wick­lers“: „Ich schau­te zu.“

    Die tech­no­lo­gi­sche Sin­gu­la­ri­tät ist jener Zeit­punkt, an dem sich die Maschi­nen von allei­ne wei­ter­ent­wi­ckeln. Wir sind dem Zeit­punkt ver­mut­lich näher, als wir den­ken. Da ist dann die Fra­ge, ob es lin­ke oder all­zu woke KIs gibt, schon mal die rich­ti­ge – aber nur eine von vie­len. Die KI ChatGPT‑4 beant­wor­tet die Fra­ge, wann es denn so weit ist mit die­ser Sin­gu­la­ri­tät, sehr kon­ser­va­tiv: „mög­li­cher­wei­se in den 2040er oder 2050er Jahren“.

    Wenn sie sich da nicht mal irrt.

  • Zwei neue Mitarbeiter

    Zwei neue Mitarbeiter

    Ich habe jetzt eine KI einen Web­sei­ten­text für eine Wer­be­kam­pa­gne erstel­len las­sen. Mein Brie­fing für die KI umfass­te dabei zwei aus­führ­li­che Absät­ze mit meh­re­ren Details.

    Anschlie­ßend bat ich die KI, meh­re­re Slo­gans zu ent­wer­fen, einen „viral gehen­den“ Face­book-Bei­trag und einen eben­sol­chen vira­len Tweet.

    Nichts davon wird 1:1 ver­öf­fent­licht. Hier und da ist ein Feh­ler, eine unpas­sen­de Formulierung.

    Aber alles ist so brauch­ba­res Zeug, mit dem man arbei­ten kann. Dann noch mal durch DeepL Wri­te lau­fen las­sen, Feinschliff.

    Ich habe jetzt zwei neue Mitarbeiter.

  • Was uns 2019 im Digitalen erwartet

    Was uns 2019 im Digitalen erwartet


    Social Media

    Die steils­te Kur­ve legt für mich Lin­ke­dIn hin – nicht weil der Dienst so tol­le Inhal­te lie­fert, son­dern weil er unter der Ägi­de von Micro­soft recht aggres­si­ve Metho­den ein­ge­führt hat. Da ist etwa der regel­mä­ßi­ge Ver­such, die Adress­bü­cher sei­ner Nut­zer abzu­glei­chen. Oder das offen­bar erfolg­rei­che Unter­fan­gen, Nut­zer zu sinn­lo­sen Inter­ak­tio­nen zu bewe­gen: XY ist seit fünf Jah­ren bei Fir­ma YZ – gra­tu­lie­re ihm dazu! „Gra­tu­lie­re zur neu­en Stel­le!“ Gera­de für Job­su­chen­de wird es fast uner­träg­lich, von Lin­ke­dIn auf anony­me Pro­fil­be­su­che hin­ge­wie­sen zu wer­den – es könn­te ja ein poten­zi­el­ler Arbeit­ge­ber gewe­sen sein. War­um der Dienst vor allem aber so erfolg­reich ist, zei­gen mir Ver­öf­fent­li­chun­gen gro­ßer Unter­neh­men: Wenn etwa Joe Kae­ser von Sie­mens auf Twit­ter die AfD angeht, folgt unmit­tel­bar dar­auf ein aus­führ­li­ches Erklär­stück im per­sön­li­chen Account des Mana­gers auf Lin­ke­dIn. Design und Rich­tung des Bei­trags ver­mit­teln so etwas wie pro­fes­sio­nel­le Kom­mu­ni­ka­ti­on, und doch kommt sie per­sön­lich daher.

    Künst­li­che Intelligenz

    Der Hype um künst­li­che Intel­li­genz erhält ja regel­mä­ßig einen Dämp­fer, sobald die Maschi­nen mich sowohl auf dem Fest­netz­te­le­fon, dem Smart­phone, per Mail und per Push-Benach­rich­ti­gung auf einen ein­ge­trof­fe­nen Anruf hin­wei­sen. Könn­te die Intel­li­genz nicht auto­ma­tisch erken­nen, wel­che ein­zi­ge Benach­rich­ti­gung gera­de aus­reicht, da ich gera­de am Schreib­tisch in der Nähe des klin­geln­den Tele­fons sit­ze? Da gibt es sicher noch mehr zu tun. Als ers­tes, sämt­li­che Benach­rich­ti­gun­gen abzuschalten.

    Ein Trend aber will mir nicht mehr aus dem Sinn: ein Algo­rith­mus für gute Tex­te. Vor­aus­ge­setzt, man ver­fügt über inter­es­san­te Inhal­te. Dann unter­nimmt etwa das Plug­in Yoast SEO bei Word­Press eine Les­bar­keits­ana­ly­se: Pro­ble­ma­tisch ist dann etwa, wenn man kei­ne Zwi­schen­über­schrif­ten nutzt. Und zu wenig über­lei­ten­de Wör­ter in sei­nen Text ein­ge­baut hat. Pas­si­ve Spra­che kann die Maschi­ne eben­falls ganz gut brand­mar­ken, und zu lan­ge Sät­ze und Absät­ze flie­ßen außer­dem in die Bewer­tung ein. Nur bei der „Flesch Rea­ding Ease“ stol­pert die Maschi­ne gele­gent­lich, da steht dann allen Erns­tes: „The copy scores 41.2 which is con­side­red schwer tu read.“ Mei­ne Pro­gno­se: 2019 hal­ten die­se Text­prü­fer Ein­zug in die gro­ßen CMSe. Und spä­tes­tens in zwei Jah­ren sind sie Bestand­teil ganz nor­ma­ler Redaktionen.

    Auto­ma­tis­men

    Bei Face­book haben sie vor zwei Jah­ren eine Fir­ma ein­ge­kauft, die Social-Media-Ana­ly­sen vor­nimmt. Crowd­Tang­le möch­te ich seit­dem nicht mehr mis­sen: Aus einem Set an ein­mal ein­ge­stell­ten Face­book- und Twit­ter-Accounts schickt die Maschi­ne immer dann eine Mail, sobald ein Bei­trag dort gewis­se Schwel­len der Auf­merk­sam­keit über­steigt. Das hilft enorm, das Unwich­ti­ge und Nicht­be­ach­te­te aus­zu­sie­ben. Beson­ders hilf­reich: Wenn nichts pas­siert, kommt auch schon mal kei­ne Mail.

    News­let­ter

    Nicht erst seit Ein­rich­ten des eige­nen News­let­ters ahne ich, dass dem Gen­re der Mails im Jahr 2019 noch ein­mal eine beson­de­re Bedeu­tung zukommt. Öff­nungs­ra­ten von 60 oder 70 Pro­zent sind durch­aus mach­bar, und per­sön­li­cher geht’s kaum noch. Da ist für vie­le Unter­neh­men noch Luft: Ein inter­es­san­tes Expe­ri­ment ist der Digi­tal-News­let­ter „Back­ground“ des Tages­spie­gels. Sport­li­che 179 Euro kos­tet der Bezug pro Monat, 139 Euro bei einer Min­dest­lauf­zeit von 24 Mona­ten. Wie vie­le Nut­zer man mit kos­ten­lo­sen News­let­tern errei­chen kann, bewei­sen regel­mä­ßig Lorenz Maroldt, Flo­ri­an Harms und Gabor Steingart.

    Pod­casts

    Das gespro­che­ne Wort aus beru­fe­nem Mund wird 2019 noch popu­lä­rer, sobald es ergoo­gel­bar ist. Pod­casts wer­den mit­tel­fris­tig bedeu­ten­der, denn Goog­le will das Gen­re in sei­ne Suche inte­grie­ren. Und dabei geht es nicht nur um die Meta­da­ten, die die Inhal­te des Pod­casts beschrei­ben; eine auto­ma­ti­sche Sprach­er­ken­nung soll die Inhal­te tran­skri­bie­ren. Nicht nur für Radio­sen­der bre­chen so neue Zei­ten her­an. Auch You­tube-Inhal­te kön­nen so noch ein­mal eine wei­te­re Auf­merk­sam­keits­schwel­le überwinden.

    Weni­ger schlech­te Medien

    Der wich­tigs­te Trend aber dürf­te 2019 sein, weni­ger schlech­te Medi­en zu akzep­tie­ren. Die Über­for­de­rung durch Push-Benach­rich­ti­gun­gen, Face­book-Time­line, Likes auf Insta­gram und gefälsch­ten oder fal­schen News selbst in renom­mier­ten Medi­en schlägt zurück: Es ent­wi­ckelt sich eine Sehn­sucht zu mehr Ruhe, Gelas­sen­heit und Pro­fes­sio­na­li­tät im Medi­en­ge­schäft. Viel­leicht erle­ben wir dann auch die ers­te Block­chain für über­prüf­te Fak­ten, eine Art blaue Haken für Vide­os bei­spiels­wei­se. Dass es einen Bedarf dafür gibt, zei­gen die soge­nann­ten Deep Fakes – gefälsch­te Vide­os, in denen Prot­ago­nis­ten Sät­ze in den Mund gelegt wer­den. Am Ende kön­nen nur der Kame­ra­mann und die Per­son selbst die Authen­ti­zi­tät bele­gen – womit wir wie­der auf Platt­for­men wie Lin­ke­dIn wären, die dazu die­nen könnten.

    You Won’t Belie­ve What Oba­ma Says In This Video! 😉