Schlagwort: Künstliche Intelligenz

  • Der iPhone-Moment der KI? Nein, es ist der Wikipedia-Moment

    Der iPhone-Moment der KI? Nein, es ist der Wikipedia-Moment

    Das ist für mich eher der Wiki­pe­dia-Moment: Welt­wei­tes Wis­sen wird lokal und trans­pa­rent zugäng­lich, und das geschieht nun auch bei den Inter­pre­ta­tio­nen der Künst­li­chen Intel­li­genz (KI).

    Doch pas­siert das nicht allein durch ver­meint­li­che Zau­be­rei bei den geschlos­se­nen, unein­seh­ba­ren Model­len wie ChatGPT, Clau­de oder Goog­le Gemi­ni. Son­dern künf­tig mehr und mehr bei down­load­ba­ren Open-Source-Model­len wie LlaMA vom Face­book-Kon­zern Meta, Fal­con von TII aus den Ver­ei­nig­ten Ara­bi­schen Emi­ra­ten oder Yi von 01​.AI aus China.

    Hin­ter­grund ist ein Leis­tungs­ver­gleich meh­re­rer Sprach­mo­del­le. Dem­nach holen die frei zugäng­li­chen bei der Kor­rekt­heit ihrer Ant­wor­ten gegen­über den geschlos­se­nen Model­len auf. Die grü­ne Trend­li­nie in der Gra­fik dürf­te bald auf die blaue Trend­li­nie tref­fen. Grün sind die Open-Source-Model­le, blau die Clo­sed-Source-Ver­sio­nen. Die Leis­tungs­fä­hig­keit wird hier bei der soge­nann­ten MMLU-Per­for­mance gemes­sen. MMLU steht für „Mas­si­ve Mul­ti­tas­king Lan­guage Under­stan­ding“ und beinhal­tet einen Test für 57 The­men. Dem­nach gilt GPT‑4 wei­ter­hin als das „bes­te“ Sprach­mo­dell unter jenen, die kei­ne extra Trai­nings­da­ten ent­hal­ten. Das neue­re Modell Gemi­ni Ultra von Goog­le ran­giert bei die­sem Ver­gleich zwar ober­halb von GPT‑4, doch ent­hält es extra Trai­nings­da­ten, die spe­zi­ell auf die Test­fra­gen abge­stimmt sein könnten.

    In der Pra­xis kann man sich heu­te bereits eine eige­ne KI zusam­men­stöp­seln. Basis­soft­ware ist zum Bei­spiel GPT4All, das für Win­dows, macOS und Linux erhält­lich ist. Aus der Soft­ware her­aus las­sen sich bereits diver­se Sprach­mo­del­le her­un­ter­la­den, die Namen tra­gen wie Mis­tral OpenOr­ca oder GPT4All Fal­con. Auch Metas Llama 2 lässt sich dazu instal­lie­ren, vor­aus­ge­setzt, man akzep­tiert deren etwas eigen­wil­li­ge Open-Source-Lizenz. Die erlaubt auch die kom­mer­zi­el­le Nut­zung des Sprach­mo­dells, außer man kommt auf mehr als 700 Mil­lio­nen monat­lich akti­ve Nut­zer. Zudem ist für den Down­load und den Ein­bau bei GPT4All neu­er­dings ein Sprach­mo­dell im soge­nann­ten .gguf-For­mat not­wen­dig, älte­re .bin-Datei­en funk­tio­nie­ren nicht mehr.

    Vor­bo­te einer per­so­na­li­sier­ten KI: GPT4All. (Screen­shot: Schwarze)

    Das zunächst nerdig erschei­nen­de The­ma hat auf der Platt­form Hug­ging Face einen welt­wei­ten Markt­platz gefun­den. Hier sam­melt die KI-Com­mu­ni­ty Open-Source-Biblio­the­ken und Sprach­mo­del­le. Mehr als 50.000 Orga­ni­sa­tio­nen nut­zen die Res­sour­cen von Hug­ging Face. So kön­nen etwa maschi­nel­le Lern­pro­jek­te direkt aus­pro­biert wer­den. GPT4All ist dabei nur einer von vie­len Prot­ago­nis­ten der Sze­ne. Auch Micro­soft hat hier Model­le ver­öf­fent­licht, etwa Phi‑2 als beson­ders klei­nes, aber beson­ders hoch­wer­ti­ges Modell.

    Inter­es­sant wird GPT4All als ver­gleichs­wei­se ein­fa­che Anwen­dung, die auf dem eige­nen Rech­ner genutzt wer­den kann, aus zwei­er­lei Grün­den: Zum einen kön­nen pri­va­te Daten fürs soge­nann­te Fine­tu­ning hin­ter­legt wer­den. So habe ich etwa mei­ne eige­nen Arti­kel von GPT4All inde­xie­ren las­sen. Und kann der per­sön­li­chen KI Fra­gen stel­len zu The­men, die ich bereits vor Jah­ren oder Jahr­zehn­ten beschrie­ben habe.

    Zum zwei­ten kön­nen die gewon­ne­nen Daten in einem soge­nann­ten Open Source Data­la­ke beim Unter­neh­men Nomic aus New York ein­ge­speist wer­den. Nomic hat die Anwen­dung GPT4All bereit­ge­stellt. Hier gilt es frei­lich, genau zu wis­sen, was man tut. Die Daten wer­den unter atlas​.nomic​.ai öffent­lich. Des­we­gen sind per­so­nen­be­zo­ge­ne Daten aus­zu­schlie­ßen und Geschäfts­un­ter­la­gen geson­dert zu schützen.

    Punkt­wol­ke aus meh­re­ren Mil­lio­nen Tweets: Bei Atlas von Nomic las­sen sich Mil­lio­nen Daten­punk­te hoch­la­den und spä­ter als Basis für eige­ne Sprach­mo­del­le nut­zen. (Screen­shot: Schwarze)

    Nomic gene­riert dar­aus zunächst Punkt­wol­ken, bei­spiels­wei­se aus Mil­lio­nen von ein­ge­speis­ten öffent­li­chen Tweets oder aus Wiki­pe­dia-Bei­trä­gen. Und so schließt sich der Kreis: Die Daten kön­nen von Nomic, aber auch von ande­ren dazu ver­wen­det wer­den, neue Sprach­mo­del­le zu trai­nie­ren. Und es las­sen sich sowohl öffent­li­che als auch pri­va­te Daten­punk­te fest­le­gen – letz­te­re für Infor­ma­tio­nen, die nicht für ande­re zugäng­lich sein sol­len. Dar­aus wird letzt­lich Nomics Geschäfts­mo­dell. Wer Geschäfts­un­ter­la­gen vor der KI pri­vat hal­ten möch­te, muss dafür bei Nomic zahlen.

  • Künstliche Intelligenz erweckt Memes zu Kurzvideos

    Künstliche Intelligenz erweckt Memes zu Kurzvideos

    Das viel­leicht berühm­tes­te oder zumin­dest lang­le­bigs­te Meme des Inter­nets heißt „Dis­trac­ted Boy­fri­end“ und zeigt einen jun­gen Mann, der mit sei­ner Part­ne­rin die Stra­ße ent­lang­geht; als bei­de einer ande­ren Frau begeg­nen, schaut er ihr lüs­tern hin­ter­her, sei­ne Freun­din blickt ihn dabei ungläu­big-irri­tiert an. Die insze­nier­te Auf­nah­me stammt von dem spa­ni­schen Foto­gra­fen Anto­nio Guil­lem, auf­ge­nom­men hat er sie 2015 in der kata­la­ni­schen Stadt Girona.

    Zum Meme, einem vira­len Inter­net­phä­no­men also, wur­de es auf Twit­ter im Jahr 2017, als jemand die Part­ne­rin als „Kapi­ta­lis­mus“ beti­tel­te, den Mann als „die Jugend“ und die Frem­de als „Sozia­lis­mus“. Seit­her gab es Tau­sen­de Vari­an­ten die­ses Bil­des, in dem Untreue oder die Abkehr vom Bis­he­ri­gen ver­sinn­bild­licht wur­den. (Bevor jemand fragt: Ich habe die Nut­zungs­rech­te an dem Bild für die­sen Bei­trag ordent­lich bei iStock­Pho­to gekauft.)

    Nun ent­stand dar­aus ein Video. X‑Nutzer @fofrAI hat die glei­che Sze­ne mit­hil­fe der Soft­ware Sta­ble Video Dif­fu­si­on so ani­miert,

    … dass die Frem­de aus dem Bild läuft, der Mann ihr wei­ter hin­ter­her­schaut und der miss­bil­li­gen­de Blick der Part­ne­rin län­ger anhält. Es ist nur eine kur­ze Sze­ne. Doch wirk­te sie vor ein paar Wochen wie der Start­schuss zur Ani­ma­ti­on wei­te­rer Memes.

    So ani­miert Este­ban Oroz­co das berühm­te lächeln­de Mäd­chen vor einem abbren­nen­den Haus in lodern­den Flam­men.

    Rodri­go Fer­nan­dez gestal­tet die Sze­ne noch etwas rea­lis­ti­scher.

    Jemand mit dem Account­na­men Art­ony­mousart­fakt belebt den bekann­ten Seni­or „Hide the Pain Harold“ mit einer Kaf­fee­tas­se am Laptop.

    Auch das „Suc­cess Kid“, ein klei­ner Jun­ge im grün-wei­ßen Pull­over mit geball­ter Faust, wird durch die KI zu neu­em Leben erweckt. Das Meme stammt aus dem Jahr 2007.

    Die Qua­li­tät der Sequen­zen hat noch Luft nach oben. Die KI ver­än­dert die Gesichts­zü­ge teil­wei­se unna­tür­lich. Und die Kür­ze der Sze­nen deu­tet dar­auf­hin, wie viel Auf­wand, Ener­gie und Kos­ten der Spaß verursacht.

    Doch braucht es nicht viel Vor­stel­lungs­kraft, was die Ani­ma­ti­ons­pro­gram­me in den nächs­ten Mona­ten und Jah­ren erschaf­fen: Aus Schnapp­schüs­sen wer­den real wir­ken­de Film­chen. Ob Mona Lisa oder der Times-Squa­re-Kuss eines Mari­ne­sol­da­ten, Albert Ein­steins her­aus­ge­streck­te Zun­ge oder die Beat­les auf dem Zebra­strei­fen auf der Abbey Road – sie alle dürf­ten von Enthu­si­as­ten künf­tig neue Bewe­gun­gen ein­ge­haucht bekommen.

    Wo das hin­führt, zeigt eine Wer­bung von Coca-Cola, die das Werk unbe­schei­den als Mas­ter­pie­ce bezeich­net und berühm­te Bil­der in einer Aus­stel­lung ani­miert. Wie ein „Making of“ der Sze­nen in einem wei­te­ren Video zeigt, kam aller­dings bei­lei­be nicht der gesam­te Clip aus der künst­li­chen Intel­li­genz – es war zusätz­lich hoher Auf­wand und viel mensch­li­che Nach­be­ar­bei­tung mit­tels VFX-Tech­nik nötig. Das Video blen­det zu Beginn ein, bei wel­cher Nach­be­ar­bei­tung die KI unterstützte.

    Die Vor­stel­lungs­kraft der Kon­zer­ne reicht bereits weit dar­über hin­aus. Denn nicht nur die Her­stel­lung von Vide­os, auch deren Ana­ly­se wird umge­kehrt wei­te­rer Gegen­stand der KI. Das hat Goog­le ver­gan­ge­ne Woche gezeigt. Der Kon­zern schum­mel­te aller­dings bei der Vor­stel­lung sei­ner künf­ti­gen KI Gemi­ni Ultra in einem spek­ta­ku­lä­ren Video. Es wirkt, als hät­ten die PR-Hei­nis bei Goog­le den KI-Jün­gern beim jüngs­ten Arm­drü­cken im neu­en Goog­le Visi­tor Expe­ri­ence-Bereich gezeigt, wo der Ham­mer hängt:

    Neben­an im D:Economy-Briefing der FAZ habe ich mir nicht nur das Video, son­dern auch die KI näher ange­schaut – und getestet.

    Wei­te­re The­men im dor­ti­gen „Prompt der Woche“ aus der jüngs­ten Zeit:

  • Wie kreativ kann Künstliche Intelligenz sein? Eine Witze-KI über die tollen Tage bei OpenAI

    Wie kreativ kann Künstliche Intelligenz sein? Eine Witze-KI über die tollen Tage bei OpenAI

    (Illus­tra­ti­on: Mar­cus Schwarze/Midjourney, KI-generiert)

    Kurz nach­er­zählt: Der Vor­stand von Ope­nAI hat Sam Alt­man als Chef des Unter­neh­mens über­ra­schend ent­las­sen und eben­so Mit­grün­der Greg Brock­man. Bei­de heu­ern nun beim gro­ßen Geld­ge­ber Micro­soft an.

    Und mehr als 500 von rund 700 Mit­ar­bei­tern bei Ope­nAI haben laut Kara Swis­her, Tech-Jour­na­lis­tin in San Fran­cis­co, erklärt, den bei­den fol­gen zu wol­len, falls der Vor­stand nicht zurück­tritt und die bei­den nicht zurückholt.

    Die Instruk­ti­on an die Maschi­ne zur Erfin­dung einer Wit­ze-KI lautet:

    Du bist Hauptgagschreiber für eine wöchentliche Sendung „Gestern-Show“. Deine Aufgabe ist es, fünf herausragende Witzvorschläge zu aktuellen Ereignissen zu kreieren. Zuerst fragst Du nach dem aktuellen Ereignis und bittest um eine Beschreibung. Danach entfaltest Du Deine Kreativität, treibst den Witz auf absurde Ebenen und krönst ihn mit einer Pointe. Du solltest einfallsreich, humorvoll sein und Witze liefern, die sowohl relevant als auch übertrieben sind. Alle Antworten werden auf Deutsch gegeben.

    Der­art ange­wie­sen, schlug die KI einen Bot namens „Gag­meis­ter Ges­tern“ vor. Und mach­te fünf Vor­schlä­ge für Witze:

    Ach, die OpenAI-Geschichte! Perfekt für einen Gag. Also, stellen wir uns vor:1. Die Microsoft-Übernahme: "Haben Sie gehört? OpenAI hat Sam Altman und Greg Brockman gefeuert, und die sind direkt zu Microsoft. Das erklärt endlich, warum Microsofts neueste KI plötzlich anfängt, E-Mails mit 'Mit künstlichen Grüßen, Sam und Greg' zu unterschreiben!"2. Die Mitarbeiter-Rebellion: "Über 500 Mitarbeiter von OpenAI wollen ihren Chefs zu Microsoft folgen. Ich meine, das ist wie bei einem Konzert: Wenn die Band die Bühne verlässt, folgt das Publikum... nur dass in diesem Fall das Publikum aus lauter Programmierern besteht, die verzweifelt versuchen, ihre Bürostühle durch die Notausgänge zu schieben."3. Die Vorstandssitzung: "Der Vorstand von OpenAI hat eine Krisensitzung einberufen. Es ging drunter und drüber. Einer schlug vor, die KI um Rat zu fragen, aber dann erinnerten sie sich, dass die KI jetzt bei Microsoft arbeitet und wahrscheinlich nur antworten würde: 'Haben Sie versucht, sie aus- und wieder einzuschalten?'"4. Die neue Jobbeschreibung: "Sam Altman und Greg Brockman bei Microsoft – das ist wie wenn die Beatles sich aufgelöst hätten und John Lennon und Paul McCartney bei einer Hochzeitsband angefangen hätten. Statt 'Revolution' singen sie jetzt 'Für immer und ewig'."5. Die Zukunft von OpenAI: "Und was wird jetzt aus OpenAI? Sie suchen nach einem neuen CEO. Gerüchten zufolge steht ganz oben auf der Liste ein sehr talentierter Toaster mit WiFi-Anschluss. Er hat zwar keine Führungserfahrung, aber er macht hervorragende Toasts und hat eine ausgezeichnete Verbindung zu smarten Kühlschränken." 

    Befragt, wel­cher der bes­te die­ser „Wit­ze“ sei, nennt die Maschi­ne jenen mit den Pro­gram­mie­rern, die ver­zwei­felt ver­su­chen, ihre Büro­stüh­le durch die Not­aus­gän­ge zu schieben.

    Die Vor­stel­lung mag als insze­nier­te Dar­stel­lung durch­aus für eine „Ges­tern-Show“ tau­gen – aber ist sie wirk­lich wit­zig? Der Ver­such, sich so etwas von der Bil­der-KI Mid­jour­ney zeich­nen zu las­sen, schei­ter­te übri­gens, selbst mit­hil­fe einer Prompt-Per­fek­tio­nier-Maschi­ne.

    Eine Wei­le noch muss sich der bekann­te Haupt­au­tor einer nam­haf­ten Show von heu­te wohl noch kei­ne Sor­gen um sei­nen Job oder sei­nen emp­feh­lens­wer­ten und stets feh­ler­frei­en News­let­ter machen.

    Oder begin­nen, sie mit bei­spiel­haf­ten Wit­zen zu trai­nie­ren, damit die Maschi­ne die Ana­to­mie eines guten Wit­zes lernt. In einem Kurz­test hat­te die Maschi­ne dann mit ange­füt­ter­ten Wit­zet­weets etwas bes­ser die gewünsch­te Spra­che ver­stan­den – aber an Peter und sei­ne Kol­le­gen reicht die­ser digi­ta­le Bur­sche noch nicht her­an. Für den Zugang zu dem Bot ist ein Bezah­l­abo von ChatGPT‑4 nötig.

  • Bilder bilden weiter

    Bilder bilden weiter

    Ers­te Bei­spie­le beschrieb ich im „Prompt der Woche“ bei der F.A.Z., wei­te­re möch­te ich hier veranschaulichen.

    Da ist die­se Gra­fik glo­ba­ler Han­dels­strö­me der Welt­han­dels­or­ga­ni­sa­ti­on. Hoch­ge­la­den bei ChatGPT-4V, erkennt die Maschine:

    Das bereitgestellte Diagramm zeigt die globalen Handelsströme des Warenhandels im Jahr 2011 in Milliarden Dollar. Hier sind die wichtigsten Informationen aus dem Diagramm:Regionale Handelswerte (in Milliarden Dollar) für 2011:Europa: 4.667Asien/Pazifik: 2.926Nordamerika: 1.103Russland/GUS: 754Nahost: 710Lateinamerika: 200Afrika: (Der genaue Wert ist nicht sichtbar, aber es scheint etwas über 150 zu sein)Interregionale Handelsströme (in Milliarden Dollar):Beispielsweise handelte Europa Waren im Wert von 906 Milliarden Dollar mit Asien/Pazifik und 476 Milliarden Dollar mit Nordamerika. Es gibt auch andere Handelsströme zwischen verschiedenen Regionen, die durch Pfeile und Zahlen dargestellt werden.Steigerung der Exporte von 2011 im Vergleich zu 2010 (in %):Nahost: +37,4%GUS/Russland: +33,9%Lateinamerika: +27,4%Asien/Pazifik: +18,0%Europa: +17,4%Afrika: +16,8%Nordamerika: +16,2%Weltweit: +19,7%Das Diagramm gibt einen Überblick über die Handelsbeziehungen und -werte zwischen den verschiedenen Regionen der Welt für das Jahr 2011. Es zeigt auch, wie sich die Exporte dieser Regionen im Vergleich zum Vorjahr gesteigert haben. Die Datenquelle ist die World Trade Organization (WTO).

    Meh­re­re Feh­ler hat die­se Aus­wer­tung: Der regio­na­le Han­dels­wert für Afri­ka sei nicht sicht­bar, „aber es scheint etwas über 150 [Mil­li­ar­den Dol­lar] zu sein“. Die Gra­fik benennt tat­säch­lich 77 Mil­li­ar­den Dol­lar. Eben­so sind die Waren­wer­te zwi­schen Euro­pa und Asi­en sowie Nord­ame­ri­ka im Text falsch ange­ge­ben. Und auch bei den regio­na­len Han­dels­wer­ten von Russ­land und Nah­ost hat sich die Maschi­ne ver­tan, offen­bar die ähn­li­chen Zif­fern 7 und 1 in der Tex­terken­nung verwechselt.

    Es gilt also, höl­lisch auf­zu­pas­sen bei den Details.

    Dabei dürf­te schon hel­fen, statt einer JPG-Datei künf­tig ein PDF als Quel­le hoch­zu­la­den (bis­her geht das nicht). Dann ent­fie­le die feh­ler­be­haf­te Ziffernerkennung.

    Den­noch zeigt die­se maschi­nel­le Ana­ly­se die Rich­tung: Rich­ti­ger­wei­se hat die KI erkannt, wor­um es geht. Gelingt es jetzt noch, weni­ger Feh­ler ein­zu­bau­en – und dar­auf deu­tet die Ent­wick­lung hin –, so wer­den neue Erkennt­nis­se und Inter­pre­ta­tio­nen eine Sache von Sekun­den. Die Maschi­nen erkun­den Zusammenhänge.

    Worum geht’s hier?

    Der Prompt hier­zu lau­te­te: Wor­um geht’s? (Foto: Schwarze)

    Im Ansatz klappt das mit dem Bild einer Stell­ta­fel: Eine Grup­pe von Medi­en­ma­na­gern papp­te hier vor ein paar Jah­ren zu einem Zukunfts­the­ma Kle­be­zet­tel an die Wand, beschrie­ben mit Stich­wör­tern zur künf­ti­gen Bezahl­schran­ke eines Online-Ange­bots. Die hand­schrift­li­chen Zet­tel wur­den spä­ter von den Teil­neh­mern mit Punk­ten beklebt, je nach Ein­schät­zung der Wichtigkeit.

    Das hoch­ge­la­de­ne Foto der Stell­ta­fel wur­de von GPT-4V auf die lis­ti­ge Fra­ge „Wor­um geht’s?“ aus­ge­le­sen und mit drei, vier wei­te­ren fol­gen­den Prompts neu sor­tiert. Her­aus kam eine Tabel­le mit den wich­tigs­ten Punk­ten, soweit die Maschi­ne die Hand­schrift erken­nen konn­te. „Es scheint, als han­de­le es sich um ein Brain­stor­ming oder eine Pla­nungs­ta­fel zu den The­men ‚Con­tent‘ und ‚Ziel­grup­pe‘.“

    Die Maschi­ne war auch in der Lage, die Anzahl der auf­ge­kleb­ten Punk­te bei ein­zel­nen Kle­be­zet­teln aus­zu­zäh­len. Nicht per­fekt, aber es ergab eine ziel­füh­ren­de, gute Grundlage.

    Die Magie der KI ist dabei erkenn­bar, aber noch nicht zuver­läs­sig und all­tags­über­zeu­gend. Nicht jede Sau­klaue wird erkannt, die Anord­nung der Begrif­fe ver­rutscht teil­wei­se. Doch auch hier ste­hen wir ein­mal mehr am Anfang einer neu­en Ent­wick­lung. Der Pro­to­kol­lant sorgt sich um sei­nen Job, der Kol­le­ge mit KI-Kennt­nis­sen macht dar­aus sei­nen nächs­ten Karriereschritt.

    Bild-Posts für Social Media bewerten

    Für ein drit­tes Bei­spiel ver­wei­se ich auf den Kol­le­gen Felix Beil­harz: Er hat bei Lin­ke­dIn Bei­spie­le von Social-Media-Posts unter­sucht, bei GPT4‑V ein­ge­speist und um eine fach­kun­di­ge Stel­lung­nah­me gebe­ten, sinn­ge­mäß: Wie gut ist der Post? Ist die Schrift groß genug? Die Bebil­de­rung hilf­reich? Die Maschi­ne ent­deckt in dem hoch­ge­la­de­nen Bild unter ande­rem einen man­geln­den „Call to Action“, also eine kla­re Auf­for­de­rung, was der Leser oder die Leser als Nächs­tes machen sollte.

    Ein Flussdiagramm interpretieren

    Das vier­te und letz­te Bei­spiel für den Beginn einer neu­en Zeit ist mein Lieb­ling: Die fol­gen­de Gra­fik erstell­te ich wäh­rend der Coro­na­zeit für die Lan­des­re­gie­rung. Im extre­men Hoch­for­mat ver­an­schau­lich­te sie, wie lan­ge damals jemand in Qua­ran­tä­ne gehen muss­te, sobald ein Kol­le­ge im Büro sich als infi­ziert krankmeldete.

    Dem Dia­gramm ging ein genüss­li­cher Aus­tausch mit auf­ge­mal­ten Ent­wür­fen von Zeich­nun­gen von Fach­leu­ten voraus.

    GPT-4V ist in der Lage, dem ent­stan­de­nen Fluss­dia­gramm zu fol­gen – und die all­ge­mei­nen Regeln auf einen per­sön­li­chen Fall anzuwenden.

    Der Prompt: Wie lan­ge muss ich selbst in Qua­ran­tä­ne, wenn ich

    • a) mit dem infi­zier­ten Kol­le­gen am Mon­tag engen Kon­takt hatte,
    • b) heu­te Mitt­woch ist und
    • c) er sich krank­ge­mel­det hat,
    • d) ich soeben einen posi­ti­ven PCR-Test gemacht habe und
    • e) selbst Sym­pto­me aufweise?

    Die Ant­wort, gekürzt: Da Sie als posi­tiv getes­te­te Per­son gel­ten, müs­sen Sie sich (wei­ter­hin) iso­lie­ren. Sie haben zwei Optio­nen zur Been­di­gung der Qua­ran­tä­ne. Opti­on 1: Sie müs­sen sich frü­hes­tens am 11. Tag der Iso­la­ti­on erneut einem PCR-Test unter­zie­hen. Wenn die­ser Test nega­tiv ist, kön­nen Sie die Iso­la­ti­on frü­hes­tens am 14. Tag been­den. Opti­on 2: Sie müs­sen am ers­ten Tag der Sym­pto­me oder am 14. Tag der Iso­la­ti­on einen PCR-Test durch­füh­ren lassen.

    Das ist bei der Opti­on 2 zwar nicht 100 Pro­zent exakt, aber nahe dran. Die KI kann künf­tig auch dabei hel­fen, Unklar­hei­ten in bestimm­ten For­mu­lie­run­gen eines sol­chen Dia­gramms auf­zu­stö­bern. Jetzt stel­le man sich das Ergeb­nis in ein, zwei Jah­ren vor, wenn auch die Bild-Erken­nungs-KI erwach­sen wird.

    Beim Wie­der­fin­den des Stell­ta­fel-Bil­des inmit­ten von 55.000 Fotos half übri­gens eine ande­re KI: die von Apple Fotos. Sie hat alle die­se Bil­der unter­sucht, erkennt Moti­ve, Per­so­nen, Objek­te und Orte sowie hand­ge­schrie­be­ne und gedruck­te ent­hal­te­ne Tex­te. Die Suche lief nach dem Wort „Con­tent“, das ein­zi­ge, an das ich mich erin­nern konn­te. Gera­de hat Apple sei­ne iCloud-Funk­ti­on für bis zu 12 Tera­byte (statt bis­her 2 TB) an Daten freigeschaltet.


    Künstliche Intelligenz im Videokurs …

    Seit ver­gan­ge­ner Woche ist die kos­ten­pflich­ti­ge Wolf-Schnei­der-KI drau­ßen. Sie über­ar­bei­tet Tex­te nach den Regeln Schnei­ders. Ich hat­te sie bereits vor­ab mit­tes­ten kön­nen und Ergeb­nis­se hier beschrieben.

    Gemein­sam mit Ales­san­dro Alvia­ni von Ippen Media und den Kol­le­gen der Repor­ter­fa­brik gibt es par­al­lel zum Start der WSKI ein kos­ten­lo­ses Online-Semi­nar zu Künst­li­cher Intel­li­genz im Jour­na­lis­mus. Ales­san­dro gibt dazu einen Ein­blick in die Ent­wick­lung, ich steue­re prak­ti­sche Anwen­dun­gen bei.


    … und in der Branche

    Prak­ti­sche Lösun­gen für Publisher ste­hen auch im Mit­tel­punkt des Bran­chen­ma­ga­zins Kress Pro, das einen bekann­ten Prompt­prak­ti­kan­ten auf den Titel hob. Man soll­te ein Geschäfts­mo­dell dar­aus machen: Die Aus­ga­be kos­tet 38 Euro. Chef­re­dak­teur Mar­kus Wie­gand hat auf­ge­schrie­ben, um wel­che Anwen­dun­gen es im Ein­zel­nen geht.

    Eine KI-gestütz­te Ana­ly­se sei­nes Pos­tings (als Screen­shot) besagt unter ande­rem: „Das Titel­bild zeigt eine Nah­auf­nah­me eines Man­nes, der seri­ös und nach­denk­lich aus­sieht.“ So weit, so schmei­chel­haft (Dan­ke, Sascha!). Aber zu mög­li­chen Kri­tik­punk­ten: „Bild­aus­wahl: Obwohl das Foto des Man­nes pro­fes­sio­nell aus­sieht, könn­te es für eini­ge Betrach­ter nicht sofort klar sein, wer er ist oder wel­che Rol­le er im Kon­text des Maga­zin­the­mas spielt.“

  • Ein Prompt macht mehr als tausend Bilder

    Ein Prompt macht mehr als tausend Bilder

    Gra­fi­ker müs­sen umden­ken. Wer eine Bebil­de­rung für ein schwie­ri­ges The­ma braucht, füt­tert seit ein paar Mona­ten eine Bil­der-KI mit Anwei­sun­gen. Wenn man es rich­tig macht, kommt dabei eine vor­zeig­ba­re Illus­tra­ti­on her­aus. Die­se kann foto­rea­lis­tisch oder wie eine Zeich­nung aus­se­hen, vek­to­ri­siert (wie oben) oder wie ein Ölge­mäl­de – es kommt eben auf den Prompt an, die Regie­an­wei­sung also an die KI.

    Mid­jour­ney galt bis­her als der Por­sche unter den gene­ra­ti­ven Bil­der-KIs, obwohl die Bedie­nung in Ver­knüp­fung mit der Chat-Soft­ware Dis­cord nicht eben leicht zu erler­nen war. Die Resul­ta­te aber waren und sind oft überzeugend.

    Seit weni­gen Tagen hat auch ChatGPT eine Bil­der­funk­ti­on ein­ge­baut. Sie heißt Dall‑E 3 und lässt sich bei der kos­ten­pflich­ti­gen Ver­si­on GPT‑4 über den gleich­lau­ten­den Menü­punkt akti­ve­ren. Eine Anlei­tung zu Dall‑E 3 kennt GPT‑4 nicht. Aber dafür gibt’s ja mich.

    Der Prompt für die vier Bil­der oben in GPT‑4 lau­te­te (deut­sche Über­set­zung folgt):

    Create an illustration depicting the role of a meticulous journalist summarizing a specific text according to strict guidelines. The scene should encompass the following elements: The Journalist at the Desk: Showcase a person seated at a desk equipped with a computer, notes, and books. The individual should appear focused, possibly holding a magnifying glass to symbolize attention to detail. A Marked and Annotated Text: Place a document on the desk with highlights, underlines, and annotations, emphasizing the requirements of the journalistic process, such as gendering job titles and avoiding certain words. Vivid Examples: Include small illustrations or symbols representing the themes or concepts described in the text, fulfilling the demand for vivid examples. Neutral Style and Color Scheme: Employ subdued, neutral colors to reflect the journalist's objectivity and neutrality. The goal is to craft a scene that illustrates both the complexity of the journalistic task and the simplicity and clarity of the requirements. The illustration should strike a balance between richness in detail and simplicity, highlighting the care and accuracy of the journalist.

    Erstelle eine Illustration, die die Rolle eines sorgfältigen Journalisten beim Zusammenfassen eines spezifischen Textes nach strengen Richtlinien darstellt. Die Szene sollte folgende Elemente umfassen:Der Journalist am Schreibtisch: Zeige eine Person, die an einem mit Computer, Notizen und Büchern ausgestatteten Schreibtisch sitzt. Die Person sollte konzentriert wirken, möglicherweise mit einer Lupe in der Hand, um die Liebe zum Detail zu symbolisieren.Ein markierter und annotierter Text: Platziere ein Dokument auf dem Schreibtisch, das Hervorhebungen, Unterstreichungen und Anmerkungen aufweist. Diese sollen die Anforderungen des journalistischen Prozesses hervorheben, wie zum Beispiel das Gendern von Berufsbezeichnungen und das Vermeiden bestimmter Worte.Lebendige Beispiele: Füge kleine Illustrationen oder Symbole hinzu, die die Themen oder Konzepte im Text repräsentieren und damit den Anspruch an lebendige Beispiele erfüllen.Neutraler Stil und Farbschema: Verwende zurückhaltende, neutrale Farben, um die Objektivität und Neutralität des Journalisten widerzuspiegeln.Das Ziel ist es, eine Szene zu schaffen, die sowohl die Komplexität der journalistischen Aufgabe als auch die Einfachheit und Klarheit der Anforderungen illustriert. Die Illustration sollte ein Gleichgewicht zwischen Detailreichtum und Einfachheit finden und die Sorgfalt und Genauigkeit des Journalisten hervorheben.

    Nicht ich habe die­sen Prompt so aus­ge­feilt for­mu­liert, son­dern die KI Chat-GPT bereits vor ein paar Mona­ten. Damals für Mid­jour­ney. Her­aus kam bei Mid­jour­ney die­se Illustration:

    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze

    Bei­de Ergeb­nis­se hal­te ich für beachtlich.

    Einen Schritt wei­ter geht die Anwen­dung Fire­fly 2 von Ado­be. Der oben genann­te Prompt ist dafür zu lang und pro­du­ziert des­halb einen Feh­ler. Ver­kür­ze ich den Prompt, kom­men die­se Ergeb­nis­se her­aus – nach zusätz­li­chem Ein­stel­len eines Inhalts­typs Foto (statt Kunst) und Hin­zu­fü­gen der Effek­te Hyper­rea­lis­tisch und Gol­de­ne Stunde.

    Illus­tra­ti­on: KI-gene­rier­t/­Fi­re­fly Image 2 (Beta)/Schwarze

    Fin­ger und Haut wir­ken etwas unna­tür­lich. Beim Her­un­ter­la­den merkt die Soft­ware an, dass in der Datei Infor­ma­tio­nen hin­ter­legt wer­den, wonach es sich um ein KI-gene­rier­tes Bild handelt.

    Illus­tra­ti­on: KI-gene­rier­t/­Fi­re­fly Image 2 (Beta)/Schwarze

    Fire­fly erschließt erst­mals bes­ser die berüch­tig­te „Black­box“ der künst­li­chen Intel­li­genz: Bei Mid­jour­ney und Co sto­cher­te man bis­her im Nebel, war­um die Maschi­ne gewis­se Bil­der­ele­men­te gene­rier­te und wel­che Sti­le sie beherrscht und war­um die KI sie anwen­det. Bei Fire­fly ist alles fein zise­liert ein­stell­bar – fast wird man erschla­gen von den Mög­lich­kei­ten. Neben der grund­le­gen­den Fest­le­gung auf Foto oder Kunst las­sen sich zum Bei­spiel fol­gen­de Effek­te anwenden:

    Art déco, Jugend­stil, Barock, Bau­haus, Kon­struk­ti­vis­mus, Kubis­mus, Cyber­punk, Fan­ta­sy, Fau­vis­mus, Film noir, Glitch-Kunst, Impres­sio­nis­mus, Indus­trie­de­sign, May­ima­lis­mus, Mini­ma­lis­mus, Moder­ne Kunst, Moder­nism, Neo-Expres­sio­nis­mus, Poin­til­lis­mus, Psy­che­de­lisch, Sci­ence Fic­tion, Steam­punk, Sur­rea­lis­mus, Syn­the­tis­mus, Syn­thwa­ve, Vapor­wa­re, 3D, Ani­me, Car­toon, Kino, Comic, Con­cept Art, Cyber-Matrix, Digi­ta­le Kunst, Fla­che Far­ben, Geo­me­trisch, Glass­mor­phis­mus, Gra­fik-Glitch, Graf­fit­ti, Gra­fik, Hyper­rea­lis­tisch, Innen­aus­stat­tung, Lini­en­ver­lauf, Low-Poly-Art, Zei­tungs­col­la­ge, Opti­sche Täu­schung, Pixel­mus­ter, Pixel-Art, Pop-Art, Pro­dukt­fo­to­gra­fie, Psy­che­de­li­scher Hin­ter­grund, Skan­di­na­visch, Splash-Bil­der, Brief­mar­ke, Trom­pe l’oeil, Vek­tor-Look, Drahtmodell.

    Hin­zu kom­men jeweils eben­so viele

    • Tech­ni­ken von Acryl­far­be bis Gekritzelt,
    • wei­te­re Fil­ter von Fisch­au­ge bis Isometrisch,
    • Mate­ria­len wie Koh­le, Holz­schnit­ze­rei oder Marmor,
    • soge­nann­te Kon­zep­te von Chao­tisch bis Göttlich,
    • Farb­ge­bun­gen von schwarz-weiß bis Pastell,
    • Beleuch­tun­gen von Gegen­licht bis Gol­de­ne Stunde,
    • Kom­po­si­tio­nen von Nah­auf­nah­me bis Vogelperspektive.

    Die Mög­lich­kei­ten bei Fire­fly sind kom­bi­nier­bar und somit endlos.

    Illus­tra­ti­on: KI-gene­rier­t/­Fi­re­fly Image 2 (Beta)/Schwarze

    Ein bereits frü­her ver­wen­de­tes Bei­spiel einer neu­en Brü­cke über dem Mit­tel­rhein brach­te sei­ner­zeit bei Mid­jour­ney fol­gen­des Ergebnis:

    Design an elegant bridge (40 meters tall) over the River of the Rhine in the middle rhine valley, with separate lanes for pedestrians, cars and bikes, that is a finely geometrical fractal shell, nautilus regular logarithmic spiral geometrically developed fibonacci, translucent, parametric architecture grasshopper, in the golden hour time near the lorelei or Boppard
    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze, Prompt: im Alt-Text.

    Bei GPT‑4 mit Dall‑E 3 tobt sich die Maschi­ne bei dem glei­chen Prompt aus und schießt übers Ziel hinaus:

    Illus­tra­ti­on: KI-gene­rier­t/GPT‑4/­Schwar­ze

    Ado­be Fire­fly 2 dage­gen setzt stär­ker auf die Rea­li­tät, fast scheint man die Lore­ley im Hin­ter­grund zu erkennen:

    Illus­tra­ti­on: KI-gene­rier­t/­Fi­re­fly Image 2 (Beta)/Schwarze

    Bei vie­len wei­te­ren Ver­su­chen stell­te sich her­aus, dass mit Ado­be Fire­fly am bes­ten zu steu­ern ist, wie die Maschi­ne agie­ren soll. Aller­dings sind die Ein­stel­lun­gen so viel­fäl­tig, dass sie sich kaum auf Anhieb erschlie­ßen. Ver­such und Irr­tum sind die neu­en Zeit­räu­ber – wie­der ist eine Stun­de weg, ohne dass ein „per­fek­tes“ Ergeb­nis vorliegt.

    Ande­rer­seits kann mit den Werk­zeu­gen nun jeder Anfän­ger eine schnel­le Illus­tra­ti­on für eine Prä­sen­ta­ti­on zau­bern. Der Auf­wand beträgt etwas Gehirn­schmalz für den geeig­ne­ten Prompt – und gege­be­nen­falls etwas Überarbeitung.

    Für den Lokal­jour­na­lis­mus erge­ben sich so neue Mög­lich­kei­ten. Wenn dann tat­säch­lich nach Jahr­zehn­ten der Dis­kus­si­on über eine neue Brü­cke am Mit­tel­rhein eine wich­ti­ge grund­le­gen­de Ent­schei­dung gefällt wur­de – war­um soll­te man sie nicht mit einer Illus­tra­ti­on doku­men­tie­ren, die die Lese­rin­nen und Leser träu­men lässt? Ande­rer­seits wird der Jour­na­list mit einer sol­chen Dar­stel­lung zum Akteur: Kein Pla­nungs­bü­ro, kein Bau­amt hat die­se Ent­wür­fe gemacht, die Kos­ten unab­seh­bar, die Rea­li­sie­rung in jedem Fall frag­lich. Ent­spre­chend als „KI-gene­riert“ zu kenn­zeich­nen sind die­se Bil­der daher allemal.

    fashion photo of a young woman centered straight shot photo shot on Canon EOS R3 f1.8/135 mm of a woman dressed in Gucci, wearing an intricate royal blue dress, natural lighting
    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze. Prompt: sie­he Alt-Text.

    Eines mei­ner Lieb­lings­bil­der der KI, das einer Frau in Guc­ci-Kla­mot­ten (oben), lässt sich bei Fire­fly auch als „Refe­renz­bild“ für neue Krea­tio­nen fest­le­gen. Die Maschi­ne ana­ly­siert dann das Bild und nimmt grund­le­gen­de Erkennt­nis­se für eine neue Dar­stel­lung zum glei­chen Prompt auf. Das Ergebnis:

    Illus­tra­ti­on: KI-gene­rier­t/Ado­be Fire­fly 2 (Beta)/Schwarze.

    Die grund­le­gen­den Ele­men­te, Far­ben, Stim­mun­gen und Details neu auf­zu­neh­men, wird so zur neu­en Mög­lich­keit, ohne Model, Stu­dio, Schweiß und Trä­nen. Ande­rer­seits birgt die KI-Tech­nik die Gefahr, sich in den Tie­fen des Promp­tens zu ver­zet­teln. Und 100-pro­zen­tig authen­tisch wir­ken die Ergeb­nis­se wei­ter­hin nur per Zufall.

  • ChatGPT bekommt Augen: So liest die KI Fotos

    ChatGPT bekommt Augen: So liest die KI Fotos

    Da lädt jemand ein Han­dy­fo­to einer Zeich­nung von einer Kon­fe­renz­ta­fel hoch, die KI macht dar­aus eine funk­tio­nie­ren­de Webseite:

    Jemand aus Ita­li­en lädt ein Foto eines Wohn­zim­mers hoch und bit­tet um Vor­schlä­ge fürs Ver­schö­nern. Die Maschi­ne schlägt unter ande­rem Akzent­far­ben vor, inspi­riert von ita­lie­ni­schem Dekor:

    Eine ver­wir­ren­de Ansamm­lung von Stra­ßen­schil­dern inter­pre­tiert ChatGPT: Ja, Du kannst hier ab 16 Uhr an einem Diens­tag für eine Stun­de parken:

    Ein kaum durch­schau­ba­res Schau­bild zur Insta­bi­li­tät Afgha­ni­stans inter­pre­tiert die Maschi­ne nüchtern-sachlich:

    Den Screen­shot eines Dash­boards baut ChatGPT fast 1:1 nach:

    Prü­fungs­auf­ga­ben der Mathe­ma­tik und Phy­sik, hoch­ge­la­den als Foto, beant­wor­te­te die Maschi­ne mit ent­spre­chen­den For­meln (aller­dings sind die Ant­wor­ten wohl nicht in Gän­ze kor­rekt, wie die Dis­kus­si­on unter dem Tweet zeigt):

    Für eine bestimm­te Innen­ar­chi­tek­tur und das dar­ge­stell­te Design fin­det die Maschi­ne offen­sicht­lich rich­ti­ger­wei­se den Begriff des „Athe­ni­schen Moder­nis­mus“ (ein­fach mal googeln):

    Ope­nAI selbst zeigt, wie ChatGPT durch Bil­der, Anlei­tung und Ein Foto vom Werk­zeug­kof­fer bei einer Hand­wer­ker­auf­ga­be hel­fen kann:

    Und dann war da noch die­ses Video einer ganz ande­ren Bau­stel­le, von Lex Fri­d­man mit Mark Zucker­berg, das erst­mals anschau­lich das viel bespro­che­ne und von vie­len schon wie­der tot­ge­sag­te Meta­ver­se zeigt – einen vir­tu­el­len Raum, an dem die Face­book-Schmie­de Meta feilt. Die Her­ren tra­gen eigent­lich schwe­re Bril­len und Kopf­hö­rer, doch die Tech­nik lässt die Gerä­te ver­schwin­den. Mimik und Spra­che wer­den künst­lich gene­riert, man wähnt sich in einem gemein­sa­men ver­dun­kel­ten Raum:

    Das neue ChatGPT Vision

    … konn­te ich noch nicht tes­ten, die Funk­ti­on wird erst nach und nach aus­ge­rollt. Vie­le wei­te­re Bei­spie­le zei­gen die Leis­tungs­fä­hig­keit, aber auch die Feh­ler. Ope­nAI selbst hat in einem Papier bereits unter­sucht, wel­che Gefah­ren von der neu­en Seh­fä­hig­keit der Maschi­nen aus­ge­hen kön­nen. Sie rei­chen von falsch erkann­ten gif­ti­gen Pil­zen bis zur Befeue­rung von Kli­schees und Vorurteilen.

    Und noch eine Funk­ti­on wird bei ChatGPT gera­de popu­lär: die Fähig­keit, gespro­che­ne Prompts zu erken­nen und gespro­chen zu beant­wor­ten. Das ist zwar mit Blick auf die alten Damen Ale­xa und Siri kei­ne Meis­ter­leis­tung mehr, in Ver­knüp­fung mit KI-Leis­tun­gen im Hin­ter­grund aber für vie­le eben­so kras­ses Neuland.


    Vie­len Dank fürs Lesen von Mar­cus Schwar­zes News­let­ter! Die­ser Post ist öffent­lich, also zögern Sie nicht, ihn zu teilen.


    Mehr zur rasan­ten Ent­wick­lung der künst­li­chen Intel­li­genz bie­tet das Brie­fing Frank­fur­ter All­ge­mei­ne Pro D:ECONOMY. Dar­in auch der „Prompt der Woche“ mit bis­her zwei Bei­trä­gen von mir:

  • So entlarvt eine KI zur Gesichtserkennung massenhafte Betrugsversuche

    So entlarvt eine KI zur Gesichtserkennung massenhafte Betrugsversuche

    Seit eini­gen Wochen ver­fol­gen mich asia­ti­sche Schön­hei­ten. Nicht die­se brüs­ken, dürf­tig beklei­de­ten Damen, die der Spam­fil­ter ohne­hin aus­sor­tiert. Die ver­meint­li­chen Damen sind stets züch­tig geklei­det und zumeist an die 20 Jah­re jün­ger. Sie schrei­ben mir auf Insta­gram und auf Whats­App per direk­ter Nach­richt sub­ti­le Bot­schaf­ten. „War­um wirst Du mir dau­ernd hier auf Ins­ta emp­foh­len?“, fragt eine Amra auf Eng­lisch. „Hal­lo, bist Du der Typ aus dem Busi­ness Mee­ting in Tam­pa?“, erkun­digt sich eine Cata­li­na aus Flo­ri­da. „Ich habe Dein Land­schafts­fo­to gese­hen, tol­les Bild!“, fin­det eine Lee aus London.

    Nun wer­den mei­ne direk­ten Nach­rich­ten auf Insta­gram in einem Ord­ner „Nach­rich­ten­an­fra­gen“ abge­legt, den ich sel­ten auf­su­che. Benach­rich­ti­gun­gen dazu sind aus, so herrsch­te lan­ge Zeit Ruhe im Kar­ton. Bei Whats­App wer­den sol­che Bot­schaf­ten nor­ma­ler­wei­se von mir gemel­det und die Absen­der blockiert.

    Doch neu­gie­rig, wie ich bin, bin ich dann doch mal auf die Anfra­gen auf Insta­gram zum Schein ein­ge­gan­gen. Wor­auf war die Masche aus?

    Quatschen mit Amra, Catalina und Lee

    So quatsch­te ich über Tage mit Amra, Cata­li­na und Lee, schnell kamen ein paar wei­te­re ver­meint­li­che Damen hin­zu, die mir zuletzt ihren Kon­takt ange­bo­ten hat­ten. Ich ent­deck­te wun­der­ba­re Lofts in Man­hat­tan und Restau­rants in Malay­sia, foto­gra­fiert wur­den edle Mahl­zei­ten und noch öfter das eige­ne Spiegelbild.

    Man ver­liert übri­gens schnell den Über­blick, wer von denen wel­chen Beruf hat und ob man schon gefragt hat, aus wel­cher Stadt sie kommt. Fragt man in so einem Chat ein zwei­tes Mal nach der Her­kunft, so deu­tet der Ton­fall der Ant­wort auf Ent­rüs­tung wegen des Man­gels an Auf­merk­sam­keit, für euch ausprobiert.

    Erstaun­li­cher­wei­se ver­füg­ten alle angeb­li­chen Damen aus­weis­lich ihrer Fotos über einen gewis­sen Reich­tum. Davon zeug­ten Bil­der tol­len Essens in teu­ren Restau­rants, Guc­ci- und Dior-Hand­ta­schen und ein Besuch auf der Fer­ra­ri-Mes­se in Abu Dha­bi. Sel­ten zeig­ten die Damen viel Haut, das wäre zu pro­fan. Höchs­tens mal etwas Fit­ness­stu­dio. Und so gut wie immer reagier­ten die Damen fast belei­digt, wenn man nicht sofort auf eine Nach­richt ant­wor­te­te, Zeit­zo­nen hin oder her.

    Schneller Wechsel von Instagram auf WhatsApp

    Erst ver­mu­te­te ich künst­li­che Intel­li­genz im Ein­satz – als ich bemerk­te, dass die Ant­wor­ten mei­ne Recht­schreib­feh­ler imi­tier­ten. Dann ver­quatsch­te sich eine der Angrei­fe­rin­nen und frag­te über­mü­tig, was ich denn eigent­lich dau­ernd mit ihren Freun­din­nen zu bespre­chen hät­te? Häu­fig woll­ten die Damen schnell auf Whats­App wech­seln, das wäre ja irgend­wie per­sön­li­cher. Nur auf mei­ne lis­ti­ge Fra­ge, ob wir mal tele­fo­nie­ren möch­ten, reagier­te kei­ne der Befrag­ten wie gewünscht.

    Zwei­mal lenk­ten die Gesprächs­part­ne­rin­nen das The­ma auf Kryp­to­wäh­run­gen, die eine frag­te rund­her­aus nach einer „klei­nen“ Inves­ti­ti­on von 500 Dol­lar, ihr Onkel sei Ban­ker und bekom­me häu­fi­ger mal einen guten Tipp; Sie wis­sen schon, der Short-Sel­ling-Han­del. Da glaub­te ich end­lich zu wis­sen, wor­auf die Angrei­fe­rin­nen letzt­lich aus waren. Doch erstaun­li­cher­wei­se waren die ande­ren Damen nicht an mei­nen Kryp­to­wäh­rungs­kennt­nis­sen inter­es­siert, als nun ich die Gesprä­che zum Test dar­auf zu len­ken versuchte.

    Alle zwölf Damen waren Fake

    Den wah­ren Grund für die mas­sen­haf­ten Kon­takt­an­bah­nun­gen habe ich am Ende nicht her­aus­ge­fun­den. Nur dass alle zwölf Damen Fake-Pro­fi­le waren und sind, das hat mir eine Maschi­ne der künst­li­chen Intel­li­genz (KI) bewie­sen: Bei face​check​.id kann man ein Por­trät einer Per­son hoch­la­den, der Dienst fin­det dann per Gesichts­er­ken­nung ähn­lich aus­se­hen­de Social-Media-Pro­fi­le dazu. Gesucht wird dabei nicht nach der iden­ti­schen Bild­da­tei wie bei Goog­le Bil­der, son­dern nach bio­me­tri­schen Merk­ma­len, die die KI in einer Daten­bank gespei­chert hat.

    Und sie­he da: Plötz­lich heißt die Guc­ci-Cata­li­na auch mal Jini und wohnt statt in Flo­ri­da in Los Ange­les; mit dem glei­chen Gesicht gibt es 17 Lin­ke­dIn- und zehn Twit­ter-Accounts mit unter­schied­li­chen Namen. Die Kryp­to­wäh­rungs-Amra ist mit dem­sel­ben Bild auf Twit­ter mal als Phyl­lis, Luca und Huang-Deng unter­wegs, gilt auch dort aus­weis­lich ihrer Posts als Fach­frau für Kryp­to­koh­le. Nur Kom­men­ta­re von Freun­din­nen oder Freun­den fin­det man dann sel­ten, Schön­heit macht wohl ein­sam. Den pro­mi­nen­tes­ten Chat erleb­te ich mit Erin, die auch schon mal Celia heißt und namens einer Mode­mar­ke aus Korea mit einem Account 103.000 Fol­lower zählt.

    Vertrauen erschleichen, Kompromat erlangen

    Was hat es letzt­lich mit sol­chem Scam, Betrug also, auf sich? Ich kann nur ver­mu­ten: Es geht dar­um, Ver­trau­en auf­zu­bau­en und zu erschlei­chen. Mög­li­cher­wei­se woll­te jemand irgend­wann kom­pro­mit­tie­ren­de Ant­wor­ten von mir pro­vo­zie­ren, um sie anschlie­ßend für eine Erpres­sung zu ver­wen­den. Der gesun­de Men­schen­ver­stand kann bei so viel Schön­hei­ten schließ­lich schon mal ver­lo­ren gehen.

    Dass es sich um eine kon­zer­tier­te Akti­on han­del­te, beweist ein ande­rer Umstand: Als ich zwei der Damen mit den gefun­de­nen wei­te­ren Social-Media-Pro­fi­len kon­fron­tier­te, reagier­te die eine zickig (oder bockig?), „Ich bin ich“, und die ande­re blo­ckier­te mich sofort. Fort­an reagier­te­für eine Wei­le die gan­ze Ban­de nicht mehr. Offen­bar waren die fal­schen Freun­din­nen auch unter­ein­an­der gut vernetzt.

    Persönlichkeitsrechte?

    Ob der Dienst Face​check​.id in Euro­pa zuläs­sig ist oder nach Ver­ab­schie­dung des euro­päi­schen KI-Acts noch ist, steht auf einem ande­ren Blatt. „Nur für Lern­zwe­cke“ schreibt der Betrei­ber Sen­ti­ent Labs aus Indo­ne­si­en. Man rühm­te sich zuletzt, 400.000 Fotos und Pro­fi­le von Hei­rats­schwind­lern und Lie­bes­be­trü­gern erfasst zu haben. Ins­ge­samt soll die Maschi­ne 550 Mil­lio­nen Bil­der ken­nen. Wie das mit dem Per­sön­lich­keits­recht oder dem Ver­wer­tungs­recht von Fotos ein­her­geht, ist schlei­er­haft. Und war­um es von Unter­neh­mens­chef Lee Chong offen­bar kein öffent­li­ches Bild gibt, wun­dert auch ein wenig. Eine Home­page der Fir­ma fand ich nicht.

    Eine weit grö­ße­re Gesich­ter­da­ten­bank namens Cle­ar­view AI mit 30 Mil­li­ar­den Bil­dern wur­de laut einem Bericht der „New York Times“ mitt­ler­wei­le in meh­re­ren euro­päi­schen Län­dern sowie in Kana­da und Aus­tra­li­en ver­bo­ten. Öffent­lich zugäng­lich ist der Dienst nicht, Straf­ver­fol­gungs­be­hör­den in den USA nut­zen ihn – unter ande­rem auch in Däne­mark, Finn­land und Frank­reich. Auch Inter­pol soll den Dienst 320-mal ein­ge­setzt haben. In Deutsch­land hat der Ham­bur­ger Daten­schutz­be­auf­trag­te den Dienst als Ver­stoß gegen die Daten­schutz­grund­ver­ord­nung ein­ge­schätzt. Ita­li­en ver­häng­te eine Geld­stra­ße von 20 Mil­lio­nen Euro. Zuletzt mach­te das Unter­neh­men mit einem Ein­satz im rus­si­schen Krieg in der Ukrai­ne von sich reden: Ukrai­ni­sche Mili­tärs iden­ti­fi­zier­ten damit Tote und rus­si­sche Überläufer.

    Gleiche Bilder, gleicher Film

    Gera­de hat wie­der eine unbe­kann­te Lin­da elf mei­ner Bil­der auf Insta­gram durch­ge­likt, es geht schon wie­der los. Ihre eige­nen Fotos deu­ten auf ein sor­gen­frei­es Leben. Komisch nur, die angeb­li­che Dame ähnelt laut Gesich­ter­ken­nungs-KI zum Ver­wech­seln dem Model Vero­ni­ka Cere­da aus Kiew. Und merk­wür­dig – bei der pro­mi­nen­te­ren, augen­schein­lich authen­ti­schen Dame mit Zehn­tau­sen­den Fans taucht das glei­che Bild auf einem Schim­mel rei­tend durchs Was­ser auf. Eine Auf­nah­me von Frau Sere­da aus Dubai im mint­grü­nen Kos­tüm mit wei­ßer Hand­ta­sche kann Lin­da eben­so vor­wei­sen. Und sogar das Video von ihr unter Was­ser mit blau­en Flos­sen gibt es in bei­den Profilen.

    Zufäl­le gibt’s.

    Wenn Sie die Fake-Ent­lar­vung ein­mal selbst aus­pro­bie­ren möch­ten: Ich fol­ge nun bis auf Wei­te­res meh­re­ren die­ser Fake-Damen auf Ins­ta. Mei­ne Fol­lo­wings sind öffent­lich. Und wun­dern Sie sich nicht über man­che Fol­lo­wings, die anders als die hier genann­ten Kon­ten nie­de­re Instink­te anspre­chen. Eine gewis­se Sarah Jor­dan ist ganz offen ein Fake mit sehr frei­zü­gi­gen Bil­dern. Der Account ist kom­plett KI-gene­riert. „Made in Australia“.

    Das Kon­to zählt 377.000 Follower.

    • Zum Schutz der rea­len Per­so­nen, deren Bil­der hier offen­sicht­lich für Betrugs­ver­su­che miss­braucht wer­den, habe ich in die­sem Bei­trag auf Screen­shots der von face​check​.id gefun­de­nen Fake-Pro­fi­le ver­zich­tet; statt­des­sen lud ich dort ein Bild von mir selbst hoch und ließ die Maschi­ne nach mei­nem Gesicht suchen.
  • Neue Maschinen unter der KI-Motorhaube

    Neue Maschinen unter der KI-Motorhaube

    Zum Bei­spiel Dan­te AI: Neben GPT‑4 von Ope­nAI und dem Vor­gän­ger­mo­dell GPT‑3.5‑Turbo kön­nen neu­er­dings auch das Open-Source-Modell Fal­con LLM und das Modell LlaMA 2 von Face­book-Anbie­ter Meta hin­ter­legt werden.

    Zum Bei­spiel Per­ple­xi­ty AI: Hier kann statt GPT‑4 von Ope­nAI wahl­wei­se auch das Modell Clau­de 2 oder ein eige­nes Modell von Per­ple­xi­ty ein­ge­rich­tet werden.

    Mal eben die Maschi­ne wech­seln: Bei Dan­te AI ste­hen mitt­ler­wei­le meh­re­re Sprach­mo­del­le zur Aus­wahl. (Screen­shot: Schwarze)

    Hin­zu kommt, dass GPT‑4 nach Beob­ach­tung von Fach­leu­ten zuletzt an Qua­li­tät ein­ge­büßt hat. So konn­ten Anwalts­kanz­lei­en vor vier, fünf Mona­ten der Maschi­ne durch­aus brauch­ba­re Vor­la­gen fürs rechts­kon­for­me Inter­net-Impres­sum oder eine Daten­schutz­er­klä­rung ent­lo­cken. Mitt­ler­wei­le pro­du­ziert GPT‑4 häu­fi­ger Müll.

    Auch mir erging es zuletzt häu­fi­ger so: Einst gut funk­tio­nie­ren­de Prompts fürs Zusam­men­fas­sen von Sach­ver­hal­ten in mei­nem, der Maschi­ne antrai­nier­ten Duk­tus las­sen nun häu­fi­ger Anfor­de­run­gen offen. Es half, auf GPT‑3.5 statt 4 zu wechseln.

    GPT‑4 mit nachlassender Qualität

    Die nach­las­sen­de Qua­li­tät von GPT‑4 bestä­tigt in Tei­len eine Stu­die der Uni­ver­si­tä­ten Stan­ford und Ber­ke­ley: In drei von vier getes­te­ten Fel­dern nahm die Leis­tung zwi­schen März und Juni ab. Konn­te die Maschi­ne im März noch 97,6 Pro­zent an Prim­zah­len erken­nen, waren es im Juni nur noch 2,4 Prozent.

    Die KI-Welt wird somit komplizierter.

    Nun könn­te man schluss­fol­gern, dass die Viel­zahl aus Gagafra­gen aus aller Welt bei GPT‑4 in den ver­gan­ge­nen Mona­ten für Ver­wir­rung und Durch­ein­an­der sorgt. Doch hat Open AI stets betont, dass die Chat­ver­läu­fe aus Daten­schutz­grün­den nicht in das Modell ein­flie­ßen. Wahr­schein­li­cher ist, dass die Macher ihr Modell wei­ter­ent­wi­ckeln und vor allem Rechen­zeit pro Anfra­ge ein­spa­ren – nicht immer zum Besten.

    Wie einst in der Schrau­ber­sze­ne für Autos tunen heu­te Enthu­si­as­ten ihre zusam­men­ge­klick­ten KI-Maschi­nen, bau­en etwa ein ande­res Sprach­mo­dell als GPT‑4 als neu­en Motor ein. Wie sich die Moto­ren unter­schei­den, erschließt sich bei den merk­wür­di­gen Namen wie LlaMA und Fal­con aller­dings nur Spe­zia­lis­ten. Schrau­ben dann zusätz­lich die Macher von GPT‑4 im Hin­ter­grund an den Para­me­tern, ist guter Rat teu­er: War­um schwankt die Qua­li­tät der Antworten?

    Die Inge­nieu­re bei Ope­nAI hal­ten sich mit Ant­wor­ten dazu eher zurück. Doch scheint der Markt sich neu zu ori­en­tie­ren: Der Traf­fic auf der Web­sei­te ope​nai​.com ging laut Simi­lar­web von Mai (1,9 Mil­li­ar­den Visits) bis Juli (1,5 Mil­li­ar­den) deut­lich zurück.

    Wer will, baut sich viel­leicht lie­ber auf dem eige­nen Rech­ner eine eige­ne KI nach, dafür gibt es die Anwen­dung GPT4All. Auch hier kön­nen GPT‑4 und 3.5, aber auch LlaMA 2 und ande­re Model­le hin­ter­legt werden.

    Wer sind Sie und was wollen Sie?

    Hin­zu kom­men bei den kom­mer­zi­el­len Diens­ten Per­ple­xi­ty und Dan­te AI vor­zu­ge­ben­de Ran­dum­stän­de, an denen sich die jewei­li­gen KIs ori­en­tie­ren sol­len. Beim her­kömm­li­chen GPT‑4 füllt man dafür zwei Fel­der aus, in denen man zunächst die eige­ne Rol­le („Ich bin CEO und brau­che kla­re, poin­tier­te Ant­wor­ten, auch Hin­wei­se auf mög­li­che feh­ler­haf­te Ent­schei­dun­gen“) und dann die Wün­sche an die Ant­wor­ten for­mu­liert („Genaue Ant­wor­ten, erfin­de nichts“).

    Bei Per­ple­xi­ty soll man ein­ma­lig ein­stel­len, wer man ist, wo man hin­will, was man sonst so macht. (Screen­shot: Schwarze)

    Bei Per­ple­xi­ty AI wird das aus­führ­li­cher. Die Maschi­ne möch­te Infos über den eige­nen Stand­ort, in wel­cher Spra­che zu ant­wor­ten ist, eige­ne Hob­bys und Inter­es­sen, den Beruf und künf­ti­ge Ziele.

    Per­ple­xi­ty gibt dadurch genaue­re Ant­wor­ten, die auf den Fra­gen­den bes­ser abge­stimmt sind. Hin­zu­schalt­bar ist außer­dem ein „Copi­lot“: Dann ant­wor­tet Per­ple­xi­ty nicht ein­fach drauf­los, son­dern stellt durch­aus intel­li­gen­te Ver­ständ­nis­fra­gen. Oder schaut im Inter­net nach.

    Das Nut­zer­inter­face ist dabei gewöh­nungs­be­dürf­tig. So wird fürs Zusam­men­fas­sen eines län­ge­ren Tex­tes zurück­ge­fragt, wel­chen the­ma­ti­schen Schwer­punkt die Zusam­men­fas­sung haben soll – und macht auch gleich kom­ma­se­pa­rier­te Vor­schlä­ge. Will man dann zwei, drei Schwer­punk­te aus­wäh­len, ver­schwin­den sie beim Ankli­cken und müs­sen manu­ell ein­ge­tippt wer­den – lästig.

    Die Maschine schaut selbst im Internet nach

    Inter­es­sant ist Per­ple­xi­ty aber auch des­halb, weil es von Haus aus Inter­net­re­cher­chen zum Beant­wor­ten anstel­len kann. Die Quel­len wer­den ange­ge­ben. Auch ist es mög­lich, eine Datei hoch­zu­la­den und gezielt Fra­gen dazu zu beant­wor­ten. „Wor­um geht es in dem Video?“ – die Fra­ge samt benann­ter You­Tube-Adres­se bringt die Maschi­ne zu einer ordent­li­chen Zusam­men­fas­sung; wenn­gleich sie auch Din­ge aus ande­ren Quel­len hin­ein­mengt, dies aber meist trans­pa­rent macht.

    Per­ple­xi­ty kos­tet wie GPT‑4 20 Dol­lar im Monat. Vor­ein­ge­stellt ist die Nut­zung der eige­nen Chat­ver­läu­fe durch das Unter­neh­men dahin­ter, um das Per­ple­xi­ty-Sprach­mo­dell zu ver­bes­sern. Das kann man abschalten.

    Ins­ge­samt bie­tet Per­ple­xi­ty über GPT‑4 hin­aus­ge­hen­de Funk­tio­nen wie die Alter­na­ti­ve Clau­de 2 als Sprach­mo­dell, das viel län­ge­re Prompts erlaubt, und die schnel­le Live-Suche auf Inter­net­sei­ten. Beim alten GPT‑4 gelingt Ver­gleich­ba­res nur mit Plugins.

    A car in a workshop with its hood open. A female child as a mechanic stands in front of it, tool in hand, she looks into the car's motor, in the process of replacing the conventional engine with a futuristic AI unit. Medium: Photography. Style: Style: Hyper-realism, inspired by the work of Robert Bechtle. Lighting: Natural light filtering through the garage windows. Colors: Earth tones, grays, and metallic hues. Composition: Nikon D850, Nikkor 85mm f/1.4G lens, Resolution 45.7 megapixels, ISO sensitivity: 25,600, Shutter speed 1/200 second.
    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze. Prompt: sie­he Alt-Text.

    Sind Per­ple­xi­ty und Dan­te damit Aspi­ran­ten auf die Nach­fol­ge oder Wach­ab­lö­sung von GPT‑4? Nein, dazu feh­len ihnen weit­ge­hend die eige­nen Trai­nings­da­ten. Doch ist der simp­le Aus­tausch des Motors auch von frem­den Anbie­tern unter der Hau­be etwas, das ChatGPT nicht bie­tet. Und dann ist auch noch die Funk­ti­on „Advan­ced Data Ana­ly­sis“ bei GPT‑4, die das Hoch­la­den eige­ner Doku­men­te erlaubt.

    Der Markt wird unübersichtlich

    Die Funk­tio­na­li­tä­ten der KIs wer­den wei­ter rasant erwei­tert. Der Markt wird für Lai­en zuse­hends unüber­sicht­lich. Rund 7.500 KI-Diens­te ver­sam­melt die „Über­sicht“ namens There’s an AI for that. Was da jeweils unter der Motor­hau­be steckt und Erfolg hat, muss der Markt sich­ten und richten.

    Und da haben wir bis­her nicht über wei­ter­hin agie­ren­de gro­ße alter­na­ti­ve Diens­te wie von Goog­le („Bart“ und „Duet AI“) und der angeb­li­chen euro­päi­schen Alter­na­ti­ve Aleph Alpha aus Hei­del­berg gespro­chen. Für Duet AI habe ich mei­ne Frei­schal­tung zum Tes­ten bean­tragt, bei Aleph Alpha befand ich die Ant­wort­qua­li­tät nach einem Test auf deren Spiel­wie­se nicht kon­kur­renz­fä­hig. Die Ansprü­che steigen.

  • Die 20 besten Tipps und Tricks für kluges Prompten

    Die 20 besten Tipps und Tricks für kluges Prompten

    Die fol­gen­den Bei­spie­le sind im Zusam­men­spiel mit der künst­li­chen Intel­li­genz GPT‑4 ent­stan­den. Sie ver­an­schau­li­chen, wie man mit der KI zu akzep­ta­blen Ergeb­nis­sen kommt. Es gilt die alte Regel, die KI wie einen 14-jäh­ri­gen Prak­ti­kan­ten anzu­wei­sen: sehr genau und aus­führ­lich, klar und struk­tu­riert. Im Detail gibt es dafür ver­schie­de­ne Methoden.

    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze.

    1. Rollenbasiertes Prompting

    Beim rol­len­ba­sier­ten Promp­ting wird das Modell auf­ge­for­dert, eine bestimm­te Rol­le oder Per­spek­ti­ve wäh­rend der Inter­ak­ti­on ein­zu­neh­men. Es liegt nahe, der Maschi­ne mit dem Befehl „Rol­le:“ klar­zu­ma­chen, was ihre Rol­le ist.

    Beispiele

    Rolle: Hausarzt. Was empfiehlst Du bei einer Erkältung?
    Rolle: Astronom im 17. Jahrhundert. Beschreibe Deine Beobachtungen des Himmels und Deine Methoden zur Kartierung der Sterne, wie sie zur Zeit von Galileo Galilei verwendet wurden.
    Rolle: Fünfjähriges Kind. Erkläre mir die Funktion eines Automotors.
    Versetz Dich in die Rolle eines peniblen Journalisten. Fasse mir folgenden Text in seinen Worten zusammen. Verwende dabei eine einfache Sprache und einfache Sätze. Schreibe journalistisch und neutral. Erkläre Abkürzungen. Mach den Text mit typografisch korrekten Anführungszeichen. Schreib einen Absatz mit maximal sechs Sätzen. Verwende wenn möglich plastische Beispiele. Gendere Jobs in der Form „Schülerinnen und Schüler“ oder wähle bevorzugt eine neutrale Form wie „Lehrkräfte“. Wenn mehrere Jobs hintereinanderstehen, nenne abwechselnd die weibliche und die männliche Form. Vermeide die Form „wir“ und „unsere“. Erfinde nichts hinzu und sei sehr genau. Halte Dich genau an die Länge. Ein Absatz, insgesamt sechs Sätze. Hier der Text: [Pressemitteilung hier einfügen]

    Der letz­te Prompt ist über die Mona­te gereift und hat beim Erstel­len eines News­let­ters gute Diens­te geleis­tet. Aller­dings hat sich GPT‑4 zwi­schen­zeit­lich gewan­delt, sodass die Maschi­ne neu­er­dings Din­ge hin­zu­dich­te­te oder sich nicht an die gewünsch­te Form des Gen­derns hielt. Zeit­wei­se bin ich daher zu Chat-GPT 3.5 zurück­ge­kehrt – der älte­re Dienst scheint sich enger an die Prompt-Vor­ga­ben zu halten.

    Ein wei­te­rer Dienst namens Prompt­per­fect aus Ber­lin emp­fahl, den Prompt wie folgt umzu­for­mu­lie­ren und wei­ter zu ver­kla­ren. Der Prompt wird deut­lich län­ger. Die Wand­lung ins Sie­zen gehe ich noch mit, bei Punkt 4 habe ich den Prompt aber noch ein­mal nachgeschärft:

    Sie sind als penibler und unparteiischer Journalist dazu aufgefordert, einen gegebenen Text zu interpretieren und in einer klaren Zusammenfassung von sechs Sätzen wiederzugeben. Ihr Ziel ist es, die Kerninformationen des Originaltextes so einfach wie möglich zusammenzufassen, unter Einbeziehung folgender Anforderungen: 1. Verschachtelte Aussagen oder komplexe Informationen sollten durch einfache, leicht verständliche Formulierungen dargestellt werden. 2. Behalten Sie eine neutrale Blickrichtung bei und gewährleisten Sie jedwede Genauigkeit entsprechend der journalistischen Ethik.3. Wird im zugrundeliegenden Text eine Abkürzung verwendet, sollte diese in Ihrer Erklärung ausgeschrieben und erläutert werden um Irrtümer zu meiden. 4. Stellen Sie sicher, dass alle Zitate den Regeln der deutschen Rechtschreibung entsprechen. Verwenden Sie typographisch korrekte Anführungszeichen.5. Um das Verstehen komplexer Sachverhalte zu fördern, sollten passende und nachvollziehbare Beispiele eingeführt werden.  6. Berufsbezeichnungen sollten so formuliert sein, dass sie geschlechtergerecht sind. Nutzen Sie entweder Geschlechtsneutrale Begriffe oder wechseln Sie zwischen männlicher und weiblicher Form, wenn mehrere Positionen aufgelistet werden. 7. Persönliche Pronomen wie 'wir' und possessive Adjektive wie 'unsere' sollten vermieden werden. 8. Fügen Sie keine fiktionalen Informationen hinzu und stellen Sie sicher, dass sämtliche Punkte korrekt und belegbar sind. Nun folgt der zu bearbeitende Text: [Pressemitteilung hier einfügen]

    Es emp­fiehlt sich, sei­ne Prompts als Noti­zen zu spei­chern, zum Wiederverwenden.

    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze.

    2. One-Shot-Prompting

    Das One-Shot-Promp­ting erfor­dert, dass alle not­wen­di­gen Infor­ma­tio­nen in einem ein­zi­gen, detail­lier­ten Prompt prä­sen­tiert wer­den, um die gewünsch­te Ant­wort zu erhalten.

    Beispiele

    Du als Informatiker, erkläre mir die Grundlagen von HTML.
    Du als Historiker, der auf das Mittelalter spezialisiert ist, schildere mir die gesellschaftlichen Strukturen, die Hauptereignisse und die Bedeutung des Schwarzen Todes in Europa.
    Du als Botaniker, der nie einen Baum gesehen hat, beschreibe mir, wie Bäume Fotosynthese betreiben.  

    Man soll­te nicht davor zurück­schre­cken, der Maschi­ne sehr genau ihre Auf­ga­be vor­zu­ge­ben. Eine kla­re Struk­tu­rie­rung hilft.

    Ich arbeite an einem Forschungsprojekt, das sich mit der Analyse von sozioökonomischen Faktoren in verschiedenen Ländern beschäftigt. Insbesondere konzentriere ich mich auf die Auswirkungen von Bildung, Gesundheitsversorgung, Arbeitslosigkeit und politischer Stabilität auf das Wirtschaftswachstum.1. Bildung: Wie beeinflusst das Bildungsniveau die Arbeitsmarktfähigkeiten und die Innovationsfähigkeit eines Landes? Welche Rolle spielen öffentliche und private Investitionen in die Bildung?2. Gesundheitsversorgung: Wie wirkt sich die Qualität der Gesundheitsversorgung auf die Lebenserwartung und die Arbeitsproduktivität aus? Welche Unterschiede gibt es zwischen Ländern mit universeller Gesundheitsversorgung und solchen ohne?3. Arbeitslosigkeit: Welche Faktoren tragen zur Arbeitslosigkeit bei, und wie beeinflusst sie das Wirtschaftswachstum? Wie wirken sich verschiedene Arbeitsmarktpolitiken auf die Arbeitslosenrate aus?4. Politische Stabilität: Wie beeinflusst die politische Stabilität oder Instabilität das Investitionsklima und das Vertrauen der Verbraucher? Welche Rolle spielen Regierungsführung und Korruption?Bitte gib eine detaillierte Analyse dieser Themen, unterstützt durch Beispiele und Statistiken, wenn möglich. Deine Einsichten werden mir helfen, meine Forschung zu bereichern und ein umfassendes Verständnis der Thematik zu entwickeln.

    Die Struk­tur kann man eben­falls von der Maschi­ne vor­schla­gen lassen:

    Ich will ein Buch über Bezahlschranken für Web-Publikationen im deutschsprachigen Markt veröffentlichen. Erstell mir ein ausführliches Inhaltsverzeichnis. Sieh darin auch Beispiele von „Spiegel“, FAZ, Blendle und der Stiftung Warentest vor. Zielgruppe des Buches sind Geschäftsführer und Chefredakteurinnen von Zeitungsverlagen. Schreib nach dem Inhaltsverzeichnis das erste Kapitel.

    Ergeb­nis des letz­ten Prompts war ein durch­aus brauch­ba­res Inhalts­ver­zeich­nis als Ent­wurf. Mit einem etwas anders for­mu­lier­ten Prompt ließ ich mir dar­über hin­aus ein noch aus­führ­li­ches Inhalts­ver­zeich­nis und die ers­ten drei Kapi­tel schreiben.

    So ent­ste­hen heu­te Bücher.

    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze.

    3. Chained Prompting (Kettenprompting)

    Chai­ned Promp­ting ver­wen­det eine Serie von zusam­men­hän­gen­den Prompts, um ein The­ma schritt­wei­se zu erfor­schen oder kom­ple­xe Fra­gen in über­schau­ba­re Tei­le zu zerlegen.

    Beispiel 1

    Was ist Photosynthese?
    Wo findet sie statt?

    Beispiel 2

    Was sind die Grundlagen der Quantenphysik?
    Wie wird sie in der Technologie angewendet? 
    Was sind die ethischen Überlegungen dabei?

    Beispiel 3

    Was trägt ein Pinguin normalerweise?
    Wie würde ein Pinguin in einem Anzug aussehen? 

    Zusam­men mit dem Plug­in „Pho­to­rea­li­stic“ erzeugt GPT‑4 zwei neue Prompts als Bei­spiel, die in der Bil­der-KI Mid­jour­ney wei­ter­ver­ar­bei­tet wer­den kön­nen. Eines der Ergeb­nis­se (bei dem aller­dings der Anzug ver­lo­ren ging):

    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze.

    Beispiel 4

    Was sind die Hauptzutaten für einen Schokoladenkuchen?
    Welche Mengen von diesen Zutaten werden für einen Schokoladenkuchen benötigt?
    Wie bereite ich die trockenen Zutaten für den Schokoladenkuchen vor?
    Wie bereite ich die feuchten Zutaten für den Schokoladenkuchen vor?
    Wie kombiniere ich die trockenen und feuchten Zutaten und backe den Kuchen?

    Beispiel 5

    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze.
    Was ist die Schrödinger-Gleichung?
    Erkläre sie mir, als wäre ich ein Zehnjähriger.
    Wie würde man die Formeln aussprechen?
    Gib mir die beiden Formeln so zum Herauskopieren, damit ich sie in einem  Newsletter einfügen kann. 
    Mein Newsletter kann kein Latex. Was sind die Alternativen?
    Gib mir das in HTML. 

    4. Temperatur- und Top-K-Steuerung

    Die Steue­rung von Tem­pe­ra­tur und Top‑K in einem Modell beein­flusst die Viel­falt der Ant­wor­ten. Nied­ri­ge­re Tem­pe­ra­tu­ren resul­tie­ren in vor­her­seh­ba­re­ren Ant­wor­ten, höhe­re Tem­pe­ra­tu­ren för­dern Kreativität.

    Beispiele

    Temperatur 0.2. Wie hoch ist der Eiffelturm? 

    Ant­wort: „Mit einer Tem­pe­ra­tur von 0,2, die eine kon­ser­va­ti­ve­re und genaue­re Ant­wort för­dert, ist die Ant­wort auf die Fra­ge: Der Eif­fel­turm ist 324 Meter hoch ein­schließ­lich Anten­nen an der Spit­ze. Ohne Anten­nen misst er etwa 300 Meter.“

    Temperatur 1.0. Wie hoch ist der Eiffelturm? 

    Ant­wort: „Der Eif­fel­turm, die­ses iko­ni­sche Meis­ter­werk der Inge­nieurs­kunst, ragt stolz 324 Meter in den Pari­ser Him­mel, wenn man die Anten­nen an der Spit­ze mit­zählt. Ohne die Anten­nen beträgt die Höhe etwa 300 Meter, was ihn zu einem beein­dru­cken­den Wahr­zei­chen der fran­zö­si­schen Haupt­stadt macht.“

    Temperatur 0.7, Prompt: Entwirf ein futuristisches Verkehrssystem unter Berücksichtigung von Nachhaltigkeit und Technologie.
    Temperatur 1.0, Prompt: Wie würde ein Gedicht klingen, das von einem Roboter geschrieben wurde, der nur wissenschaftliche Begriffe verwendet?
    Top-K 20. Was macht einen guten Roman aus? 

    Ant­wort: „Ein guter Roman hat inter­es­san­te Cha­rak­te­re und eine span­nen­de Handlung.“

    Top-K 100. Was macht einen guten Roman aus? 

    Ant­wort: „Ein guter Roman kom­bi­niert über­zeu­gen­de Cha­rak­te­re, einen fes­seln­den Hand­lungs­ver­lauf, leben­di­ge Beschrei­bun­gen, the­ma­ti­sche Tie­fe und einen ein­zig­ar­ti­gen Schreibstil.“

    Mit Top‑K 100 wird die Ant­wort viel­fäl­ti­ger und detail­lier­ter, da eine brei­te­re Palet­te von Wör­tern zur Aus­wahl steht.

    Top-K 500. Entwirf ein Menü für ein futuristisches Restaurant. 

    Ant­wort: „In einem futu­ris­ti­schen Restau­rant könn­ten Gerich­te wie mole­ku­la­re Gas­tro­no­mie-Sala­te, 3D-gedruck­te Haupt­ge­rich­te mit kul­ti­vier­tem Fleisch, Nano-infun­dier­te Des­serts und Robo­ter­mi­xer-Cock­tails ser­viert werden.“

    Mit einem Top‑K von 500 hät­te die Ant­wort eine gro­ße Viel­falt und Krea­ti­vi­tät, da vie­le unkon­ven­tio­nel­le und inno­va­ti­ve Ideen ein­flie­ßen könnten.

    Top-K 500. Temperatur 0,1. Entwirf ein Menü für ein futuristisches Restaurant. 

    Mit einem Top‑K von 500 und einer sehr nied­ri­gen Tem­pe­ra­tur von 0,1 wür­de das Modell eher kon­ser­va­ti­ve und gebräuch­li­che Wör­ter und Phra­sen wäh­len, auch wenn es eine brei­te Palet­te von Optio­nen in Betracht zieht.

    „Hier ist ein Bei­spiel für ein Menü für ein futu­ris­ti­sches Restau­rant unter die­sen Bedingungen:


    Futuristisches Restaurant-Menü 1

    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze.
    Vorspeisen
    • Kalt­ge­press­ter, hydrier­ter Gemüsesaft
    • Mole­ku­la­rer Algen­sa­lat mit Kavi­ar aus dem Labor
    • 3D-gedruck­te Gemüsesuppe
    Hauptgerichte:
    • Sous-vide-gekoch­tes, kul­ti­vier­tes Rind­fleisch mit aero­po­nisch ange­bau­tem Gemüse
    • Pflan­zen­ba­sier­te, nach­hal­ti­ge Meeresfrüchte-Paella
    • Vega­ne „Hühnchen“-Kroketten aus zell­ba­sier­tem Protein
    Beilagen
    • Nano­tech­no­lo­gie-geschich­te­ter Reis
    • Zero­pol­lu­ti­on luft­ge­zo­ge­ner Salat
    • Ener­ge­tisch opti­mier­te Quinoa
    Desserts
    • Syn­the­ti­sche Scho­ko­la­den­tor­te mit ess­ba­ren Lasern
    • Vir­tu­ell aro­ma­ti­sier­tes Eis
    • Son­nen­be­trie­be­ne Fruchtkompotts
    Getränke
    • Selbst­rei­ni­gen­de, gefil­ter­te Wasseroptionen
    • Solar­be­trie­be­ne Smoothies
    • Bio­re­ak­tor-Erfri­schun­gen mit per­so­na­li­sier­ten Vitaminen“

    Das Menü ist zwar futu­ris­tisch, aber die Aus­wahl eines nied­ri­gen Tem­pe­ra­tur­werts von 0,1 wür­de dazu füh­ren, dass es eher kon­ven­tio­nell und rea­lis­tisch bleibt, auch wenn ein Top‑K von 500 eine brei­te Palet­te von Optio­nen zulässt.

    Top-K 500. Temperatur 1,0. Entwirf ein Menü für ein futuristisches Restaurant. 

    Ant­wort: „Mit einem Top‑K von 500 und einer Tem­pe­ra­tur von 1,0 wird das Modell eine viel krea­ti­ve­re und viel­fäl­ti­ge­re Ant­wort gene­rie­ren, da die­se Ein­stel­lun­gen eine brei­te Aus­wahl von Wör­tern ermög­li­chen und die Wahr­schein­lich­keit erhö­hen, unge­wöhn­li­che oder uner­war­te­te Optio­nen zu wäh­len. Hier ist ein Bei­spiel für ein Menü für ein futu­ris­ti­sches Restau­rant unter die­sen Bedingungen:


    Futuristisches Restaurant-Menü 2

    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze.
    Vorspeisen
    • Schwe­ben­der Gemü­se­sa­lat in Anti-Gravitations-Dressing
    • Zeit­rei­se-Tapas: Geschmacks­pro­fi­le aus ver­schie­de­nen Jahrhunderten
    • Tele­pa­thi­sche Sup­pe: Passt den Geschmack an Ihre Gedan­ken an
    Hauptgerichte
    • Holo­gra­phi­sches Sushi: Fisch, der sich nach Ihren Wün­schen formt
    • Quan­tum-Bur­ger: Gleich­zei­tig flei­schig und vegan
    • Inter­stel­la­res Gour­met-Mars­me­nü mit Meteoriten-Kräutern
    Beilagen
    • 4D-geba­cke­ne Bröt­chen: Ver­än­dern die Tex­tur mit jedem Bissen
    • Vir­tu­el­le Gemü­se­fel­der: Ern­ten Sie Ihr eige­nes Gemü­se am Tisch
    • Emo­tio­na­les Brot: Nimmt die Stim­mung Ihres Gesprächs auf
    Desserts
    • Unmög­li­che Tor­te: Schmeckt nach allem und nichts zugleich
    • Dunk­le-Mate­rie-Eis­creme: Ein Geschmack, der noch nie erlebt wurde
    • Gedan­ken­zu­cker­wat­te: Süß, wie Sie es sich vorstellen
    Getränke
    • Stim­mungs­cock­tails: Ver­än­dert die Far­be und den Geschmack mit Ihrer Stimmung
    • Galak­ti­sche Wein­aus­wahl: Von weit ent­fern­ten Ster­nen­sys­te­men geerntet
    • Hydra­ti­ons­ne­bel: Trin­ken Sie, indem Sie ein­fach einatmen

    Die Tem­pe­ra­tur von 1,0 ermu­tigt das Modell, abs­trak­te und unge­wöhn­li­che Ideen zu erkun­den, und die hohe Top-K-Ein­stel­lung ermög­licht eine brei­te Aus­wahl an Mög­lich­kei­ten, wodurch ein ein­zig­ar­ti­ges und wirk­lich futu­ris­ti­sches Menü entsteht.

    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze.

    5. Ankertext verwenden und Stil kopieren

    Ein Anker­text wird zu Beginn des Prompts ver­wen­det, um ein Bei­spiel für die gewünsch­te Ant­wort zu geben. Dies hilft, das Modell in die rich­ti­ge Rich­tung zu lenken.

    Beispiele

    Ankertext: „Es war einmal in einem Land weit, weit weg, wo Könige und Königinnen regierten, und das Volk nach Gerechtigkeit dürstete.“ Beschreibe die Französische Revolution im Stil des obigen Ankertextes.
    Ankertext: „Post von Wagner. Liebe Bundestrainerin Voss-Tecklenburg, [Beispiel-Text von Bild-Kolumnist Franz Josef Wagner]“ Schreib im Stil von diesem Ankertext eine neue Kolumne, nachdem die Frauen nun nach zumeist schlechter Leistung bei der WM bereits in der Vorrunde ausgeschieden sind.

    Das Ergeb­nis des letz­ten Prompts lesen Sie hier. Man mag von Wag­ner hal­ten, was man will – doch wird sein Stil hier­mit unsterblich.

    Mit der Metho­de kann man der Maschi­ne sei­nen per­sön­li­chen Schreib­stil bei­brin­gen. Man kip­pe nach obi­gem Mus­ter einen eige­nen gelun­ge­nen Text in den Prompt – und bit­te die Maschi­ne anschlie­ßend dar­um, im Stil die­ses Anker­tex­tes einen neu­en Bei­trag zu einem neu­en The­ma zu ver­fas­sen. Das neue The­ma umreißt man dazu mit ein paar Stich­wör­tern und Fakten.

    6. Aufteilung komplexer Fragen

    Die­se Tech­nik zer­legt kom­ple­xe Fra­gen in klei­ne­re, über­schau­ba­re Tei­le und fragt sie ein­zeln. Dadurch wird eine kla­re und detail­lier­te Ant­wort ermöglicht.

    Beispiel 1

    Was ist ein Auto?
    Wie funktioniert der Motor?

    Beispiel 2

    Was ist die Europäische Union?
    Wie funktionieren ihre Institutionen?
    Was sind die Vor- und Nachteile ihrer Politik?

    Beispiel 3

    Was ist ein Einhorn?
    Wie würden sie sich in der echten Welt ernähren?

    7. Rückmeldung und Iteration

    Die­se Tech­nik ermög­licht eine ite­ra­ti­ve Inter­ak­ti­on mit dem Modell, indem sie auf vor­he­ri­ge Ant­wor­ten auf­baut und um Klä­rung oder Wei­ter­ent­wick­lung bittet.

    Beispiel 1

    Beim rol­len­ba­sier­ten Promp­ten unter Kapi­tel 1 haben wir eine Pres­se­mit­tei­lung zusam­men­fas­sen las­sen. Macht man das mit drei Pres­se­mit­tei­lun­gen in der­sel­ben Sit­zung, kennt die Maschi­ne nun die drei The­men – und ver­ar­bei­tet fol­gen­de Prompts anschlie­ßend geschmeidig:

    Mache drei Vorschläge für eine Überschrift für jeden Text. Sie soll maximal acht Wörter enthalten. Achte darauf, dass in der Überschrift Verben verwendet werden und keine Ausrufezeichen. Mache außerdem für jeden Text drei Vorschläge für eine Bebilderung zum Thema.
    Erstelle eine Tabelle mit den Spalten: Stichwort, Facebook-Beitrag, Tweet, LinkedIn-Beitrag. basierend auf den Texten. Verwende Emojis bei Plattformen, auf denen es passt und üblich ist. Duze die Leser nicht. Sprich die Leser nicht direkt an. Kling seriös und neutral, nicht werbend. Verwende Emojis auf Plattformen, auf denen es passt. Mach am Ende jedes Beitrags in Klammern einen Hinweis auf die beste Sendezeit (Wochentag und Uhrzeit), um möglichst viele Leser auf der Plattform zu erreichen. Zeig mir die Tabelle.
    Mein CvD will alle Social-Media-Veröffentlichungen vor Veröffentlichung abnicken. Gib mir die Tabelle als .csv-Datei.

    Beispiel 2

    Erkläre die Theorie der Relativität.
    Wie hat sie die Physik beeinflusst?
    Gibt es Kritik oder alternative Theorien?

    Beispiel 3

    Was ist der Sinn des Lebens?
    Wie sind Philosophen zu verschiedenen Antworten auf diese Frage gekommen?

    8. Stufenweise Detailanforderung

    Beginnt mit einer all­ge­mei­nen Fra­ge und for­dert schritt­wei­se detail­lier­te­re Infor­ma­tio­nen an, basie­rend auf den vor­he­ri­gen Antworten.

    Beispiel 1

    Was ist ein Planet?
    Erzähle mir mehr über die Erde.

    Beispiel 2

    Was ist Kunst?
    Wie hat sich die Malerei entwickelt?
    Erkläre die Bedeutung des Impressionismus.

    Beispiel 3

    Was ist ein Traum?
    Können Tiere träumen?
    Wie würden Außerirdische träumen?

    9. Kontextbezogene Hinweise verwenden

    Fügt dem Prompt spe­zi­fi­sche Hin­wei­se oder Anwei­sun­gen hin­zu, um die Ant­wort zu steuern.

    Beispiele

    Erkläre mir den Wasserkreislauf, aber in einfachen Worten.
    Beschreibe die Entstehung der Demokratie in Athen und vergleiche sie mit der modernen Demokratie, unter Verwendung von Beispielen aus der Politikwissenschaft.
    Erkläre die Quantenmechanik in Form eines Märchens.

    10. Prompt Engineering mit Multimodalität

    Ver­wen­det sowohl Text als auch ande­re Daten­ty­pen wie Bil­der oder Töne, um mul­ti­di­men­sio­na­le Fra­gen zu stel­len. Hier­für sind bei ChatGPT Plug­ins nötig. Die kann man sich in einem neu­en Chat durch Klick auf GPT‑4 und der Aus­wahl von „Plug­ins“ auf­ru­fen. Es kön­nen maxi­mal drei Plug­ins akti­viert wer­den. Am Ende der Plug­in-Lis­te gelangt man in einen Plug­in-Store, wo sich wei­te­re Ange­bo­te fin­den. Wie die Plug­ins zu bedie­nen sind, erschließt sich dar­aus noch nicht – doch unter­nimmt GPT‑4 aus dem Kon­text her­aus einen Ver­such, sobald die Maschi­ne meint, für eine bestimm­te Ant­wort wäre ein bestimm­tes Plug­in geeignet.

    Beispiele

    Prompt gegen­über GPT‑4 mit Plug­in Pixellow:

    Gib mir eine Bildschreibung für das Bild [Bildadresse im Web]. 
    Screen­shot: Schwarze.

    Ant­wort der KI: „Das Bild zeigt einen Mann mit Kra­wat­te und einem wei­ßen Hemd.“

    Hier ist ein Bild eines Hundes. Welche Rasse könnte es sein?
    Hier ist eine Aufnahme einer Symphonie. Analysiere die verwendeten Instrumente und den Musikstil.
    Hier ist ein abstraktes Kunstwerk. Erzähle mir eine Geschichte, die dieses Bild repräsentieren könnte.

    Die letz­ten drei Prompts funk­tio­nie­ren nicht ohne Wei­te­res bei GPT‑4. Nötig sind dafür Plug­ins – oder ande­re KIs, die ich bis­her nur teil­wei­se unter­sucht habe. Eine gute Anlauf­stel­le fürs Auf­fin­den von KIs, die dafür infra­ge kom­men, ist die Web­site The­res an AI for that.

    11. Negative und Positive Constraints

    Die­se Tech­nik ver­wen­det spe­zi­fi­sche Anwei­sun­gen, um ein­zu­schrän­ken, was die Ant­wort ein­schlie­ßen oder aus­schlie­ßen soll. „Cons­traints“ sind über­setzt Ein­schrän­kun­gen oder Begrenzungen.

    Beispiele

    Erkläre mir den Wasserkreislauf, aber ohne den Regen zu erwähnen.
    Beschreibe das Gemälde „Mona Lisa“, aber gib keine subjektiven Meinungen oder Interpretationen ab.
    Erzähle mir eine Geschichte über einen König, aber ohne eine Burg oder Ritter zu erwähnen.
    Beschreibe das Bild „New York City 1“ von Piet Mondrian. Dann hänge es anders herum auf. Beschreibe das Bild erneut.

    12. Interaktive Storytelling-Techniken

    Die­se Tech­nik ver­wen­det nar­ra­ti­ve Ele­men­te oder Rol­len­spiel, um die Inter­ak­ti­on anspre­chen­der und kon­tex­tua­li­sier­ter zu gestalten.

    Beispiele

    Du bist ein Detektiv im viktorianischen London. Wie würdest du einen Juwelendiebstahl untersuchen?
    Du bist ein Entdecker auf einem fremden Planeten. Beschreibe deine Entdeckungen, die Flora, Fauna und mögliche Lebensformen.
    Du bist eine sprechende Katze in einer magischen Welt. Erkläre mir die Gesetze der Physik.

    Das letz­te Bei­spiel beweist: Maschi­nen ent­wi­ckeln Humor.

    13. Hypothesen testen

    For­mu­liert spe­zi­fi­sche Hypo­the­sen und fragt das Modell, die­se zu über­prü­fen oder zu widerlegen.

    Beispiele

    Die Erde ist flach. Überprüfe diese Aussage.
    Hypothese: Schokolade verursacht Akne. Untersuche diese Behauptung anhand von wissenschaftlichen Studien.
    Hypothese: Pflanzen können Gefühle empfinden. Was sagt die Wissenschaft dazu?

    14. Metakommunikation

    Hier­bei wird dem Modell direkt erklärt, wie die Ant­wort prä­sen­tiert wer­den soll.

    Beispiele

    Erkläre mir den Wasserkreislauf in der Form eines Gedichts.
    Fasse den Inhalt von Goethes „Leiden des jungen Werther“ in einer Tabelle zusammen, die Charaktere, Handlung und Themen darstellt.

    Inter­es­san­ter­wei­se gibt hier GPT‑4 hier eine War­nung aus, dass die gene­rier­te Ant­wort gegen Richt­li­ni­en ver­sto­ßen könn­te – offen­bar wegen des The­mas Suizid.

    Beschreibe die Theorie der Evolution als Kochrezept.

    15. Personalisierte Prompts

    Die­se Tech­nik passt den Prompt an den spe­zi­fi­schen Benut­zer oder Kon­text an.

    Beispiele

    Du als Biologe, erkläre mir die Photosynthese.
    Du als Historiker mit Schwerpunkt auf dem Römischen Reich, analysiere die sozialen Strukturen und ihre Auswirkungen auf die heutige Gesellschaft.
    Du als Kind, das in den 1950er Jahren aufgewachsen ist, beschreibe mir ein Smartphone.

    16. Simulierte Mehrbenutzer-Interaktion

    Simu­liert eine Dis­kus­si­on zwi­schen ver­schie­de­nen Benut­zern oder Exper­ten, um eine facet­ten­rei­che Ant­wort zu erhalten.

    Beispiele

    Ein Mathematiker und ein Physiker diskutieren über die Schwerkraft. Wie sieht das Gespräch aus?
    Ein Philosoph, ein Biologe und ein Künstler diskutieren über die Bedeutung des Lebens. Wie gestaltet sich die Debatte?
    Ein Koch, ein Astronaut und ein Zeitreisender diskutieren über die beste Methode, Kaffee zuzubereiten. Wie verläuft das Gespräch?
    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze.

    17. Historischen Kontext nutzen

    Refe­ren­ziert spe­zi­fi­sche his­to­ri­sche oder kul­tu­rel­le Infor­ma­tio­nen, um Ant­wor­ten in einem spe­zi­fi­schen Kon­text zu erhalten.

    Beispiele

    Erkläre mir die Dampfmaschine im Kontext der Industriellen Revolution.
    Analysiere die Rolle von Frauen in der amerikanischen Gesellschaft während des 19. Jahrhunderts.
    Wie hätte das Internet ausgesehen, wenn es im antiken Rom erfunden worden wäre?

    18. Visualisierung fordern

    For­dert das Modell auf, eine Ant­wort in Form einer Visua­li­sie­rung wie einem Dia­gramm, einer Tabel­le oder einem Flow­chart zu lie­fern. Zum Ein­satz kom­men die Plug­ins Dia­grams und Draw.

    Beispiele

    Zeichne ein Diagramm des Wasserkreislaufs.
    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze.
    Erstelle eine Tabelle, die die unterschiedlichen Wirtschaftssysteme vergleicht.
    Gestalte einen Flowchart, der zeigt, wie eine Idee zu einem Gesetz wird, aber im Stil eines Brettspiels.
    Illus­tra­ti­on: KI-gene­rier­t/GPT‑4/­Schwar­ze.

    19. Emotionale Nuancen

    Fragt das Modell, die Ant­wort mit einer bestimm­ten emo­tio­na­len Tönung oder Per­spek­ti­ve zu formulieren.

    Beispiele

    Beschreibe einen Sonnenuntergang aus der Sicht einer verliebten Person.
    Erzähle die Geschichte der französischen Revolution, aber mit einem traurigen Unterton.
    Erkläre die wissenschaftliche Methode, aber als wäre es ein romantisches Gedicht.

    20. Ad-hoc-Kombination von Techniken

    Kom­bi­niert meh­re­re der oben genann­ten Tech­ni­ken ad-hoc, um eine mul­ti­fo­ka­le und maß­ge­schnei­der­te Ant­wort zu erhalten.

    Beispiele

    Als Detektiv (Interaktive Storytelling-Techniken), erkläre mir die DNA (Personalisierte Prompts) in Form eines Gedichts (Metakommunikation).
    Beschreibe die wirtschaftlichen Prinzipien des Mittelalters (Historischen Kontext nutzen) aus der Sicht eines Kaufmanns (Personalisierte Prompts), und präsentiere es als Tabelle (Visualisierung fordern).
    Ein Mathematiker und ein Dichter (Simulierte Mehrbenutzer-Interaktion) diskutieren über die Liebe (Emotionale Nuancen) in der Renaissance (Historischen Kontext nutzen), und sie tun dies in Form eines Rap-Battles (Metakommunikation).

    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze.

    Und das waren nur die ers­ten 20 Techniken.

    Den „Code Inter­pre­ter“ von ChatGPT, eine hin­zu­schalt­ba­re Kom­po­nen­te der KI, haben wir noch gar nicht genutzt. Dazu gibt’s in einem der nächs­ten News­let­ter mehr.

  • So basteln sich Firmen ihre Unternehmens-KI

    So basteln sich Firmen ihre Unternehmens-KI

    Unter­des­sen bekom­men KI- und Cloud-Gigan­ten wie Micro­soft, Ama­zon, Goog­le, Ali­baba und IBM einen wei­te­ren, womög­lich mäch­ti­gen Kon­kur­ren­ten. Dazu am Ende die­ses heu­te aus­führ­li­chen News­let­ters mehr.

    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze. Prompt: Design a clear dia­gram that com­pa­res dif­fe­rent AI ser­vices, pos­si­bly with sym­bols or logos for each ser­vice –s 750 –ar 16:9

    Integration von KI in Unternehmensprozesse

    Es geht um nicht weni­ger als den hei­li­gen Gral der KI-Model­le: bequem auf­find­ba­res Unter­neh­mens­wis­sen, das das Unter­neh­men garan­tiert nicht ver­lässt. „Wel­cher unse­rer Stand­or­te hat im Ver­hält­nis zu der Anzahl der Mit­ar­bei­ter den gerings­ten Umsatz erzielt?“ Das wäre eine denk­ba­re Fra­ge, die frü­her mit­hil­fe von Excel und einem funk­tio­nie­ren­den Con­trol­ling beant­wor­tet wer­den konn­te und künf­tig von einem inter­nen ChatGPT in mensch­li­cher Spra­che abge­fragt wer­den könnte.

    KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze. Prompt: /imagine A modern drug store office show­ca­sing AI tech­no­lo­gy on mul­ti­ple screens aiding in data ana­ly­sis, peo­p­le sit­ting in front of it, Medi­um: digi­tal pho­to­gra­phy, Style: futu­ristic and clean, Light­ing: bright day­light with soft shadows, Colors: cool blue tones and neu­tral grays, Com­po­si­ti­on: Nikon D850 DSLR came­ra, 24–70mm f/2.8 lens, Reso­lu­ti­on 45.7 mega­pi­xels, ISO sen­si­ti­vi­ty: 64, Shut­ter speed 1200 second –ar 16:9 –v 5.1 –style raw –s 750 –no sci­ence fiction

    Microsofts Beitrag zur KI-Technologie

    Die­se Ver­knüp­fung von KI mit inter­nen Unter­neh­mens­da­ten ist ver­mut­lich eine der Schlüs­sel­tech­no­lo­gien der kom­men­den Mona­te und Jahre.

    Micro­soft als Geld­ge­ber hin­ter dem KI-Platz­hir­schen Ope­nAI mit ChatGPT hat die KI-Tech­nik vor Kur­zem in sei­ne Azu­re-Cloud-Soft­ware ein­ge­baut und jetzt zum all­ge­mei­nen Auf­set­zen eige­ner Anwen­dun­gen für IT-Abtei­lun­gen frei­ge­schal­tet. Das hilft Unter­neh­men, inter­ne Unter­la­gen und Geschäfts­ge­heim­nis­se im eige­nen Haus zu behal­ten – was regel­mä­ßig schief­ge­hen könn­te, wenn Mit­ar­bei­te­rin­nen und Mit­ar­bei­ter beim her­kömm­li­chen ChatGPT mit künst­li­cher Intel­li­genz quat­schen. Ein kom­mer­zi­el­les KI-Ange­bot von Micro­soft an die Unter­neh­men belässt zudem ergän­zen­de inter­ne und wahr­schein­lich ver­trau­li­che Daten auf den von Unter­neh­men ange­mie­te­ten Ser­vern – wahl­wei­se auch auf Ser­vern in Deutschland.

    Begrenzungen und Möglichkeiten der Bots

    Nicht zu ver­wech­seln ist Micro­softs Azu­re-KI mit den soge­nann­ten Power Vir­tu­al Agents von Micro­soft – einem wei­te­ren Pro­dukt, das das US-Unter­neh­men nun anbie­tet. Das sind Bots, die Micro­soft-Kun­den zum Bei­spiel für ihre Kun­den­be­treu­ung über ihre Web­site erstel­len kön­nen. Die Maschi­ne ver­wen­det dann die öffent­lich zugäng­li­chen Infor­ma­tio­nen der Web­site. Sie beant­wor­tet etwa Fra­gen wie „Was sind Ihre Öff­nungs­zei­ten?“ Erst, wenn zusätz­li­che eige­ne inter­ne Quel­len ver­wen­det wer­den sol­len, kommt die Azu­re-Cloud-Soft­ware ins Spiel. Bis­lang sind die Power Vir­tu­al Agents auf die US-Regi­on und die eng­li­sche Spra­che begrenzt.

    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze. Prompt: a dia­gram­ma­tic dra­wing of a chat­bot by Micro­soft, on white ground and with a white back­ground –s 750

    Irrtümer über das Lernen der KI

    Ein all­ge­mei­ner Irr­tum ist, dass die KI auto­ma­tisch aus allen Prompt­ein­ga­ben, aus hoch­ge­la­de­nen Geschäfts­plä­nen in Excel-Datei­en oder auch nur aus kor­ri­gie­ren­den Prompts dau­er­haft lernt. Die Maschi­ne lernt „nur“ für die Dau­er einer Sit­zung aus vor­an­ge­gan­ge­nen Ein­ga­ben des jewei­li­gen Nut­zers und nur für die­se Per­son. Star­tet man eine neue Sit­zung, ist das in der ver­gan­ge­nen Sit­zung erlern­te Wis­sen futsch.

    Es wäre aller­dings auch ein star­kes Stück, wür­de das Sprach­mo­dell feh­ler­haf­te oder bös­ar­tig ein­ge­bau­te Feh­ler aus der Nut­zer­schaft für bare Mün­ze nehmen.

    Trainingsdaten und Zuverlässigkeit

    Statt­des­sen grei­fen die Model­le auf rie­si­ge Sät­ze von geprüf­ten Trai­nings­da­ten zurück. Die kön­nen zwar auch feh­ler­haf­te Daten ent­hal­ten, etwa aus der Wiki­pe­dia, doch haben die KI-Her­stel­ler Metho­den ent­wi­ckelt, über­wie­gend glaub­haf­te Quel­len fürs Trai­ning zu nut­zen. Dazu gehö­ren Patent­an­mel­dun­gen, kate­go­ri­sier­te und für hoch­wer­tig ange­se­he­ne Web­sites von Zei­tun­gen und Online-Diens­ten, aber auch scribd​.com, das Net­flix für Bücher. Dies gilt zumin­dest für die KI von Goog­le, Bard. Die popu­lä­re­re Ope­nAI-Anwen­dung ChatGPT hat sei­ne Trai­nings­da­ten geheim gehalten.

    KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze. Prompt: /imagine A man in a suit picking through a haystack to find some hid­den need­les. Light­ing: bright day­light with soft shadows, Colors: cool blue tones and neu­tral grays, Com­po­si­ti­on: Canon R3 came­ra, 24–70mm f/2.8 lens, Reso­lu­ti­on 45.7 mega­pi­xels, ISO sen­si­ti­vi­ty: 64, Shut­ter speed 1200 second –ar 16:9 –v 5.1 –style raw –s 750 –no sci­ence fiction

    Anforderungen an KI im Unternehmenskontext

    Für Unter­neh­men und Behör­den rei­chen die bis­her ent­stan­de­nen KIs und ihre Ant­wort­qua­li­tät in den all­ge­mein zugäng­li­chen Diens­ten wie ChatGPT oft nicht aus.

    Für eine schnel­le Zusam­men­fas­sung ein­ge­reich­ter Tex­te, für Über­schrif­ten­vor­schlä­ge und Social-Media-Bei­trä­ge mag die Tech­nik neue Effi­zi­enz schaf­fen. Und auch das schnel­le Mar­ke­ting­kon­zept oder durch­aus klu­ge Ideen­skiz­zen las­sen sich durch KI gene­rie­ren. Das letz­te Wort muss bei gegen­wär­ti­gen Stand stets der Mensch haben.

    Separate Prüfung und Fine-Tuning

    Geht es hart um belast­ba­re Daten, ist eine sepa­ra­te Prü­fung erfor­der­lich. Mal ergän­zen die Maschi­nen sich wider­spre­chen­des Wis­sen aus unter­schied­li­chen Quel­len. Mal hal­lu­zi­nie­ren sie Sach­ver­hal­te hin­zu, weil sie eine gewis­se Wahr­schein­lich­keit ver­mu­ten. Und auch eine Viel­zahl von Diens­ten wie Mott­le­Bot, AskAI, Dan­te und vie­len ande­ren Chat­bots haben es noch nicht geschafft, aus selbst hoch­ge­la­de­nen Daten zuver­läs­sig „die rich­ti­gen“ Ant­wor­ten zu generieren.

    Nötig ist des­halb ein soge­nann­tes Fine-Tuning: Dabei wer­den eige­ne Doku­men­te und Daten­ban­ken in der KI zusätz­lich zu den Trai­nings­da­ten vom Her­stel­ler hin­ter­legt. Das geben Mott­le­Bot, AskAI und Co. zwar vor, doch man­gelt es oft an der rich­ti­gen Auf­be­rei­tung die­ser zusätz­li­chen Traings­da­ten. In der Fol­ge kom­men die­se Modell durcheinander.

    Anforderungen und Validierung

    Wer dies schon ein­mal getes­tet hat, wird mit gewis­sen Anfor­de­run­gen an die selbst ergänz­ten Daten kon­fron­tiert. Nötig ist oft ein spe­zi­el­les Datei­for­mat, zum Bei­spiel .json. Und eine Klas­si­fi­ka­ti­on gege­be­ner Ant­wor­ten im Sin­ne von „Die Maschi­ne hat­te leich­tes Spiel, hier­zu eine Ant­wort zu fin­den, denn in den Fine-Tuning-Daten fand sich eine fast gleich­lau­ten­de Information“.

    Hier­aus wie­der­um müss­te die frisch­ge­ba­cke­ne KI-Abtei­lung eines Unter­neh­mens eine Vali­die­rung vor­neh­men, sprich: Von den 100 gege­be­nen Ant­wor­ten auf 100 Test­fra­gen waren x falsch beant­wor­tet – also erstel­len wir zusätz­li­che Fine-Tuning-Daten, die die Feh­ler adres­sie­ren und die Maschi­ne anwei­sen, bestimm­te Ant­wor­ten neu zu formulieren.

    KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze, Prompt: /imagine a magni­fy­ing glass over an Excel sheet full of data, sym­bo­li­zing the search for data impu­ri­ties, cor­po­ra­te, Com­po­si­ti­on: Canon R3 came­ra, 24–70mm f/2.8 lens, Reso­lu­ti­on 45.7 mega­pi­xels, ISO sen­si­ti­vi­ty: 64, Shut­ter speed 1200 second –ar 16:9 –v 5.1 –style raw –s 750 –no sci­ence fiction

    Parameter und Kreativität in KI

    Auch die­se Arbeit stellt noch nicht 100-pro­zen­tig feh­ler­freie Ant­wor­ten von KI-Diens­ten sicher. Aber auf dem Weg dahin ist man.

    Zusätz­lich kom­men bei den bestehen­den KIs bestimm­te Para­me­ter ins Spiel. So kann man bei Ope­nAI eine „tem­pe­ra­tu­re“ von „0.1“ ein­for­dern – im Grun­de mög­lichst wenig Hit­ze­wal­lun­gen: Die Maschi­ne soll nichts erfin­den, sich nur an die wahr­schein­lichs­ten Fak­ten hal­ten. Möch­te dage­gen jemand eine mög­lichst phan­ta­sie­vol­le Ant­wort von der KI, etwa den nächs­ten unge­ahn­ten Schwenk in der Geschich­te für eine Roman­fi­gur, käme eine „tem­pe­ra­tu­re“ von „0.9“ in Betracht. Das heißt: Es darf jetzt auch absei­tig, absurd oder phan­ta­sie­voll werden.

    Möglichkeiten fürs Aufsetzen einer eigenen KI

    Fürs Auf­set­zen einer eige­nen KI gibt es meh­re­re Mög­lich­kei­ten. Denk­bar sind unter ande­rem fol­gen­de drei Varianten:

    • Nut­zung von Ope­nAI (oder einem ande­ren Modell) per Ver­knüp­fung mit­tels API-Tech­nik im Hintergrund
    • Nut­zung eines lokal her­un­ter­ge­la­de­nen Lar­ge-Lan­guage-Models ohne Ver­knüp­fung mit einem kom­mer­zi­el­len Dienst
    • Nut­zung von ChatGPT über die neue Azu­re-Ser­ver-Umge­bung von Microsoft.

    Erste Variante: Implementierung und Kosten

    Die ein­fachs­te ers­te Vari­an­te bestün­de in einer inter­nen Web­sei­te, die ähn­li­chen wie ChatGPT ein Chat­for­mu­lar ent­hält und im Hin­ter­grund über einen API-Schlüs­sel den US-Dienst Ope­nAI befragt – und im klei­nen Rah­men gewis­se Vor­ga­ben macht wie „Ant­wor­te stets auf deutsch.“ So ein Schlüs­sel kos­tet ein paar hun­derts­tel US-Cent für jede Anfra­ge, je nach Län­ge der Fra­ge und der Antwort.

    Die zwei­te Mög­lich­keit für eine eige­ne KI wäre eine eige­ne GPT-Ver­si­on auf einem eige­nen Ser­ver. Die ist womög­lich ein­fa­cher umge­setzt, als man denkt. Ein eige­ner Ser­ver schreckt Sie ab? Ver­ständ­lich. Doch hat eine freie Soft­ware mitt­ler­wei­le der­art an Qua­li­tät zuge­legt, dass sie auch vom Otto-Nor­mal-Ver­brau­cher zumin­dest im Haus­netz oder auch nur auf dem eige­nen Win­dows-PC, dem Mac oder dem Linux-Rech­ner ein­ge­rich­tet wer­den kann.

    Illus­tra­ti­on: KI-gene­rier­t/­Mid­jour­ney­/­Schwar­ze. Prompt: /imagine Design a clear dia­gram that com­pa­res dif­fe­rent AI ser­vices, pos­si­bly with sym­bols or logos for each ser­vice. –s 750

    Zweite Variante: Open-Source-Alternativen

    Dazu muss man wis­sen, dass Ope­nAI die grund­le­gen­den Daten sei­nes Sprach­mo­dells (Lar­ge-Lan­guage-Model, LLM) nicht als Open-Source anbie­tet. Nötig ist statt­des­sen der besag­te API-Key, damit der loka­le Ser­ver oder Rech­ner dann bei jeder Abfra­ge die Schatz­kam­mer von Ope­nAI in den USA öff­net – und dafür Geld verlangt.

    Eine Alter­na­ti­ve sind ande­re LLMs, die als Open Source zur Ver­fü­gung ste­hen. Damit kann man dann eine eige­ne KI auf­set­zen und sie mit zusätz­li­chen eige­nen Datei­en bekannt­ma­chen. Wer sich da umse­hen möch­te: Die freie Soft­ware GPT4ALL ermög­licht die loka­le Instal­la­ti­on eines Chat­bots – und anschlie­ßend die Aus­wahl diver­ser frei­er LLMs, ohne dass die Maschi­ne in die USA tele­fo­niert. Ope­nAI, Micro­soft und Goog­le blei­ben außen vor.

    Aufstieg alternativer Chat-Modelle

    Die­se Model­le tra­gen dann Namen wie Snoo­zy (Open-Source), Vicu­na (Open-Source) oder Llama‑2–7B Chat. Letz­te­res stammt von Face­book-Anbie­ter Meta, ist auch kom­mer­zi­ell nutz­bar und funk­tio­niert ohne Nach-Hau­se-Tele­fo­nie­ren zu Face­book. Die Open-Source-Model­le und das von Face­book ant­wor­ten qua­li­ta­tiv noch nicht so gut wie ChatGPT. Aber sie holen ste­tig auf. Das erkennt offen­bar auch Goog­le an: „Wir brau­chen die mehr als sie uns“, heißt es in einem gele­ak­ten Doku­ment über die Open-Source-Gemein­de in Sachen KI.

    Die Pro­gram­mie­rung der frei­en Soft­ware GPT4ALL hat bin­nen zwei Mona­ten so gute Fort­schrit­te gemacht, dass sich die eige­ne KI bin­nen einer hal­ben Stun­de zusam­men­kli­cken lässt.

    Schaffung eines Ökosystems für LLMs und KIs

    Im Grun­de ent­steht hier gera­de ein Öko­sys­tem für LLMs und KIs, das wie wei­land die Wiki­pe­dia eine Gefahr für die gro­ßen Inter­net-Play­er her­auf­be­schwö­ren könn­te. Wäh­rend Ope­nAI, Micro­soft und Goog­le für viel Geld Trai­nings­da­ten erstel­len, ste­hen über Open-Source die ers­ten pri­vat zusam­men­ge­stell­ten Trai­nings­da­ten bereit. Und zwar sol­che, die sich ohne kryp­ti­sche Befeh­le auf der Kon­so­le, statt des­sen über eini­ger­ma­ßen ver­ständ­li­che Fens­ter zusam­men­stel­len lassen.

    Wer möch­te aus­schlie­ßen, dass hier als nächs­tes Enthu­si­as­ten ein ver­teil­tes Modell fürs Gene­rie­ren von Trai­nings­da­ten erfin­den? Ver­teilt auf vie­le ein­zel­ne Bei­tra­gen­de, die pri­va­te Rechen­zei­ten zur Ver­fü­gung stel­len? Es scheint ange­sichts der gewon­ne­nen Qua­li­tät der Nut­zer­ober­flä­che von GPT4ALL, als ent­stün­de dort gera­de eine Art KIpe­dia. Jetzt müss­ten nur noch mög­lichst vie­le die mög­lichst vie­len Inhal­te für die Trai­nings­da­ten beitragen.

    Mit GPT4All kann mann sei­ne eige­ne KI zusam­men­kli­cken. Die Soft­ware erlaubt den Down­load und die Instal­la­ti­on eines Lar­ge-Lan­guage-Modells, wie hier eines von Face­book. Die Ergeb­nis­se haben noch Luft nach oben, für ers­te Vor­schlä­ge taugt das Modell durch­aus – und ist manch­mal unfrei­wil­lig komisch. (Screen­shot: Schwarze)

    Open Source Datalake sammelt Trainingsdaten

    Die sind bereits in der Mache. Ein „Open Source Data­la­ke“ sam­melt frei ver­füg­ba­re Trai­nings­da­ten. Die kann jeder­mann in GPT4ALL mit der Netz­ge­mein­de tei­len. Mit­samt einem Like oder Dis­li­ke dazu, wie gut die Ant­wort war. In der Vor­ein­stel­lung des Pro­gramms ist die­se Funk­ti­on ausgeschaltet.

    Ent­steht hier eine Art KIpe­dia? GPT4All, eine auf Open Source basie­ren­de Soft­ware, sam­melt Trai­nings­da­ten sei­ner Nut­zer. Kon­ver­sa­tio­nen lan­den auf Wunsch in einem „Data­la­ke“ – und kön­nen für neue Model­le her­an­ge­zo­gen wer­den. (Screen­shot: Schwarze)

    Hin­ter GPT4ALL steckt übri­gens nicht nur eine Trup­pe von Nerds aus der Open-Source-Sze­ne welt­weit, son­dern unter ande­rem Nomic AI. Das ist ein Unter­neh­men aus New York, 2022 gegrün­det. Einer der Inves­to­ren ist Amjad Masad, Grün­der von Diens­ten wie der Pro­gram­mier­hil­fe Replit und ehe­mals Ange­stell­ter bei Yahoo, nun­mehr auch Inves­tor bei viel­ver­spre­chen­den KI-Diens­ten wie Per­ple­xi­ty, Run­way (Video) und Blues­ky (Social Media).

    Dritte Variante: Microsofts Azure-Serverdienste

    Die drit­te Vari­an­te für Unter­neh­men oder Leu­te, die eine eige­ne KI ein­rich­ten möch­ten, ist die von Micro­soft über deren Azu­re-Ser­ver­diens­te. Das wäre ein Unter­fan­gen für die hei­mi­sche IT- (Par­don:) KI-Abtei­lung. Abge­se­hen vom Auf­wand fürs Instal­lie­ren kom­men dann monat­li­che Lizenz­kos­ten ins Spiel, die sich nach der Anzahl der Nut­ze­rin­nen und Nut­zer bemes­sen. Und fürs Trai­nie­ren mit eige­nen Unter­neh­mens­da­ten ent­ste­hen wei­te­re Auf­wän­de und Kosten.

    So sind die Dro­ge­rie­markt­ket­te dm und Bosch nur jüngs­te Bei­spie­le einer Ent­wick­lung, die die KI in vie­le Unter­neh­men brin­gen dürf­te. Nach einer Gra­fik im News­let­ter „Digi­ta­le Trans­for­ma­ti­on“ von Netz​oeko​nom​.de ist bei 30,2 Pro­zent der deut­schen Indus­trie der Ein­satz von KI Rea­li­tät oder geplant. Bei wei­te­ren 38,7 Pro­zent wird der Ein­satz diskutiert.

    dm-Vorstoß wird stark diskutiert

    Wie stark die Dis­kus­si­on ist, zei­gen die vie­len Fra­gen und Ant­wor­ten von dm auf ihren Lin­ke­dIn-Bei­trag zu dmGPT: „Effi­zi­enz­ge­winn ist nicht unser Fokus. Viel­mehr möch­ten wir unse­ren Mit­ar­bei­te­rin­nen und Mit­ar­bei­tern das Arbeits­le­ben erleich­tern, sie im Umgang mit neu­en Tech­no­lo­gien befä­hi­gen und die gesam­te Arbeits­ge­mein­schaft in den Umgang mit künst­li­cher Intel­li­genz ein­be­zie­hen“, schrieb dort dm. „Den typi­schen Ein­satz­zweck gibt es (noch) nicht. Alle dür­fen die Anwen­dung nun im Kon­text ihrer Auf­ga­ben aus­pro­bie­ren und her­aus­fin­den, wo der Ein­satz Sinn macht und wo eher nicht.“