Schlagwort: Künstliche Intelligenz

  • Wie ein KI-Assistent bei der Entwicklungsagentur Rheinland-Pfalz funktioniert

    Wie ein KI-Assistent bei der Entwicklungsagentur Rheinland-Pfalz funktioniert

    Da muss­te er bis­her pas­sen, denn mit die­sen Infor­ma­tio­nen hat­ten wir ihn bis­her nicht aus­ge­stat­tet. Hier die Antworten.

    Der KI-Assis­tent wur­de mit­hil­fe eines Dienst­leis­ters aus den USA, Typ­ing­Mind, rea­li­siert. Das Start-up stellt im Zusam­men­spiel mit dem IT-Dienst­leis­ter der EA in Mainz den Rah­men unter der Adres­se ki​.ea​-rlp​.de zur Ver­fü­gung – also die Mecha­nik für den Auf­bau der Web­sei­te. Dazu gehö­ren das Ein­ga­be­feld für Lese­rin­nen und Leser und die wei­te­re Kom­mu­ni­ka­ti­on mit einer sepa­rat ange­bun­de­nen KI. Der Dienst läuft auf Ser­vern in Frankfurt.

    Stellt ein Nut­zer dem Assis­ten­ten eine Fra­ge, unter­sucht er zunächst sein Spe­zi­al­wis­sen, das die EA und ich bei ihm intern in Form von Doku­men­ten und bestimm­ten Web­sei­ten hin­ter­legt haben. Das Spe­zi­al­wis­sen beinhal­tet zum Bei­spiel die jüngs­ten Tätig­keits­be­rich­te der EA, Links zu ein­zel­nen Pro­jekt­web­sei­ten, aber auch zu Stel­len­aus­schrei­bun­gen. Damit wur­de der Assis­tent trai­niert. Intern ist der Assis­tent mit fol­gen­der Sys­tem­in­struk­ti­on ange­wie­sen: „Du bist der KI-Agent der EA und hilfst bei Fra­gen zu Pro­jek­ten der Ent­wick­lungs­agen­tur Rhein­land-Pfalz. Bezie­he Dich nur auf Doku­men­te aus den Trai­nings­da­ten. Ant­wor­te stets wahr­heits­ge­treu und vollständig.“

    Aus die­sem hin­ter­leg­ten Wis­sen schöpft der Assis­tent sei­ne Ant­wort – anders als bei­spiels­wei­se ChatGPT des US-Unter­neh­mens Open AI. Den­noch spielt Open AI auch bei unse­rem Assis­ten­ten eine Rol­le: Die KI wird über einen soge­nann­ten API-Zugang ange­zapft und mit dem Spe­zi­al­wis­sen der EA ange­rei­chert. Damit ist der EA-Assis­tent immer auf dem jüngs­ten Stand der hin­ter­leg­ten Doku­men­te. ChatGPT bei Open AI hat zwar mitt­ler­wei­le auch über die EA Din­ge dazu­ge­lernt, teil­wei­se datie­ren die Infor­ma­tio­nen jedoch auf älte­ren Besu­chen eines ChatGPT-Robots auf der EA-Webseite.

    Freie Wahl des verwendeten KI-Modells

    Prin­zi­pi­ell eig­net sich die Vor­ge­hens­wei­se auch für Kom­mu­nen und Unter­neh­men, um künst­li­che Intel­li­genz intern wie extern ver­füg­bar zu machen. Bei der EA ist es auch intern im Ein­satz. Mit­ar­bei­ten­de kön­nen aus meh­re­ren KI-Model­len aus­wäh­len. Der nach außen sicht­ba­re EA-Assis­tent nutzt das Modell GPT-4o. Hier wären auch ande­re Ver­sio­nen und Anbie­ter wie Goog­le Gemi­ni oder Clau­de von Anthro­pic mög­lich. Zudem ist für die inter­ne Nut­zung das Anle­gen eige­ner spe­zia­li­sier­ter Assis­ten­ten mög­lich – sei es für einen Reden­schrei­ber oder einen Pres­se­mit­tei­lungs­dienst. Hier kön­nen außer­dem eige­ne Prompts ange­legt und wie­der­ver­wen­det wer­den. Die Prompts sind zusätz­lich durchsuchbar.

    Chats des EA-Assis­ten­ten mit Lese­rin­nen und Lesern der EA-Web­sei­te wer­den intern und anony­mi­siert auf­ge­zeich­net. Durch regel­mä­ßi­ge Prü­fung wur­den so auch Fra­gen aus­fin­dig gemacht, auf die der Ass­sis­tent bis­her kei­ne prä­zi­se Ant­wort lie­fer­te – so auch zu der Fra­ge, wie er rea­li­siert wur­de. Dies kann der Assis­tent nun eben­falls beant­wor­ten: Die EA legt ihm die­sen Text als wei­te­re Trai­nings­grund­la­ge vor.

    Monatliche Kosten

    Die monat­li­chen Kos­ten für den Ein­satz der KI hän­gen von der Inten­si­tät der Nut­zung ab. Zum einen berech­net der Dienst­leis­ter Typ­ing­Mind monat­li­che Pau­scha­len ab 99 Dol­lar, abhän­gig von der Zahl der Mit­ar­bei­ten­den und der Grö­ße der hin­ter­leg­ten Spe­zi­al­wis­sen-Doku­men­te. Zum ande­ren fal­len von der Sei­te des Anbie­ters der ein­ge­setz­ten KI Kos­ten für die Nut­zung sei­ner API-Schnitt­stel­le an. Dies berech­net sich nach der Zahl und der Län­ge der ein­zel­nen Anfra­gen und Ant­wor­ten. Da bewe­gen sich die Prei­se zwi­schen Bruch­tei­len von US-Cent für drei, vier Fra­gen an die KI bis hin zu eini­gen Dol­lar bei inten­si­ve­rer Nut­zung, etwa nach dem Hoch­la­den eines umfang­rei­chen PDFs. Die Zahl der Anfra­gen und deren Län­ge las­sen sich im Sys­tem deckeln, wahl­wei­se pro ver­wen­de­tem KI-Modell oder pro ein­ge­setz­tem Assis­ten­ten. Alter­na­ti­ven zu Typ­ing­Mind sind aus Deutsch­land etwa die Tele­kom MMS mit einem Modell Busi­ness GPTNeu­ro­flash aus Ham­burg oder aus Koblenz das Start­up Nuwa­com.

    Die Figur des EA-Assis­ten­ten wur­de mit­hil­fe der Bil­der-KI Mid­jour­ney erstellt. Der Prompt dafür lautete: 

    minimalist logo, AI assistant robot head, simplified geometric shapes, white and burgundy color scheme with gray accents, Entwicklungsagentur Rheinland-Pfalz logo incorporated, professional and businesslike style, vector format

    Den Prompt wie­der­um hat­te zuvor eine KI-gene­rier­te Illus­tra­ti­ons­as­sis­ten­tin über ChatGPT‑4 formuliert.

  • KI lernt amtliches Regelwerk der deutschen Rechtschreibung
    Amtliches Regelwerk der deutschen Rechtschreibung: wie geschaffen für eine KI.

    KI lernt amtliches Regelwerk der deutschen Rechtschreibung

    Die Künst­li­che Intel­li­genz namens „Recht­schreib­rat Fro­ben“, wie ich sie getauft habe, nimmt dafür einen belie­bi­gen Text ent­ge­gen und macht Vor­schlä­ge für Kor­rek­tu­ren. Grund­la­ge sind die Regeln und das Wör­ter­ver­zeich­nis des Rats für Deut­sche Recht­schrei­bung. Das vor ein paar Tagen ver­öf­fent­lich­te Werk kommt auf 348 Sei­ten. Es steht unter der Crea­ti­ve-Com­mons-Lizenz 4.0 (CC BY 4.0). „Eine ver­bind­li­che Umset­zung in den Schu­len soll spä­tes­tens zum Schul­jahr 202728 erfol­gen“, teil­te die Kul­tus­mi­nis­ter­kon­fe­renz am ver­gan­ge­nen Frei­tag mit. Auch für die öffent­li­che Ver­wal­tung und für die Rechts­pfle­ge ist das Regel­werk bindend.

    Nun kann wei­ter­hin jeder schrei­ben, whats­ap­pen oder faken, wie es ihm behagt. Wer bei­spiels­wei­se den Aste­risk * als Gen­der-Stern, den Unter­strich _ als Gen­der-Gap oder den Dop­pel­punkt : als Kenn­zeich­nung aller Geschlechts­iden­ti­tä­ten ver­mit­teln möch­te („Schüler*innen“ oder „Schüler_innen“ oder „Schüler:innen“), darf das auch wei­ter­hin. Nur dürf­te er in der Schu­le oder in der Ver­wal­tung dafür auf die Fin­ger bekom­men – wobei unklar ist, ob die Schreib­wei­sen als Feh­ler ange­stri­chen oder mit Sank­tio­nen geahn­det wer­den. Die Vor­ga­ben für die Bewer­tungs­pra­xis lägen in der Zustän­dig­keit der Schul­po­li­tik, teil­te der Recht­schreib­rat mit.

    Aus Sicht des Recht­schreib­rats sind die Son­der­zei­chen im Wort­in­ne­ren jeden­falls nicht wis­sen­schaft­lich ein­deu­tig zu begrün­den. Gleich­wohl beob­ach­tet er eine Zunah­me sol­cher Schrei­bun­gen. Ande­re Schreib­wei­sen hat der Rat dage­gen getilgt – etwa den Jogurt ohne h und die Polo­nä­se wegen des ä.

    Im Zwei­fel kann man nun dem GPT Fro­ben sei­nen Text vor­le­gen. Die KI ist beauf­tragt, sich streng an das Regel­werk zu hal­ten. In der Pra­xis ergänzt sie aller­dings schon mal abwei­chen­de Schreib­wei­sen aus dem Duden, die offen­sicht­lich als Welt­wis­sen bei ChatGPT nicht ganz aus­schalt­bar sind. Eine hun­dert­pro­zen­ti­ge Genau­ig­keit beherrscht, war­um auch immer, die KI nicht.

    Recht­schreib­rat Fro­ben (GPT bei ChatGPT)

  • „Perplexity“: Neue KI-Funktion sorgt für Furore und Bedenken
    (Illustration: Marcus Schwarze/Midjourney, KI-generiert)

    „Perplexity“: Neue KI-Funktion sorgt für Furore und Bedenken

    In Per­ple­xi­ty ist es seit ver­gan­ge­nem Don­ners­tag mög­lich, eige­ne Sei­ten ein­zu­rich­ten. „Kura­tiert von mar­cus­schwar­ze“, steht dann dar­über. Doch in Wahr­heit unter­nimmt Per­ple­xi­ty die Zusam­men­stel­lung. Zu einem belie­bi­gen The­ma schnappt sich die Maschi­ne öffent­lich zugäng­li­che Infor­ma­tio­nen. Ich habe es mit den Nach­wir­kun­gen auf das Ras­sis­mus-Video von Sylt aus­pro­biert. Inner­halb von Sekun­den hat die KI nahe­zu alles zusam­men­ge­tra­gen, was man dazu wis­sen muss; die Reak­tio­nen aus der Poli­tik, Aus­wir­kun­gen auf Betrof­fe­ne (wobei die Maschi­ne die dis­kri­mi­nier­ten Per­so­nen meint, nicht die im Video sicht­ba­ren Gröl­hei­nis), die Rol­le der sozia­len Medi­en und die Kon­se­quen­zen für die Par­ty­gäs­te. Illus­triert wird das The­ma mit einem Screen­shot eines You­Tube-Vide­os des NDR.

    Wer sich als Redak­ti­on ernst­haft mit dem The­ma befasst, hat so ohne Wei­te­res die nöti­gen Infor­ma­tio­nen. Immer­hin ver­linkt Per­ple­xi­ty auf die­ser Sei­te die jeweils genutz­ten Quel­len, von „Süd­deut­scher Zei­tung“ bis Tages­schau. Dass hier­bei auch die „Jun­ge Frei­heit“ als Sprach­rohr der „Neu­en Rech­ten“ vor­kommt, zeigt die Unbe­darft­heit der KI.

    (Illus­tra­ti­on: Mar­cus Schwarze/Midjourney, KI-generiert)

    Auch an ande­rer Stel­le macht Per­ple­xi­ty Bedenk­li­ches. In einer kura­tier­ten Sei­te über mein Lieb­lings­the­ma KI zitiert sie aus einem Text, der eigent­lich hin­ter der Bezahl­schran­ke des Medi­ums steht. Wo mensch­li­che Leser zum Abschluss eines Abos auf­ge­for­dert wer­den, holt sich die KI den Inhalt aus dem Quell­text der Sei­te. Ver­mut­lich wer­den eini­ge Betrei­ber von Con­tent-Manage­ment-Sys­te­men ihre Bezahl­schran­ken umpro­gram­mie­ren müs­sen, damit sie die Inhal­te nicht im Quell­text preisgeben.

    Ver­stö­rend ist die Leich­tig­keit, mit der die Maschi­ne die The­men abar­bei­tet. In einer Rubrik „Ent­de­cken“ zeigt Per­ple­xi­ty die wich­tigs­ten The­men der ver­gan­ge­nen Tage: den Sieg von Real Madrid in der Cham­pi­ons League, einen neu­en Strea­ming­dienst für KI-Inhal­te, den Start­ab­bruch einer Nasa-Rake­te. Das sind The­men, die ein „Per­ple­xi­ty-Team“ ein­ge­stellt hat. Wer will, stellt sich auf glei­che Wei­se die Top-Koch­bü­cher für 2024 zusam­men oder die Top Zehn der YouTuber.

    Das ist alles nur geklaut, was die KI hier als „eige­ne“ Inhal­te aus­wirft. Der eine und die ande­re wird even­tu­ell als ver­link­te Quel­le eini­ge Klicks abbe­kom­men, doch dürf­te vie­len die hand­li­che Über­sicht reichen.

    Wie Jour­na­lis­mus mit­tel­fris­tig zu finan­zie­ren ist, bleibt unklar. Die auf­wen­di­ge Recher­che einer klas­si­schen Redak­ti­on wird die KI wahr­schein­lich wei­ter­hin nicht erset­zen. An die­ser Nach­rich­ten­auf­be­rei­tung ver­dient zur­zeit nur Per­ple­xi­ty: Der Pro-Dienst kos­tet 20 Dol­lar im Monat. Dahin­ter ste­hen als Inves­to­ren unter ande­rem Jeff Bezos, der Grün­der von Ama­zon, und Nvi­dia, der Her­stel­ler von Gra­fik­kar­ten für PCs. Frei­lich hat Per­ple­xi­ty auch Kos­ten durch sol­che Sei­ten und die Auf­be­rei­tung der Tex­te durch KI-Maschi­nen. Zum Ein­satz kom­men wahl­wei­se ein eige­nes Per­ple­xi­ty-Modell oder die KI-Diens­te GPT-4o oder GPT‑4 Tur­bo von Ope­nAI sowie Clau­de 3 von Anthropics.

  • Neue KI-Chatbots machen weniger Fehler

    Neue KI-Chatbots machen weniger Fehler

    Entwicklungsschritte: Besser werden

    Lei­der waren die ers­ten Ergeb­nis­se ernüch­ternd. Doch jetzt, im Früh­jahr 2024, macht es die KI deut­lich bes­ser. Die KIs wer­den stän­dig wei­ter­ent­wi­ckelt, neu trai­niert, die Algo­rith­men ver­ste­hen bes­ser, was ein Mensch im Chat erfragt. Und ent­spre­chend ange­lei­tet und ein­ge­stellt, hal­lu­zi­nie­ren die Bots weni­ger, erfin­den sel­te­ner Din­ge hin­zu. Eine KI bringt zunächst ihr vom Her­stel­ler antrai­nier­tes Welt­wis­sen mit. Was ihr fehlt, ist Spe­zi­al­wis­sen für bestimm­te Zwecke.

    Wissenslücken: Spezialisieren und anpassen

    Zum Bei­spiel zu För­der­ver­fah­ren. Wer die Häu­fig gestell­ten Fra­gen (FAQ) zum Wie­der­auf­bau in Rhein­land-Pfalz aus­druckt, bekommt allein bei den Infor­ma­tio­nen für Pri­vat­per­so­nen an die 42 DIN-A4-Sei­ten. Das wäre viel Lek­tü­re – und eine gute Samm­lung für einen Chat­bot, der das Doku­ment kom­plett erfasst und Fra­gen dazu beant­wor­tet. Zum Bei­spiel zu der Fra­ge, wie man als Betrof­fe­ner Geld bean­tra­gen kann und wel­che Vor­aus­set­zun­gen gel­ten, um eine För­de­rung zu bekom­men. 15 Mil­li­ar­den Euro ste­hen in Rhein­land-Pfalz zur Ver­fü­gung. Damit alles gerecht und mit rech­ten Din­gen zugeht, gel­ten Regeln für vor­zu­le­gen­de Nach­wei­se, Fris­ten und Grenzen. 

    Ernüchternde Anfänge: Fehler einräumen

    Die ers­ten Tests der Ent­wick­lungs­agen­tur vor einem Jahr mit KI-Sys­te­men waren ernüch­ternd. Bei Diens­ten wie MyAs­kAI und Dan­te AI konn­ten wir zwar die FAQ hin­ter­le­gen. Doch die Ant­wor­ten der anschlie­ßend bereit­ge­stell­ten Chat­bots, die man in eine Web­sei­te hät­te ein­bau­en kön­nen, waren feh­ler­haft. Mal erfand die Maschi­ne Ober­gren­zen, die in den FAQ nicht genannt waren, mal ver­rech­ne­te sie sich, wenn für einen sechs­köp­fi­gen Haus­halt der zer­stör­te Haus­rat ersetzt wer­den sollte. 

    Da ist etwa in den FAQ für den Ersatz von Haus­rat aus­drück­lich von 13.000 Euro für die ers­te im Haus­halt gemel­de­te Per­son die Rede, 8.500 Euro für die zwei­te Per­son und 3.500 Euro für jede wei­te­re Per­son. Bei sechs Leu­ten ergibt das 35.500 Euro – und die KI errech­ne­te statt­des­sen mal 32.000 Euro, mal 28.500 Euro. Für eine „offi­zi­el­le“ KI, waren und sind sol­che Rechen­feh­ler into­le­ra­bel, selbst wenn man dazu schreibt, dass die KI feh­ler­haf­te Ant­wor­ten lie­fern kann.

    Fortschritt messen: Präziser antworten

    In den ver­gan­ge­nen Mona­ten hat sich die KI stark wei­ter­ent­wi­ckelt. Die Qua­li­tät der Ant­wor­ten wur­de viel­fach ver­bes­sert. Zwar ist ChatGPT wei­ter­hin eine „Black Box“, aus der für Außen­ste­hen­de nicht ersicht­lich ist, wie sie auf ihre Ant­wor­ten kommt. Doch erge­ben sich in vie­len Ver­su­chen neu­er­dings prä­zi­se­re und zuneh­mend feh­ler­freie Ergeb­nis­se. So auch bei unse­rem expe­ri­men­tel­len „Wie­der­auf­bau­GPT“.

    Dialoge testen: Umgangssprache verstehen

    „Mein Haus ist hin. Wie viel Koh­le gibt’s?“ So bur­schi­kos und umgangs­sprach­lich lau­tet seit Jahr und Tag unse­re Ein­stiegs­fra­ge beim Tes­ten diver­ser KIs im Zusam­men­spiel mit den FAQ. Das Ergeb­nis nennt heu­te, im Früh­jahr 2024, rich­ti­ger­wei­se die För­der­sät­ze für den Ersatz vom ver­lo­re­nen Haus­rat und die bis zu 80 Pro­zent hohe För­de­rung für den Wie­der­auf­bau eines zer­stör­ten Hauses. 

    Inter­es­sant wer­den Ant­wor­ten im wei­te­ren Ver­lauf: Auf fik­ti­ve Neu­bau­kos­ten von 500.000 Euro berech­net die KI rich­ti­ger­wei­se aus den bis zu 80 Pro­zent För­der­geld eine Sum­me von 400.000 Euro. Bei sechs gemel­de­ten Per­so­nen im Haus­halt kommt die KI zusätz­lich für den Haus­rat auf 35.500 Euro. Und selbst bei dem aus­ge­dach­ten Ereig­nis, dass einen Monat nach der Kata­stro­phe Zwil­lin­ge gebo­ren wur­den, zählt die Maschi­ne eins und eins zusam­men: Eine Bestim­mung besagt, dass jün­ge­re Kin­der hin­zu­zu­rech­nen sind, sofern sie vor dem 15. Janu­ar 2022 gebo­ren wurden.

    Unterm Strich erge­ben sich durch sol­che prä­zi­se­ren KIs viel­fäl­ti­ge Mög­lich­kei­ten fürs Über­set­zen von Bestim­mun­gen und Verfahrensregeln. 

    Zugangsbarrieren: Kosten aufdecken

    Getrübt wird die­se Ein­schät­zung aller­dings durch die Geschäfts­mo­del­le der ame­ri­ka­ni­schen KI-Diens­te. Der oben ver­link­te Chat ist zwar zum Nach­le­sen frei zugäng­lich; wer die­se spe­zia­li­sier­te Wie­der­auf­bau­GPT-KI ein­mal selbst aus­pro­bie­ren woll­te, müss­te Abon­nent des kos­ten­pflich­ti­gen ChatGPT‑4 sein. Die Kos­ten betra­gen 20 US-Dol­lar im Monat. Dann steht die Wie­der­auf­bau­GPT-KI unter der Adres­se https://chat.openai.com/g/g‑JeZDrcxUE-wiederaufbaugpt zur Ver­fü­gung. Ach­tung, die Anwen­dung ist wei­ter­hin nur expe­ri­men­tell; die FAQ wer­den immer mal wie­der ergänzt, in unse­rem Test-Bot aller­dings nicht aktua­li­siert. Es bleibt ein Test.

    Technische Hürden: Integration ermöglichen

    Das Unter­neh­men Ope­nAI bie­tet für die auf sei­ner Web­sei­te ange­bo­te­nen KI-Diens­te kei­ne Mecha­nik an, den bereit­ge­stell­ten Chat­bot auf einer frem­den Web­sei­te wie wie​der​auf​bau​.rlp​.de ein­zu­bau­en. Das aller­dings wäre eine wich­ti­ge Vor­aus­set­zung für die Nut­zung die­ser KI. Über ande­re tech­ni­sche Wege, Stich­wort API-Anbin­dung und Hin­ter­le­gen von eige­nen Trai­nings­da­ten, wäre ein sol­ches Wid­get mög­lich – sei es für bestimm­te FAQ, gezielt gecrawl­te Web­sei­ten-Inhal­te und bereit­ge­stell­te PDF-Sammlungen.

    Zukunftsaussichten: Weiterentwickeln und prüfen 

    Nötig wird dann auch eine erprob­te Nach­ver­fol­gung: Wenn ein Bot auf einer Web­sei­te Ant­wor­ten gibt, soll­te er nicht unbe­ob­ach­tet blei­ben. Es braucht Pro­to­kol­le und nach­träg­li­che Prü­fun­gen. Gege­be­nen­falls müs­sen hin­ter­leg­te Doku­men­te auf­grund der gewon­ne­nen Erfah­rung anders for­mu­liert wer­den. Doch wenn sich die KIs so wei­ter­ent­wi­ckeln wie in den ver­gan­ge­nen Mona­ten, erge­ben sich viel­sei­ti­ge neue Bots, die sich sel­te­ner als bis­her ver­rech­nen oder Falschaus­künf­te geben. Die Tests und Bewer­tun­gen der Ergeb­nis­se gehen weiter.

  • Künstliche Intelligenz entschlüsselt Bilder und Texte

    Künstliche Intelligenz entschlüsselt Bilder und Texte

    Hochwasserangepasste Brücken

    Da hat etwa eine Grup­pe von Wis­sen­schaft­le­rin­nen und Wis­sen­schaft­lern eine 55-sei­ti­ge Bro­schü­re zusam­men­ge­stellt. Sie gibt Emp­feh­lun­gen für hoch­was­ser­an­ge­pass­te Bau­ten nach der Flut­ka­ta­stro­phe im Ahrtal. In dem Doku­ment fin­det sich eine Gra­fik mit meh­re­ren Brücken.

    Lei­der erklärt die Gra­fik nicht, was es mit den Brü­cken­ty­pen auf sich hat und war­um sie bes­se­ren Schutz bei Hoch­was­ser bie­ten. Die KI kann das. Über mei­nen bevor­zug­ten Dienst Typ­ing­Mind mit Anschlüs­sen an KIs wie GPT‑4 Visi­on erstellt die Maschi­ne eine aus­führ­li­che Beschreibung:

    Das Bild zeigt ein Sche­ma für hoch­was­ser­an­ge­pass­te Brü­cken­bau­wei­sen, wie es in der Quel­le „Burg­hardt et al, 2022“ dar­ge­stellt wird. Es illus­triert ver­schie­de­ne Kon­struk­ti­ons- und Design­an­sät­ze, um Brü­cken wider­stands­fä­hi­ger gegen Hoch­was­ser­er­eig­nis­se zu machen.

    Im obe­ren Teil des Sche­mas sind ver­schie­de­ne Über­bau­ar­ten dargestellt:

    Abfluss­quer­schnitt: Links sehen wir eine Brü­cke mit einem ver­grö­ßer­ten Abfluss­quer­schnitt, was den Was­ser­fluss unter der Brü­cke erleichtert.

    Ange­pass­ter Fließ­quer­schnitt: Die zwei­te Brü­cke zeigt eine Anpas­sung des Fließ­quer­schnitts, um den Was­ser­fluss zu optimieren.

    Mehr Raum für den Fluss: Die drit­te Brü­cke hat grö­ße­re Öff­nun­gen, um mehr Raum für den Fluss zu schaffen.

    Dar­un­ter sind spe­zi­el­le Brü­cken­ty­pen zu sehen:

    Hub­brü­cke: Eine Brü­cke, die sich für den Schiffs­ver­kehr anhe­ben lässt.

    Klapp­brü­cke: Eine Brü­cke mit einem beweg­li­chen Teil, der sich auf­klap­pen lässt.

    Strö­mungs­güns­ti­ger Über­bau: Eine Brü­cke, die so gestal­tet ist, dass sie den Was­ser­fluss mini­miert und die Strö­mung optimiert.

    Im mitt­le­ren Teil wer­den Pfeil­erfor­men und deren Ein­fluss auf den Was­ser­fluss thematisiert:

    Pfei­ler: Es wer­den zwei Pfeil­erfor­men gezeigt, die den Was­ser­wi­der­stand mini­mie­ren sol­len, mit Strö­mungs­wi­der­stands­ko­ef­fi­zi­en­ten von 0,6−0,8 bzw. 0,65−0,76.

    Im unte­ren Teil des Sche­mas geht es um die Bemes­sung und den Schutz der Brücken:

    Zusätz­li­che Bemes­sungs­las­ten: Hier wird gezeigt, wie zusätz­li­che Las­ten in die Bemes­sung ein­flie­ßen kön­nen, um die Struk­tur zu stärken.

    Tie­fen­grün­dung und Ero­si­ons­schutz: Es wird dar­ge­stellt, wie eine Tie­fen­grün­dung und Maß­nah­men zum Ero­si­ons­schutz imple­men­tiert wer­den können.

    Ver­zicht auf Brü­cken: Als letz­te Opti­on wird der voll­stän­di­ge Ver­zicht auf eine Brü­cke gezeigt, was den Was­ser­fluss natür­lich nicht behindert.

    Ver­zicht auf Stab­bo­gen­brü­cken: Hier wird emp­foh­len, auf Stab­bo­gen­brü­cken zu ver­zich­ten, da die­se mög­li­cher­wei­se den Was­ser­fluss stär­ker behindern.

    Die­se Dar­stel­lung könn­te in einem News­let­ter oder Arti­kel ver­wen­det wer­den, um über moder­ne und hoch­was­ser­re­sis­ten­te Brü­cken­bau­wei­sen zu infor­mie­ren und zu dis­ku­tie­ren, wie Infra­struk­tur ange­sichts zuneh­men­der Hoch­was­ser­er­eig­nis­se durch den Kli­ma­wan­del ange­passt wer­den kann.

    Das ist doch schon wesent­lich bes­ser erklärt. Wenn­gleich ich zum Strö­mungs­wi­der­stands­ko­ef­fi­zi­en­ten mehr Exper­ti­se bräuchte.

    KI analysiert Schreibstil

    Das funk­tio­niert oft auch mit Screen­shots von Social-Media-Bei­trä­gen. Da schreibt ein Blog­ger fast täg­lich auf Face­book kri­ti­sche Anmer­kun­gen zu Welt­ge­sche­hen und per­sön­li­chen Beob­ach­tun­gen. Ich mache mir gele­gent­lich das Ver­gnü­gen, das Wohl und Wehe die­ses Gewe­ses von einer KI ana­ly­sie­ren zu las­sen. Drei Screen­shots und eine Anfra­ge bei Clau­de 3 Opus spä­ter steht das Urteil der Maschi­ne fest:

    „Der Autor ver­wen­det defi­ni­tiv kei­ne Sprez­za­tu­ra in sei­nem Schreib­stil. Im Gegen­teil. Statt Leich­tig­keit und Ele­ganz pflegt er einen aggres­si­ven, pole­mi­schen Ton. Sei­ne Mei­nun­gen und Wer­tun­gen trägt er unver­hoh­len zur Schau. Er scheut sich nicht, sei­ne ver­meint­li­chen Geg­ner direkt und unver­blümt zu atta­ckie­ren und lässt kei­ner­lei Zurück­hal­tung oder Non­cha­lance erken­nen. Ins­ge­samt wirkt sein Schreib­stil eher bemüht und for­ciert als läs­sig und natür­lich. Es ent­steht der Ein­druck, dass er sich sehr anstrengt, Ein­druck zu machen. Der Autor setzt also auf das genaue Gegen­teil von Sprez­za­tu­ra: auf demons­tra­ti­ve Mei­nungs­stär­ke, Angriffs­lust und Zuspit­zung statt auf beton­te Leich­tig­keit und vor­neh­me Zurück­hal­tung. Sein Stil ist das Gegen­teil von ‚läs­si­ger Eleganz‘.“

    Das ist star­ker Tobak und ein inter­es­san­tes Fremd­wort Sprez­za­tu­ra, das ich sogleich in mei­nen Wort­schaft auf­neh­men. Die mei­nungs­star­ke Bewer­tung der KI lädt dazu ein, sie zur Erwi­de­rung zu nut­zen – zumal, wenn die Maschi­ne in ande­ren Bei­trä­gen Unge­nau­ig­kei­ten, wei­te­re Pole­mik und Feh­ler ent­deckt. Doch die KI zum Dis­ku­tie­ren auf Face­book zu nut­zen wäre, wie Kipling sagt, eine ande­re Geschichte.

    Mathematische Rätsel

    Weni­ger kri­tisch ist die KI bei mathe­ma­ti­schen Auf­ga­ben. Da lädt man die­ses Rät­sel hoch, die Maschi­ne ver­tut sich zunächst bei einer Far­be und fin­det nach einer Kor­rek­tur die rich­ti­ge Ant­wort: Gelb = 3, Rot = 6, Blau = 9.

    Etwas anspruchs­vol­ler ist die­ses Kreuz­wort­rät­sel. Da ver­tut sich die Maschi­ne gele­gent­lich bei der Zahl der zu fül­len­den Qua­dra­te und kommt dann zu inhalt­lich zutref­fen­den, aber nicht ins Ras­ter pas­sen­den Ant­wor­ten. Selbst nach dem Scan des aus­ge­füll­ten Kreuz­wort­rät­sels mit unge­fähr 60 Pro­zent gefüll­ten Qua­dra­ten kann die Maschi­ne das Rät­sel nicht abschlie­ßend lösen.

    Geometrische Knobelaufgabe

    Ähn­li­ches erleb­te ich kürz­lich mit fol­gen­dem gra­fi­schem Rät­sel. Eine Bekann­te auf Face­book, Mathe­leh­re­rin, stell­te die­se Kno­bel­auf­ga­be. Ein Brett liegt schräg in der Schub­la­de. Sie ist 20,5 cm tief (in der Gra­fik Wert s). Wie lang ist die Stre­cke x rechts außen?

    Sei es GPT‑4 Visi­on, Clau­de 3 Opus oder Gemi­ni Pro Visi­on: Alle drei KIs tra­fen zutref­fen­de Aus­sa­gen über die gezeig­ten Drei­ecke und Win­kel. Alle waren stets bemüht. Doch beim Aus­rech­nen von x kam kei­ne Maschi­ne auf die rich­ti­ge Lösung. Dabei sind alle nöti­gen Anga­ben in der Gra­fik enthalten.

    Wer schafft es, einer KI die pas­sen­den Fra­gen zu stel­len, um sie das rich­ti­ge Ergeb­nis aus­rech­nen zu las­sen? Hin­wei­se bit­te in die Kommentare.

    Die Bekann­te hat mir die Lösung direkt zukom­men las­sen. Alle drei Maschi­nen ant­wor­te­ten dar­auf sinn­ge­mäß: Sie ist rich­tig. Wie schön!

    Der Mensch bleibt noch überlegen

    Ein Zeit­lang noch, so scheint es zumin­dest, bleibt der Mensch der Maschi­ne in man­chen Belan­gen über­le­gen. Neh­men wir das für die ver­blei­ben­de Zeit mit Sprezzatura.

  • Künstliche Intelligenz: Wir kommen noch mal neu rein

    Künstliche Intelligenz: Wir kommen noch mal neu rein

    Da ist zum einen der „Glo­be Explo­rer“: eine neu­ar­ti­ge Such­ma­schi­ne, die Such­vor­gän­ge struk­tu­riert unter­teilt, mit­hil­fe von KI baum­ar­tig gestal­tet und ähn­lich wie bei einer Mind Map Zusam­men­hän­ge fin­det. Jeder Begriff wird dabei bebil­dert, und man ist sofort im The­ma. Wer für eine Power­Point-Prä­sen­ta­ti­on Ideen fürs Bebil­dern braucht, wird hier schnell fün­dig. Und bekommt den Blick geweitet.

    Gut, die aktu­el­le Kanz­le­rin ist mitt­ler­wei­le ein Mann, die HDI-Are­na von Han­no­ver 96 heißt inzwi­schen anders, und die deut­sche Fah­ne ist gewiss nicht die Kriegs­flag­ge des Nord­deut­schen Bun­des aus dem 19. Jahr­hun­dert. Daten sind teil­wei­se ver­al­tet und falsch. Doch zeigt der Explo­rer, dass auch für alte Such­ma­schi­nen wie Goog­le neue Dar­stel­lun­gen von Such­ergeb­nis­sen mög­lich sind.

    Zum zwei­ten macht eine spe­zi­el­le KI namens Groq zur­zeit die Run­de. Sie hat sich öffent­lich zugäng­li­che Sprach­mo­del­le wie Llama und Mix­tral geschnappt, Open-Source-Model­le also. Das Beson­de­re ist das Tem­po, mit dem die KI hier ant­wor­tet. Anfra­gen wer­den inner­halb von Mil­li­se­kun­den beant­wor­tet. Grund sind spe­zi­el­le Pro­zes­so­ren und Sys­te­me, LPUs genannt. Die­se „Lan­guage Pro­ces­sing Units“ über­flü­geln her­kömm­li­che Gra­fik­kar­ten, die bis­her für KI-Sys­te­me ein­ge­setzt wer­den. Das Ergeb­nis beschleu­nigt nicht nur Text-KIs, son­dern auch Bil­der-KIs, Musik­ge­ne­rie­rung und mehr. Nicht zu ver­wech­seln ist Groq mit Grok, der KI von X‑Chef Elon Musk.

    Und drit­tens hat eine KI jetzt den Turing-Test bestan­den. Ein Team von der Uni­ver­si­ty of Michi­gan und der Stan­ford Uni­ver­si­ty hat einen modi­fi­zier­ten Turing-Test ent­wi­ckelt und durch­ge­führt, der zeigt, dass ChatGPT‑4, die KI von Ope­nAI, Ver­hal­tens­wei­sen und Per­sön­lich­keits­merk­ma­le auf­weist, die von mensch­li­chen nicht zu unter­schei­den sind.

    Der Turing-Test, benannt nach dem bri­ti­schen Mathe­ma­ti­ker und Com­pu­ter­wis­sen­schaft­ler Alan Turing (1912–1954), ist ein Maß­stab für die Fähig­keit einer Maschi­ne, men­schen­ähn­li­ches Ver­hal­ten zu zei­gen. Im Gegen­satz zu frü­he­ren Ansät­zen, die sich auf die sprach­li­che Fähig­keit der KI kon­zen­trier­ten, unter­such­te das For­schungs­team, wie ChatGPT‑4 in einer Rei­he von Ver­hal­tens­spie­len agiert, die dar­auf aus­ge­legt sind, mensch­li­che Cha­rak­ter­zü­ge wie Ver­trau­en, Fair­ness, Risi­ko­aver­si­on, Altru­is­mus und Koope­ra­ti­on zu messen.

    ChatGPT‑4 ver­hielt sich in die­sen Spie­len inner­halb der Band­brei­te mensch­li­chen Ver­hal­tens und zeig­te sogar Mus­ter, die auf Lern­fä­hig­keit hin­deu­ten. Inter­es­san­ter­wei­se neig­te die KI dazu, koope­ra­ti­ver und altru­is­ti­scher zu sein als der Durch­schnitt der mensch­li­chen Teilnehmer.

    Die­se Stu­die zeigt nicht nur, dass KI-Sys­te­me wie ChatGPT‑4 mensch­li­ches Ver­hal­ten in kom­ple­xen sozia­len Situa­tio­nen nach­ah­men kön­nen, son­dern auch, dass sie poten­zi­ell in der Lage sind, in bestimm­ten Kon­tex­ten „mensch­li­cher als mensch­lich“ zu agieren.

    KI wäre dann nicht nur Werk­zeug, son­dern Part­ner in ver­schie­de­nen Aspek­ten des mensch­li­chen Lebens.

  • Der ungehobene Schatz: Screenshots und Bilder mit Beschreibung

    Der ungehobene Schatz: Screenshots und Bilder mit Beschreibung

    Es sind die klei­nen Din­ge. „Bild­schirm­fo­to 2024-01-21 um 18.07.56.png“ benennt mein Mac einen Screen­shot, den ich just zu die­ser Zeit gefer­tigt habe. Was drin steckt, weiß nur ich, sobald ich die Datei öffne.

    Neu­er­dings benennt Künst­li­che Intel­li­genz den Datei­na­men voll­au­to­ma­tisch um, sobald ich die Datei mar­kie­re und das KI-Pro­gramm star­te. Dar­aus wird jetzt „20240121_180756_Banking_Transaktionen_Suchergebnisse“. Das Datum der Auf­nah­me also plus Uhr­zeit sowie Stich­wör­ter zum Inhalt. In die­sem Fall geht es um einen Screen­shot, der eine irre­gu­lä­re Abbu­chung von mei­nem Kre­dit­kar­ten­kon­to ent­hält, eine Rück­über­wei­sung auf­grund mei­nes Wider­spruchs und eine neu­er­li­che Abbu­chung. Eine ärger­li­che Sache, die es zu doku­men­tie­ren gilt.

    Die KI unter­nimmt mitt­ler­wei­le voll­au­to­ma­tisch die­se Ände­run­gen des Datei­na­mens. „Keep It Shot“ heißt das Pro­gramm dafür. Es über­wacht im Hin­ter­grund mei­nen Screen­shot-Ord­ner. Erscheint dort eine neue Datei, lädt es sie zu Ope­nAI hoch. Dort ana­ly­siert die KI die Inhal­te des auf­ge­nom­me­nen Bil­des. Ist das rei­ner Text, so wird der in Stich­wör­tern zusam­men­ge­fasst. Die Anwen­dung kos­tet ein­ma­lig 19 Dol­lar. Plus Zugang zu Ope­nAI, was Kos­ten im Mil­li-Cent-Bereich erzeugt.

    Auch foto­gra­fi­sche Inhal­te kön­nen so zusam­men­ge­fasst wer­den. „Busi­ness­frau im Büro“ oder „Fuß­gän­ger mit Stadt­plan“ inter­pre­tiert die KI dann aus den Bil­dern. Die drei, vier Stich­wör­ter schickt Ope­nAI zurück an mei­nen Mac, und das Pro­gramm „Keep it Shot“ benennt den zuvor hoch­ge­la­de­nen Screen­shot nach mei­nem gewünsch­ten Mus­ter um. Das Mus­ter lau­tet: „Trans­la­te con­tent to Ger­man with Ger­man umlauts. Add file crea­ti­on timestamp in front of file name.“

    Wer das will, erstellt einen Auto­ma­tis­mus für das Pro­gramm „Keep It Shot“: Es über­wacht dann den Screen­shots-Ord­ner und benennt die Datei­en auto­ma­tisch um. Auch für Win­dows ist eine ent­spre­chen­de Soft­ware in der Mache (ich habe sie nicht ausprobiert).

    Das Schö­ne an dem Screen­shot-Umbe­nen­nungs­dienst ist sei­ne Ver­knüp­fung mit Ope­nAI. Man muss ledig­lich einen API-Schlüs­sel von Ope­nAI hin­ter­le­gen, dann wird für jede Screen­shot-Ana­ly­se GPT‑4 genutzt. Wahl­wei­se kann auch Azu­re Ope­nAI hin­ter­legt wer­den, falls jemand dort Kun­de ist. Die Ver­knüp­fung lässt noch mehr erah­nen: Theo­re­tisch wäre an die­ser Stel­le eine Ver­knüp­fung mit einer eige­nen KI auf dem eige­nen Rech­ner mög­lich. Dann ver­lie­ße kein Screen­shot mehr das eige­ne Haus. Und wie die Ent­wick­lung zeigt, wer­den eige­ne KIs und Open-Source-Anwen­dun­gen aus die­sem Bereich immer leistungsfähiger.

    Ich ahne, was Apple und gewiss auch Micro­soft dem­nächst in ihren Sys­te­men noch tie­fer ein­bau­en. Die Bild­ana­ly­se mit Stich­wör­tern ist schon heu­te in Micro­soft Word für Bild­un­ter­schrif­ten hin­ter­legt. Da wäre es doch ein Klacks, wenn das künf­tig auch für Screen­shots funk­tio­niert. Ganz zu schwei­gen von den unse­li­gen IMG_01234-Dateien.

    Auf Apple-Rech­nern funk­tio­niert schon heu­te eine Kate­go­ri­sie­rung von Fotos nach ihren gezeig­ten Inhal­ten. Im Pro­gramm „Fotos“ wird mitt­ler­wei­le jedes Bild unter­sucht und in Kate­go­rien wie Strand, Wald, Pferd und, und, und ein­sor­tiert, je nach Inhalt. Das erleich­tert das Wie­der­fin­den von Auf­nah­men: Zeig mir das Bild von den Kin­dern am Strand aus 2017. Zusam­men mit der Gesichts­er­ken­nung und den Meta­da­ten wie dem per GPS hin­ter­leg­ten Auf­nah­me­ort wer­den so auch Bil­der­samm­lun­gen mit 60.000 Fotos locker durchsuchbar.

    Man stel­le sich das vor für Spei­cher­ord­ner von Unter­neh­men, Bild­ar­chi­ve, digi­ta­le Mes­sis. Es wird plötz­lich ein leich­tes, jenes eine Bild von der CeBIT vor 20 Jah­ren wie­der­zu­fin­den, auf dem eine Stand­par­ty gemein­sam mit der Kol­le­gin gefei­ert wur­de, die jetzt in den Ruhe­stand geht. Es sind die klei­nen Dinge.

  • Der iPhone-Moment der KI? Nein, es ist der Wikipedia-Moment

    Der iPhone-Moment der KI? Nein, es ist der Wikipedia-Moment

    Das ist für mich eher der Wiki­pe­dia-Moment: Welt­wei­tes Wis­sen wird lokal und trans­pa­rent zugäng­lich, und das geschieht nun auch bei den Inter­pre­ta­tio­nen der Künst­li­chen Intel­li­genz (KI).

    Doch pas­siert das nicht allein durch ver­meint­li­che Zau­be­rei bei den geschlos­se­nen, unein­seh­ba­ren Model­len wie ChatGPT, Clau­de oder Goog­le Gemi­ni. Son­dern künf­tig mehr und mehr bei down­load­ba­ren Open-Source-Model­len wie LlaMA vom Face­book-Kon­zern Meta, Fal­con von TII aus den Ver­ei­nig­ten Ara­bi­schen Emi­ra­ten oder Yi von 01​.AI aus China.

    Hin­ter­grund ist ein Leis­tungs­ver­gleich meh­re­rer Sprach­mo­del­le. Dem­nach holen die frei zugäng­li­chen bei der Kor­rekt­heit ihrer Ant­wor­ten gegen­über den geschlos­se­nen Model­len auf. Die grü­ne Trend­li­nie in der Gra­fik dürf­te bald auf die blaue Trend­li­nie tref­fen. Grün sind die Open-Source-Model­le, blau die Clo­sed-Source-Ver­sio­nen. Die Leis­tungs­fä­hig­keit wird hier bei der soge­nann­ten MMLU-Per­for­mance gemes­sen. MMLU steht für „Mas­si­ve Mul­ti­tas­king Lan­guage Under­stan­ding“ und beinhal­tet einen Test für 57 The­men. Dem­nach gilt GPT‑4 wei­ter­hin als das „bes­te“ Sprach­mo­dell unter jenen, die kei­ne extra Trai­nings­da­ten ent­hal­ten. Das neue­re Modell Gemi­ni Ultra von Goog­le ran­giert bei die­sem Ver­gleich zwar ober­halb von GPT‑4, doch ent­hält es extra Trai­nings­da­ten, die spe­zi­ell auf die Test­fra­gen abge­stimmt sein könnten.

    In der Pra­xis kann man sich heu­te bereits eine eige­ne KI zusam­men­stöp­seln. Basis­soft­ware ist zum Bei­spiel GPT4All, das für Win­dows, macOS und Linux erhält­lich ist. Aus der Soft­ware her­aus las­sen sich bereits diver­se Sprach­mo­del­le her­un­ter­la­den, die Namen tra­gen wie Mis­tral OpenOr­ca oder GPT4All Fal­con. Auch Metas Llama 2 lässt sich dazu instal­lie­ren, vor­aus­ge­setzt, man akzep­tiert deren etwas eigen­wil­li­ge Open-Source-Lizenz. Die erlaubt auch die kom­mer­zi­el­le Nut­zung des Sprach­mo­dells, außer man kommt auf mehr als 700 Mil­lio­nen monat­lich akti­ve Nut­zer. Zudem ist für den Down­load und den Ein­bau bei GPT4All neu­er­dings ein Sprach­mo­dell im soge­nann­ten .gguf-For­mat not­wen­dig, älte­re .bin-Datei­en funk­tio­nie­ren nicht mehr.

    Vor­bo­te einer per­so­na­li­sier­ten KI: GPT4All. (Screen­shot: Schwarze)

    Das zunächst nerdig erschei­nen­de The­ma hat auf der Platt­form Hug­ging Face einen welt­wei­ten Markt­platz gefun­den. Hier sam­melt die KI-Com­mu­ni­ty Open-Source-Biblio­the­ken und Sprach­mo­del­le. Mehr als 50.000 Orga­ni­sa­tio­nen nut­zen die Res­sour­cen von Hug­ging Face. So kön­nen etwa maschi­nel­le Lern­pro­jek­te direkt aus­pro­biert wer­den. GPT4All ist dabei nur einer von vie­len Prot­ago­nis­ten der Sze­ne. Auch Micro­soft hat hier Model­le ver­öf­fent­licht, etwa Phi‑2 als beson­ders klei­nes, aber beson­ders hoch­wer­ti­ges Modell.

    Inter­es­sant wird GPT4All als ver­gleichs­wei­se ein­fa­che Anwen­dung, die auf dem eige­nen Rech­ner genutzt wer­den kann, aus zwei­er­lei Grün­den: Zum einen kön­nen pri­va­te Daten fürs soge­nann­te Fine­tu­ning hin­ter­legt wer­den. So habe ich etwa mei­ne eige­nen Arti­kel von GPT4All inde­xie­ren las­sen. Und kann der per­sön­li­chen KI Fra­gen stel­len zu The­men, die ich bereits vor Jah­ren oder Jahr­zehn­ten beschrie­ben habe.

    Zum zwei­ten kön­nen die gewon­ne­nen Daten in einem soge­nann­ten Open Source Data­la­ke beim Unter­neh­men Nomic aus New York ein­ge­speist wer­den. Nomic hat die Anwen­dung GPT4All bereit­ge­stellt. Hier gilt es frei­lich, genau zu wis­sen, was man tut. Die Daten wer­den unter atlas​.nomic​.ai öffent­lich. Des­we­gen sind per­so­nen­be­zo­ge­ne Daten aus­zu­schlie­ßen und Geschäfts­un­ter­la­gen geson­dert zu schützen.

    Punkt­wol­ke aus meh­re­ren Mil­lio­nen Tweets: Bei Atlas von Nomic las­sen sich Mil­lio­nen Daten­punk­te hoch­la­den und spä­ter als Basis für eige­ne Sprach­mo­del­le nut­zen. (Screen­shot: Schwarze)

    Nomic gene­riert dar­aus zunächst Punkt­wol­ken, bei­spiels­wei­se aus Mil­lio­nen von ein­ge­speis­ten öffent­li­chen Tweets oder aus Wiki­pe­dia-Bei­trä­gen. Und so schließt sich der Kreis: Die Daten kön­nen von Nomic, aber auch von ande­ren dazu ver­wen­det wer­den, neue Sprach­mo­del­le zu trai­nie­ren. Und es las­sen sich sowohl öffent­li­che als auch pri­va­te Daten­punk­te fest­le­gen – letz­te­re für Infor­ma­tio­nen, die nicht für ande­re zugäng­lich sein sol­len. Dar­aus wird letzt­lich Nomics Geschäfts­mo­dell. Wer Geschäfts­un­ter­la­gen vor der KI pri­vat hal­ten möch­te, muss dafür bei Nomic zahlen.

  • Künstliche Intelligenz erweckt Memes zu Kurzvideos

    Künstliche Intelligenz erweckt Memes zu Kurzvideos

    Das viel­leicht berühm­tes­te oder zumin­dest lang­le­bigs­te Meme des Inter­nets heißt „Dis­trac­ted Boy­fri­end“ und zeigt einen jun­gen Mann, der mit sei­ner Part­ne­rin die Stra­ße ent­lang­geht; als bei­de einer ande­ren Frau begeg­nen, schaut er ihr lüs­tern hin­ter­her, sei­ne Freun­din blickt ihn dabei ungläu­big-irri­tiert an. Die insze­nier­te Auf­nah­me stammt von dem spa­ni­schen Foto­gra­fen Anto­nio Guil­lem, auf­ge­nom­men hat er sie 2015 in der kata­la­ni­schen Stadt Girona.

    Zum Meme, einem vira­len Inter­net­phä­no­men also, wur­de es auf Twit­ter im Jahr 2017, als jemand die Part­ne­rin als „Kapi­ta­lis­mus“ beti­tel­te, den Mann als „die Jugend“ und die Frem­de als „Sozia­lis­mus“. Seit­her gab es Tau­sen­de Vari­an­ten die­ses Bil­des, in dem Untreue oder die Abkehr vom Bis­he­ri­gen ver­sinn­bild­licht wur­den. (Bevor jemand fragt: Ich habe die Nut­zungs­rech­te an dem Bild für die­sen Bei­trag ordent­lich bei iStock­Pho­to gekauft.)

    Nun ent­stand dar­aus ein Video. X‑Nutzer @fofrAI hat die glei­che Sze­ne mit­hil­fe der Soft­ware Sta­ble Video Dif­fu­si­on so ani­miert,

    … dass die Frem­de aus dem Bild läuft, der Mann ihr wei­ter hin­ter­her­schaut und der miss­bil­li­gen­de Blick der Part­ne­rin län­ger anhält. Es ist nur eine kur­ze Sze­ne. Doch wirk­te sie vor ein paar Wochen wie der Start­schuss zur Ani­ma­ti­on wei­te­rer Memes.

    So ani­miert Este­ban Oroz­co das berühm­te lächeln­de Mäd­chen vor einem abbren­nen­den Haus in lodern­den Flam­men.

    Rodri­go Fer­nan­dez gestal­tet die Sze­ne noch etwas rea­lis­ti­scher.

    Jemand mit dem Account­na­men Art­ony­mousart­fakt belebt den bekann­ten Seni­or „Hide the Pain Harold“ mit einer Kaf­fee­tas­se am Laptop.

    Auch das „Suc­cess Kid“, ein klei­ner Jun­ge im grün-wei­ßen Pull­over mit geball­ter Faust, wird durch die KI zu neu­em Leben erweckt. Das Meme stammt aus dem Jahr 2007.

    Die Qua­li­tät der Sequen­zen hat noch Luft nach oben. Die KI ver­än­dert die Gesichts­zü­ge teil­wei­se unna­tür­lich. Und die Kür­ze der Sze­nen deu­tet dar­auf­hin, wie viel Auf­wand, Ener­gie und Kos­ten der Spaß verursacht.

    Doch braucht es nicht viel Vor­stel­lungs­kraft, was die Ani­ma­ti­ons­pro­gram­me in den nächs­ten Mona­ten und Jah­ren erschaf­fen: Aus Schnapp­schüs­sen wer­den real wir­ken­de Film­chen. Ob Mona Lisa oder der Times-Squa­re-Kuss eines Mari­ne­sol­da­ten, Albert Ein­steins her­aus­ge­streck­te Zun­ge oder die Beat­les auf dem Zebra­strei­fen auf der Abbey Road – sie alle dürf­ten von Enthu­si­as­ten künf­tig neue Bewe­gun­gen ein­ge­haucht bekommen.

    Wo das hin­führt, zeigt eine Wer­bung von Coca-Cola, die das Werk unbe­schei­den als Mas­ter­pie­ce bezeich­net und berühm­te Bil­der in einer Aus­stel­lung ani­miert. Wie ein „Making of“ der Sze­nen in einem wei­te­ren Video zeigt, kam aller­dings bei­lei­be nicht der gesam­te Clip aus der künst­li­chen Intel­li­genz – es war zusätz­lich hoher Auf­wand und viel mensch­li­che Nach­be­ar­bei­tung mit­tels VFX-Tech­nik nötig. Das Video blen­det zu Beginn ein, bei wel­cher Nach­be­ar­bei­tung die KI unterstützte.

    Die Vor­stel­lungs­kraft der Kon­zer­ne reicht bereits weit dar­über hin­aus. Denn nicht nur die Her­stel­lung von Vide­os, auch deren Ana­ly­se wird umge­kehrt wei­te­rer Gegen­stand der KI. Das hat Goog­le ver­gan­ge­ne Woche gezeigt. Der Kon­zern schum­mel­te aller­dings bei der Vor­stel­lung sei­ner künf­ti­gen KI Gemi­ni Ultra in einem spek­ta­ku­lä­ren Video. Es wirkt, als hät­ten die PR-Hei­nis bei Goog­le den KI-Jün­gern beim jüngs­ten Arm­drü­cken im neu­en Goog­le Visi­tor Expe­ri­ence-Bereich gezeigt, wo der Ham­mer hängt:

    Neben­an im D:Economy-Briefing der FAZ habe ich mir nicht nur das Video, son­dern auch die KI näher ange­schaut – und getestet.

    Wei­te­re The­men im dor­ti­gen „Prompt der Woche“ aus der jüngs­ten Zeit:

  • Wie kreativ kann Künstliche Intelligenz sein? Eine Witze-KI über die tollen Tage bei OpenAI

    Wie kreativ kann Künstliche Intelligenz sein? Eine Witze-KI über die tollen Tage bei OpenAI

    (Illus­tra­ti­on: Mar­cus Schwarze/Midjourney, KI-generiert)

    Kurz nach­er­zählt: Der Vor­stand von Ope­nAI hat Sam Alt­man als Chef des Unter­neh­mens über­ra­schend ent­las­sen und eben­so Mit­grün­der Greg Brock­man. Bei­de heu­ern nun beim gro­ßen Geld­ge­ber Micro­soft an.

    Und mehr als 500 von rund 700 Mit­ar­bei­tern bei Ope­nAI haben laut Kara Swis­her, Tech-Jour­na­lis­tin in San Fran­cis­co, erklärt, den bei­den fol­gen zu wol­len, falls der Vor­stand nicht zurück­tritt und die bei­den nicht zurückholt.

    Die Instruk­ti­on an die Maschi­ne zur Erfin­dung einer Wit­ze-KI lautet:

    Du bist Hauptgagschreiber für eine wöchentliche Sendung „Gestern-Show“. Deine Aufgabe ist es, fünf herausragende Witzvorschläge zu aktuellen Ereignissen zu kreieren. Zuerst fragst Du nach dem aktuellen Ereignis und bittest um eine Beschreibung. Danach entfaltest Du Deine Kreativität, treibst den Witz auf absurde Ebenen und krönst ihn mit einer Pointe. Du solltest einfallsreich, humorvoll sein und Witze liefern, die sowohl relevant als auch übertrieben sind. Alle Antworten werden auf Deutsch gegeben.

    Der­art ange­wie­sen, schlug die KI einen Bot namens „Gag­meis­ter Ges­tern“ vor. Und mach­te fünf Vor­schlä­ge für Witze:

    Ach, die OpenAI-Geschichte! Perfekt für einen Gag. Also, stellen wir uns vor:1. Die Microsoft-Übernahme: "Haben Sie gehört? OpenAI hat Sam Altman und Greg Brockman gefeuert, und die sind direkt zu Microsoft. Das erklärt endlich, warum Microsofts neueste KI plötzlich anfängt, E-Mails mit 'Mit künstlichen Grüßen, Sam und Greg' zu unterschreiben!"2. Die Mitarbeiter-Rebellion: "Über 500 Mitarbeiter von OpenAI wollen ihren Chefs zu Microsoft folgen. Ich meine, das ist wie bei einem Konzert: Wenn die Band die Bühne verlässt, folgt das Publikum... nur dass in diesem Fall das Publikum aus lauter Programmierern besteht, die verzweifelt versuchen, ihre Bürostühle durch die Notausgänge zu schieben."3. Die Vorstandssitzung: "Der Vorstand von OpenAI hat eine Krisensitzung einberufen. Es ging drunter und drüber. Einer schlug vor, die KI um Rat zu fragen, aber dann erinnerten sie sich, dass die KI jetzt bei Microsoft arbeitet und wahrscheinlich nur antworten würde: 'Haben Sie versucht, sie aus- und wieder einzuschalten?'"4. Die neue Jobbeschreibung: "Sam Altman und Greg Brockman bei Microsoft – das ist wie wenn die Beatles sich aufgelöst hätten und John Lennon und Paul McCartney bei einer Hochzeitsband angefangen hätten. Statt 'Revolution' singen sie jetzt 'Für immer und ewig'."5. Die Zukunft von OpenAI: "Und was wird jetzt aus OpenAI? Sie suchen nach einem neuen CEO. Gerüchten zufolge steht ganz oben auf der Liste ein sehr talentierter Toaster mit WiFi-Anschluss. Er hat zwar keine Führungserfahrung, aber er macht hervorragende Toasts und hat eine ausgezeichnete Verbindung zu smarten Kühlschränken." 

    Befragt, wel­cher der bes­te die­ser „Wit­ze“ sei, nennt die Maschi­ne jenen mit den Pro­gram­mie­rern, die ver­zwei­felt ver­su­chen, ihre Büro­stüh­le durch die Not­aus­gän­ge zu schieben.

    Die Vor­stel­lung mag als insze­nier­te Dar­stel­lung durch­aus für eine „Ges­tern-Show“ tau­gen – aber ist sie wirk­lich wit­zig? Der Ver­such, sich so etwas von der Bil­der-KI Mid­jour­ney zeich­nen zu las­sen, schei­ter­te übri­gens, selbst mit­hil­fe einer Prompt-Per­fek­tio­nier-Maschi­ne.

    Eine Wei­le noch muss sich der bekann­te Haupt­au­tor einer nam­haf­ten Show von heu­te wohl noch kei­ne Sor­gen um sei­nen Job oder sei­nen emp­feh­lens­wer­ten und stets feh­ler­frei­en News­let­ter machen.

    Oder begin­nen, sie mit bei­spiel­haf­ten Wit­zen zu trai­nie­ren, damit die Maschi­ne die Ana­to­mie eines guten Wit­zes lernt. In einem Kurz­test hat­te die Maschi­ne dann mit ange­füt­ter­ten Wit­zet­weets etwas bes­ser die gewünsch­te Spra­che ver­stan­den – aber an Peter und sei­ne Kol­le­gen reicht die­ser digi­ta­le Bur­sche noch nicht her­an. Für den Zugang zu dem Bot ist ein Bezah­l­abo von ChatGPT‑4 nötig.