Kategorie: Allgemein

  • Wie ein KI-Assistent bei der Entwicklungsagentur Rheinland-Pfalz funktioniert

    Wie ein KI-Assistent bei der Entwicklungsagentur Rheinland-Pfalz funktioniert

    Da muss­te er bis­her pas­sen, denn mit die­sen Infor­ma­tio­nen hat­ten wir ihn bis­her nicht aus­ge­stat­tet. Hier die Antworten.

    Der KI-Assis­tent wur­de mit­hil­fe eines Dienst­leis­ters aus den USA, Typ­ing­Mind, rea­li­siert. Das Start-up stellt im Zusam­men­spiel mit dem IT-Dienst­leis­ter der EA in Mainz den Rah­men unter der Adres­se ki​.ea​-rlp​.de zur Ver­fü­gung – also die Mecha­nik für den Auf­bau der Web­sei­te. Dazu gehö­ren das Ein­ga­be­feld für Lese­rin­nen und Leser und die wei­te­re Kom­mu­ni­ka­ti­on mit einer sepa­rat ange­bun­de­nen KI. Der Dienst läuft auf Ser­vern in Frankfurt.

    Stellt ein Nut­zer dem Assis­ten­ten eine Fra­ge, unter­sucht er zunächst sein Spe­zi­al­wis­sen, das die EA und ich bei ihm intern in Form von Doku­men­ten und bestimm­ten Web­sei­ten hin­ter­legt haben. Das Spe­zi­al­wis­sen beinhal­tet zum Bei­spiel die jüngs­ten Tätig­keits­be­rich­te der EA, Links zu ein­zel­nen Pro­jekt­web­sei­ten, aber auch zu Stel­len­aus­schrei­bun­gen. Damit wur­de der Assis­tent trai­niert. Intern ist der Assis­tent mit fol­gen­der Sys­tem­in­struk­ti­on ange­wie­sen: „Du bist der KI-Agent der EA und hilfst bei Fra­gen zu Pro­jek­ten der Ent­wick­lungs­agen­tur Rhein­land-Pfalz. Bezie­he Dich nur auf Doku­men­te aus den Trai­nings­da­ten. Ant­wor­te stets wahr­heits­ge­treu und vollständig.“

    Aus die­sem hin­ter­leg­ten Wis­sen schöpft der Assis­tent sei­ne Ant­wort – anders als bei­spiels­wei­se ChatGPT des US-Unter­neh­mens Open AI. Den­noch spielt Open AI auch bei unse­rem Assis­ten­ten eine Rol­le: Die KI wird über einen soge­nann­ten API-Zugang ange­zapft und mit dem Spe­zi­al­wis­sen der EA ange­rei­chert. Damit ist der EA-Assis­tent immer auf dem jüngs­ten Stand der hin­ter­leg­ten Doku­men­te. ChatGPT bei Open AI hat zwar mitt­ler­wei­le auch über die EA Din­ge dazu­ge­lernt, teil­wei­se datie­ren die Infor­ma­tio­nen jedoch auf älte­ren Besu­chen eines ChatGPT-Robots auf der EA-Webseite.

    Freie Wahl des verwendeten KI-Modells

    Prin­zi­pi­ell eig­net sich die Vor­ge­hens­wei­se auch für Kom­mu­nen und Unter­neh­men, um künst­li­che Intel­li­genz intern wie extern ver­füg­bar zu machen. Bei der EA ist es auch intern im Ein­satz. Mit­ar­bei­ten­de kön­nen aus meh­re­ren KI-Model­len aus­wäh­len. Der nach außen sicht­ba­re EA-Assis­tent nutzt das Modell GPT-4o. Hier wären auch ande­re Ver­sio­nen und Anbie­ter wie Goog­le Gemi­ni oder Clau­de von Anthro­pic mög­lich. Zudem ist für die inter­ne Nut­zung das Anle­gen eige­ner spe­zia­li­sier­ter Assis­ten­ten mög­lich – sei es für einen Reden­schrei­ber oder einen Pres­se­mit­tei­lungs­dienst. Hier kön­nen außer­dem eige­ne Prompts ange­legt und wie­der­ver­wen­det wer­den. Die Prompts sind zusätz­lich durchsuchbar.

    Chats des EA-Assis­ten­ten mit Lese­rin­nen und Lesern der EA-Web­sei­te wer­den intern und anony­mi­siert auf­ge­zeich­net. Durch regel­mä­ßi­ge Prü­fung wur­den so auch Fra­gen aus­fin­dig gemacht, auf die der Ass­sis­tent bis­her kei­ne prä­zi­se Ant­wort lie­fer­te – so auch zu der Fra­ge, wie er rea­li­siert wur­de. Dies kann der Assis­tent nun eben­falls beant­wor­ten: Die EA legt ihm die­sen Text als wei­te­re Trai­nings­grund­la­ge vor.

    Monatliche Kosten

    Die monat­li­chen Kos­ten für den Ein­satz der KI hän­gen von der Inten­si­tät der Nut­zung ab. Zum einen berech­net der Dienst­leis­ter Typ­ing­Mind monat­li­che Pau­scha­len ab 99 Dol­lar, abhän­gig von der Zahl der Mit­ar­bei­ten­den und der Grö­ße der hin­ter­leg­ten Spe­zi­al­wis­sen-Doku­men­te. Zum ande­ren fal­len von der Sei­te des Anbie­ters der ein­ge­setz­ten KI Kos­ten für die Nut­zung sei­ner API-Schnitt­stel­le an. Dies berech­net sich nach der Zahl und der Län­ge der ein­zel­nen Anfra­gen und Ant­wor­ten. Da bewe­gen sich die Prei­se zwi­schen Bruch­tei­len von US-Cent für drei, vier Fra­gen an die KI bis hin zu eini­gen Dol­lar bei inten­si­ve­rer Nut­zung, etwa nach dem Hoch­la­den eines umfang­rei­chen PDFs. Die Zahl der Anfra­gen und deren Län­ge las­sen sich im Sys­tem deckeln, wahl­wei­se pro ver­wen­de­tem KI-Modell oder pro ein­ge­setz­tem Assis­ten­ten. Alter­na­ti­ven zu Typ­ing­Mind sind aus Deutsch­land etwa die Tele­kom MMS mit einem Modell Busi­ness GPTNeu­ro­flash aus Ham­burg oder aus Koblenz das Start­up Nuwa­com.

    Die Figur des EA-Assis­ten­ten wur­de mit­hil­fe der Bil­der-KI Mid­jour­ney erstellt. Der Prompt dafür lautete: 

    minimalist logo, AI assistant robot head, simplified geometric shapes, white and burgundy color scheme with gray accents, Entwicklungsagentur Rheinland-Pfalz logo incorporated, professional and businesslike style, vector format

    Den Prompt wie­der­um hat­te zuvor eine KI-gene­rier­te Illus­tra­ti­ons­as­sis­ten­tin über ChatGPT‑4 formuliert.

  • KI lernt amtliches Regelwerk der deutschen Rechtschreibung
    Amtliches Regelwerk der deutschen Rechtschreibung: wie geschaffen für eine KI.

    KI lernt amtliches Regelwerk der deutschen Rechtschreibung

    Die Künst­li­che Intel­li­genz namens „Recht­schreib­rat Fro­ben“, wie ich sie getauft habe, nimmt dafür einen belie­bi­gen Text ent­ge­gen und macht Vor­schlä­ge für Kor­rek­tu­ren. Grund­la­ge sind die Regeln und das Wör­ter­ver­zeich­nis des Rats für Deut­sche Recht­schrei­bung. Das vor ein paar Tagen ver­öf­fent­lich­te Werk kommt auf 348 Sei­ten. Es steht unter der Crea­ti­ve-Com­mons-Lizenz 4.0 (CC BY 4.0). „Eine ver­bind­li­che Umset­zung in den Schu­len soll spä­tes­tens zum Schul­jahr 202728 erfol­gen“, teil­te die Kul­tus­mi­nis­ter­kon­fe­renz am ver­gan­ge­nen Frei­tag mit. Auch für die öffent­li­che Ver­wal­tung und für die Rechts­pfle­ge ist das Regel­werk bindend.

    Nun kann wei­ter­hin jeder schrei­ben, whats­ap­pen oder faken, wie es ihm behagt. Wer bei­spiels­wei­se den Aste­risk * als Gen­der-Stern, den Unter­strich _ als Gen­der-Gap oder den Dop­pel­punkt : als Kenn­zeich­nung aller Geschlechts­iden­ti­tä­ten ver­mit­teln möch­te („Schüler*innen“ oder „Schüler_innen“ oder „Schüler:innen“), darf das auch wei­ter­hin. Nur dürf­te er in der Schu­le oder in der Ver­wal­tung dafür auf die Fin­ger bekom­men – wobei unklar ist, ob die Schreib­wei­sen als Feh­ler ange­stri­chen oder mit Sank­tio­nen geahn­det wer­den. Die Vor­ga­ben für die Bewer­tungs­pra­xis lägen in der Zustän­dig­keit der Schul­po­li­tik, teil­te der Recht­schreib­rat mit.

    Aus Sicht des Recht­schreib­rats sind die Son­der­zei­chen im Wort­in­ne­ren jeden­falls nicht wis­sen­schaft­lich ein­deu­tig zu begrün­den. Gleich­wohl beob­ach­tet er eine Zunah­me sol­cher Schrei­bun­gen. Ande­re Schreib­wei­sen hat der Rat dage­gen getilgt – etwa den Jogurt ohne h und die Polo­nä­se wegen des ä.

    Im Zwei­fel kann man nun dem GPT Fro­ben sei­nen Text vor­le­gen. Die KI ist beauf­tragt, sich streng an das Regel­werk zu hal­ten. In der Pra­xis ergänzt sie aller­dings schon mal abwei­chen­de Schreib­wei­sen aus dem Duden, die offen­sicht­lich als Welt­wis­sen bei ChatGPT nicht ganz aus­schalt­bar sind. Eine hun­dert­pro­zen­ti­ge Genau­ig­keit beherrscht, war­um auch immer, die KI nicht.

    Recht­schreib­rat Fro­ben (GPT bei ChatGPT)

  • „Perplexity“: Neue KI-Funktion sorgt für Furore und Bedenken
    (Illustration: Marcus Schwarze/Midjourney, KI-generiert)

    „Perplexity“: Neue KI-Funktion sorgt für Furore und Bedenken

    In Per­ple­xi­ty ist es seit ver­gan­ge­nem Don­ners­tag mög­lich, eige­ne Sei­ten ein­zu­rich­ten. „Kura­tiert von mar­cus­schwar­ze“, steht dann dar­über. Doch in Wahr­heit unter­nimmt Per­ple­xi­ty die Zusam­men­stel­lung. Zu einem belie­bi­gen The­ma schnappt sich die Maschi­ne öffent­lich zugäng­li­che Infor­ma­tio­nen. Ich habe es mit den Nach­wir­kun­gen auf das Ras­sis­mus-Video von Sylt aus­pro­biert. Inner­halb von Sekun­den hat die KI nahe­zu alles zusam­men­ge­tra­gen, was man dazu wis­sen muss; die Reak­tio­nen aus der Poli­tik, Aus­wir­kun­gen auf Betrof­fe­ne (wobei die Maschi­ne die dis­kri­mi­nier­ten Per­so­nen meint, nicht die im Video sicht­ba­ren Gröl­hei­nis), die Rol­le der sozia­len Medi­en und die Kon­se­quen­zen für die Par­ty­gäs­te. Illus­triert wird das The­ma mit einem Screen­shot eines You­Tube-Vide­os des NDR.

    Wer sich als Redak­ti­on ernst­haft mit dem The­ma befasst, hat so ohne Wei­te­res die nöti­gen Infor­ma­tio­nen. Immer­hin ver­linkt Per­ple­xi­ty auf die­ser Sei­te die jeweils genutz­ten Quel­len, von „Süd­deut­scher Zei­tung“ bis Tages­schau. Dass hier­bei auch die „Jun­ge Frei­heit“ als Sprach­rohr der „Neu­en Rech­ten“ vor­kommt, zeigt die Unbe­darft­heit der KI.

    (Illus­tra­ti­on: Mar­cus Schwarze/Midjourney, KI-generiert)

    Auch an ande­rer Stel­le macht Per­ple­xi­ty Bedenk­li­ches. In einer kura­tier­ten Sei­te über mein Lieb­lings­the­ma KI zitiert sie aus einem Text, der eigent­lich hin­ter der Bezahl­schran­ke des Medi­ums steht. Wo mensch­li­che Leser zum Abschluss eines Abos auf­ge­for­dert wer­den, holt sich die KI den Inhalt aus dem Quell­text der Sei­te. Ver­mut­lich wer­den eini­ge Betrei­ber von Con­tent-Manage­ment-Sys­te­men ihre Bezahl­schran­ken umpro­gram­mie­ren müs­sen, damit sie die Inhal­te nicht im Quell­text preisgeben.

    Ver­stö­rend ist die Leich­tig­keit, mit der die Maschi­ne die The­men abar­bei­tet. In einer Rubrik „Ent­de­cken“ zeigt Per­ple­xi­ty die wich­tigs­ten The­men der ver­gan­ge­nen Tage: den Sieg von Real Madrid in der Cham­pi­ons League, einen neu­en Strea­ming­dienst für KI-Inhal­te, den Start­ab­bruch einer Nasa-Rake­te. Das sind The­men, die ein „Per­ple­xi­ty-Team“ ein­ge­stellt hat. Wer will, stellt sich auf glei­che Wei­se die Top-Koch­bü­cher für 2024 zusam­men oder die Top Zehn der YouTuber.

    Das ist alles nur geklaut, was die KI hier als „eige­ne“ Inhal­te aus­wirft. Der eine und die ande­re wird even­tu­ell als ver­link­te Quel­le eini­ge Klicks abbe­kom­men, doch dürf­te vie­len die hand­li­che Über­sicht reichen.

    Wie Jour­na­lis­mus mit­tel­fris­tig zu finan­zie­ren ist, bleibt unklar. Die auf­wen­di­ge Recher­che einer klas­si­schen Redak­ti­on wird die KI wahr­schein­lich wei­ter­hin nicht erset­zen. An die­ser Nach­rich­ten­auf­be­rei­tung ver­dient zur­zeit nur Per­ple­xi­ty: Der Pro-Dienst kos­tet 20 Dol­lar im Monat. Dahin­ter ste­hen als Inves­to­ren unter ande­rem Jeff Bezos, der Grün­der von Ama­zon, und Nvi­dia, der Her­stel­ler von Gra­fik­kar­ten für PCs. Frei­lich hat Per­ple­xi­ty auch Kos­ten durch sol­che Sei­ten und die Auf­be­rei­tung der Tex­te durch KI-Maschi­nen. Zum Ein­satz kom­men wahl­wei­se ein eige­nes Per­ple­xi­ty-Modell oder die KI-Diens­te GPT-4o oder GPT‑4 Tur­bo von Ope­nAI sowie Clau­de 3 von Anthropics.

  • Videokonferenz mit einem Verdächtigen

    Videokonferenz mit einem Verdächtigen

    „Marcus’s AI Note­ta­ker“ hieß die­ser Teil­neh­mer. Sei­ne Video­ka­me­ra und das Mikro­fon waren aus­ge­schal­tet. Lus­tig, dach­te ich mir, da nutzt also ein ande­rer Teil­neh­mer mit mei­nem Namen das glei­che Kon­fe­renz­pro­to­koll­pro­gramm, das ich vor ein paar Tagen aus­pro­biert hat­te. „tl;dv“ heißt die Soft­ware: Sie klinkt sich in Video­kon­fe­ren­zen ein, zeich­net alles auf, ver­schrift­licht das Gesag­te und fasst die Beschlüs­se zusam­men. Das klapp­te in einem Test mit einem ein­ge­weih­ten Gesprächs­part­ner sehr gut.

    Kurzes Handgemenge

    In die­sem vir­tu­el­len Stamm­tisch aber galt die Regel: Nichts wird auf­ge­zeich­net. Also the­ma­ti­sier­ten wir „Marcus’s AI Note­ta­ker“ und wur­den uns schnell einig. Der KI-Bur­sche soll­te die Run­de ver­las­sen. Doch schwör­te der ande­re Mar­cus in der Run­de, aus irgend­wo in Nord­deutsch­land, Stein und Bein: Er habe ledig­lich die Unter­ti­telungs­funk­ti­on der Kon­fe­renz­soft­ware Zoom ein­ge­schal­tet. Und tat­säch­lich wur­de alles Gesag­te nahe­zu live vom „Zoom“-Konferenzprogramm ver­tex­tet. Aus­schal­ten ließ sich die Funk­ti­on im Nach­hin­ein nicht mehr. Kur­zes Hand­ge­men­ge mit mir, dem ande­ren Mar­cus aus Koblenz: Das ist eine ande­re KI als die­ser mys­te­riö­se Teilnehmer.

    Und plötz­lich ging mir ein Licht auf: Ver­dammt, der KI-Schnüff­ler kam aus mei­nem eige­nen Rech­ner! Hek­ti­sche Maus­be­we­gun­gen, auf dem Mac durch­such­te ich die Ein­stel­lun­gen von „tl;dv“. Doch ließ sich der digi­ta­le Gesel­le nur für künf­ti­ge Video­kon­fe­ren­zen stop­pen, nicht für die lau­fen­de. Auch der Gast­ge­be­rin des KI-Stamm­tischs waren die Hän­de gebun­den: Sie konn­te den unge­wünsch­ten Teil­neh­mer nicht ein­fach aus der Run­de kicken. Denn ein­ge­la­den hat­te jemand anders, der heu­te nicht anwe­send war. Wir waren alle nur Gäs­te an die­sem Tisch, die Admi­nis­tra­ti­on ver­lo­ren gegan­gen oder zumin­dest unauffindbar.

    Man spricht anders

    So plau­der­ten wir leicht amü­siert wei­ter, nichts war groß geheim. „Wer nichts zu ver­ber­gen hat, hat auch nichts zu befürch­ten“, lau­tet ein geflü­gel­tes Wort; an das ich aller­dings nicht glau­be, Vor­rats­da­ten­spei­che­rung hin, Ver­fas­sungs­ge­richts­ur­tei­le her. So mein­te ich auch hier zu bemer­ken: Man spricht anders unter Beob­ach­tung, und sei es durch eine Maschine.

    Tat­säch­lich ließ sich die lau­fen­de Auf­nah­me auch nicht in mei­nem Web­kon­to des KI-Pro­to­kol­lan­ten abstel­len. Mir fiel ein, dass ich ihn mit mei­nem Kalen­der ver­knüpft hat­te, und irgend­wo war ein Haken gesetzt, dass er an „allen“ Tref­fen teil­neh­men soll­te. Wer denkt sich so etwas aus? Rück­wir­kend und fürs lau­fen­de Tref­fen war die Maschi­ne nicht zu stoppen.

    Die Katze mischt mit

    Tat­säch­lich lie­fer­te der Dienst Sekun­den nach dem Stamm­tisch den Wort­laut alles Gesag­ten. Dazu gehör­ten unse­re Dis­kus­sio­nen über die schein­bar unab­schalt­ba­re Unter­ti­tel­funk­ti­on und den zusätz­lich mit­hö­ren­den KI-Gesel­len sowie Bemer­kun­gen über eine Kat­ze, die bei einer Teil­neh­me­rin über die Tas­ta­tur huschte.

    Flugs lösch­te ich die ille­ga­len Auf­zeich­nun­gen, den Wort­laut und die Zusam­men­fas­sung, und stopp­te das Pro­gramm auf mei­nem Rechner.

    Als ich Tage spä­ter den Com­pu­ter ein­mal neu star­ten muss­te, war „tl;dv“ wie­der prä­sent. Die Soft­ware muss­te auch aus dem Start­ord­ner mei­nes Macs gelöscht wer­den. Und zusätz­lich war der Zugriff auf mei­nen Kalen­der aus der Ser­ver­soft­ware der Anwen­dung zu entfernen.

    Ich habe mich da nun kom­plett gelöscht. Wir sind alle ver­lo­ren, wenn wir die Kon­trol­le über die Maschi­nen verlieren.

  • Neue KI-Chatbots machen weniger Fehler

    Neue KI-Chatbots machen weniger Fehler

    Entwicklungsschritte: Besser werden

    Lei­der waren die ers­ten Ergeb­nis­se ernüch­ternd. Doch jetzt, im Früh­jahr 2024, macht es die KI deut­lich bes­ser. Die KIs wer­den stän­dig wei­ter­ent­wi­ckelt, neu trai­niert, die Algo­rith­men ver­ste­hen bes­ser, was ein Mensch im Chat erfragt. Und ent­spre­chend ange­lei­tet und ein­ge­stellt, hal­lu­zi­nie­ren die Bots weni­ger, erfin­den sel­te­ner Din­ge hin­zu. Eine KI bringt zunächst ihr vom Her­stel­ler antrai­nier­tes Welt­wis­sen mit. Was ihr fehlt, ist Spe­zi­al­wis­sen für bestimm­te Zwecke.

    Wissenslücken: Spezialisieren und anpassen

    Zum Bei­spiel zu För­der­ver­fah­ren. Wer die Häu­fig gestell­ten Fra­gen (FAQ) zum Wie­der­auf­bau in Rhein­land-Pfalz aus­druckt, bekommt allein bei den Infor­ma­tio­nen für Pri­vat­per­so­nen an die 42 DIN-A4-Sei­ten. Das wäre viel Lek­tü­re – und eine gute Samm­lung für einen Chat­bot, der das Doku­ment kom­plett erfasst und Fra­gen dazu beant­wor­tet. Zum Bei­spiel zu der Fra­ge, wie man als Betrof­fe­ner Geld bean­tra­gen kann und wel­che Vor­aus­set­zun­gen gel­ten, um eine För­de­rung zu bekom­men. 15 Mil­li­ar­den Euro ste­hen in Rhein­land-Pfalz zur Ver­fü­gung. Damit alles gerecht und mit rech­ten Din­gen zugeht, gel­ten Regeln für vor­zu­le­gen­de Nach­wei­se, Fris­ten und Grenzen. 

    Ernüchternde Anfänge: Fehler einräumen

    Die ers­ten Tests der Ent­wick­lungs­agen­tur vor einem Jahr mit KI-Sys­te­men waren ernüch­ternd. Bei Diens­ten wie MyAs­kAI und Dan­te AI konn­ten wir zwar die FAQ hin­ter­le­gen. Doch die Ant­wor­ten der anschlie­ßend bereit­ge­stell­ten Chat­bots, die man in eine Web­sei­te hät­te ein­bau­en kön­nen, waren feh­ler­haft. Mal erfand die Maschi­ne Ober­gren­zen, die in den FAQ nicht genannt waren, mal ver­rech­ne­te sie sich, wenn für einen sechs­köp­fi­gen Haus­halt der zer­stör­te Haus­rat ersetzt wer­den sollte. 

    Da ist etwa in den FAQ für den Ersatz von Haus­rat aus­drück­lich von 13.000 Euro für die ers­te im Haus­halt gemel­de­te Per­son die Rede, 8.500 Euro für die zwei­te Per­son und 3.500 Euro für jede wei­te­re Per­son. Bei sechs Leu­ten ergibt das 35.500 Euro – und die KI errech­ne­te statt­des­sen mal 32.000 Euro, mal 28.500 Euro. Für eine „offi­zi­el­le“ KI, waren und sind sol­che Rechen­feh­ler into­le­ra­bel, selbst wenn man dazu schreibt, dass die KI feh­ler­haf­te Ant­wor­ten lie­fern kann.

    Fortschritt messen: Präziser antworten

    In den ver­gan­ge­nen Mona­ten hat sich die KI stark wei­ter­ent­wi­ckelt. Die Qua­li­tät der Ant­wor­ten wur­de viel­fach ver­bes­sert. Zwar ist ChatGPT wei­ter­hin eine „Black Box“, aus der für Außen­ste­hen­de nicht ersicht­lich ist, wie sie auf ihre Ant­wor­ten kommt. Doch erge­ben sich in vie­len Ver­su­chen neu­er­dings prä­zi­se­re und zuneh­mend feh­ler­freie Ergeb­nis­se. So auch bei unse­rem expe­ri­men­tel­len „Wie­der­auf­bau­GPT“.

    Dialoge testen: Umgangssprache verstehen

    „Mein Haus ist hin. Wie viel Koh­le gibt’s?“ So bur­schi­kos und umgangs­sprach­lich lau­tet seit Jahr und Tag unse­re Ein­stiegs­fra­ge beim Tes­ten diver­ser KIs im Zusam­men­spiel mit den FAQ. Das Ergeb­nis nennt heu­te, im Früh­jahr 2024, rich­ti­ger­wei­se die För­der­sät­ze für den Ersatz vom ver­lo­re­nen Haus­rat und die bis zu 80 Pro­zent hohe För­de­rung für den Wie­der­auf­bau eines zer­stör­ten Hauses. 

    Inter­es­sant wer­den Ant­wor­ten im wei­te­ren Ver­lauf: Auf fik­ti­ve Neu­bau­kos­ten von 500.000 Euro berech­net die KI rich­ti­ger­wei­se aus den bis zu 80 Pro­zent För­der­geld eine Sum­me von 400.000 Euro. Bei sechs gemel­de­ten Per­so­nen im Haus­halt kommt die KI zusätz­lich für den Haus­rat auf 35.500 Euro. Und selbst bei dem aus­ge­dach­ten Ereig­nis, dass einen Monat nach der Kata­stro­phe Zwil­lin­ge gebo­ren wur­den, zählt die Maschi­ne eins und eins zusam­men: Eine Bestim­mung besagt, dass jün­ge­re Kin­der hin­zu­zu­rech­nen sind, sofern sie vor dem 15. Janu­ar 2022 gebo­ren wurden.

    Unterm Strich erge­ben sich durch sol­che prä­zi­se­ren KIs viel­fäl­ti­ge Mög­lich­kei­ten fürs Über­set­zen von Bestim­mun­gen und Verfahrensregeln. 

    Zugangsbarrieren: Kosten aufdecken

    Getrübt wird die­se Ein­schät­zung aller­dings durch die Geschäfts­mo­del­le der ame­ri­ka­ni­schen KI-Diens­te. Der oben ver­link­te Chat ist zwar zum Nach­le­sen frei zugäng­lich; wer die­se spe­zia­li­sier­te Wie­der­auf­bau­GPT-KI ein­mal selbst aus­pro­bie­ren woll­te, müss­te Abon­nent des kos­ten­pflich­ti­gen ChatGPT‑4 sein. Die Kos­ten betra­gen 20 US-Dol­lar im Monat. Dann steht die Wie­der­auf­bau­GPT-KI unter der Adres­se https://chat.openai.com/g/g‑JeZDrcxUE-wiederaufbaugpt zur Ver­fü­gung. Ach­tung, die Anwen­dung ist wei­ter­hin nur expe­ri­men­tell; die FAQ wer­den immer mal wie­der ergänzt, in unse­rem Test-Bot aller­dings nicht aktua­li­siert. Es bleibt ein Test.

    Technische Hürden: Integration ermöglichen

    Das Unter­neh­men Ope­nAI bie­tet für die auf sei­ner Web­sei­te ange­bo­te­nen KI-Diens­te kei­ne Mecha­nik an, den bereit­ge­stell­ten Chat­bot auf einer frem­den Web­sei­te wie wie​der​auf​bau​.rlp​.de ein­zu­bau­en. Das aller­dings wäre eine wich­ti­ge Vor­aus­set­zung für die Nut­zung die­ser KI. Über ande­re tech­ni­sche Wege, Stich­wort API-Anbin­dung und Hin­ter­le­gen von eige­nen Trai­nings­da­ten, wäre ein sol­ches Wid­get mög­lich – sei es für bestimm­te FAQ, gezielt gecrawl­te Web­sei­ten-Inhal­te und bereit­ge­stell­te PDF-Sammlungen.

    Zukunftsaussichten: Weiterentwickeln und prüfen 

    Nötig wird dann auch eine erprob­te Nach­ver­fol­gung: Wenn ein Bot auf einer Web­sei­te Ant­wor­ten gibt, soll­te er nicht unbe­ob­ach­tet blei­ben. Es braucht Pro­to­kol­le und nach­träg­li­che Prü­fun­gen. Gege­be­nen­falls müs­sen hin­ter­leg­te Doku­men­te auf­grund der gewon­ne­nen Erfah­rung anders for­mu­liert wer­den. Doch wenn sich die KIs so wei­ter­ent­wi­ckeln wie in den ver­gan­ge­nen Mona­ten, erge­ben sich viel­sei­ti­ge neue Bots, die sich sel­te­ner als bis­her ver­rech­nen oder Falschaus­künf­te geben. Die Tests und Bewer­tun­gen der Ergeb­nis­se gehen weiter.

  • Die neue IBAN

    Die neue IBAN

    Sie fragt also bei der Alten (Tschul­di­gung) nach monat­li­chen Dau­er­auf­trä­gen und regel­mä­ßi­gen Über­wei­sun­gen, kon­tak­tiert eigen­stän­dig jeden Geschäfts­part­ner und teilt ihm die neue Bank­ver­bin­dung mit. Zur Beloh­nung gibt’s 50 Euro extra Gut­ha­ben auf dem neu­en Kon­to. Und eine ziem­lich gut gemach­te App fürs Handy.

    Läuft alles wie geschmiert. Bis auf eine Aus­nah­me. Das Finanzamt.

    Das Amt schickt ein Blatt Papier. Zum Aus­fül­len. Mit­samt Adres­se, Geburts­da­tum, Steu­er­num­mer, Steu­er-ID, einem Feld für die hän­di­sche Unter­schrift. Alles natür­lich nicht vorausgefüllt.

    Kann doch nicht sein, den­ke ich: Es gibt Els­ter, die elek­tro­ni­sche Ver­bin­dung zum Finanz­amt. Das Zer­ti­fi­kat zum Ein­wäh­len dort aus 2019 funk­tio­niert noch immer, mitt­ler­wei­le gibt es außer­dem Els­ter Secu­re, dann klappt’s auch durch Scan­nen eines QR-Codes auf dem Han­dy. Und es gibt Mei­nEls­ter+, irgend­was für die Bele­ge, aber nicht die künf­ti­gen Lastschriften.

    Kur­ze Suche nach dem SEPA-Last­schrift­man­dat bei Els­ter: 77 Tref­fer! Donnerwetter.

    Kei­ner der Tref­fer erlaubt die Ein­ga­be des neu­en Last­schrift­man­dats für Pri­vat­per­so­nen. Dann der Licht­blick: Bank­ver­bin­dung ändern! Und die Ernüch­te­rung: „Bit­te den­ken Sie dar­an, ein SEPA-Last­schrift­man­dat zu ertei­len. Dies kann aus recht­li­chen Grün­den der­zeit noch nicht über Mein ELSTER ange­bo­ten werden.“

    Also fül­le ich wie vor 20 Jah­ren ein Papier aus. Ver­zäh­le mich bei der Anzahl von Nul­len in der neu­en IBAN, wes­we­gen erst­mals seit 2003 ein Ding namens Tipp-Ex zum Ein­satz kommt. Die Che­mie­in­dus­trie hat bei der Halt­bar­keit die­ser Kor­ri­gier­tink­tur tol­le Diens­te geleistet.

    Und ich stel­le mir vor, wie jemand im Finanz­amt die­ses Papier aus dem Umschlag nimmt, sich über die Sau­klaue von dem Herrn Schwar­ze ärgert, weil nun schwer les­bar ist, ob in den win­zi­gen Aus­füll­fel­dern eine 6 oder eine 0 geschrie­ben ist.

    Noch immer ungläu­big über die­ses Ver­fah­ren, goog­le ich etwas wei­ter, kann mir ein­fach nicht vor­stel­len, dass eine bun­des- oder lan­des­weit agie­ren­de Behör­de solch ein Stan­dard­do­ku­ment nicht auch digi­tal anbie­tet. Und tat­säch­lich: Mein Bun­des­land Rhein­land-Pfalz bie­tet es auch digital.

    Zum Aus­fül­len am Bild­schirm. Und dann zum Aus­dru­cken und hän­di­schen Unterschreiben.

    Nun suche ich bei Els­ter eine Mög­lich­keit, das ein­ge­scann­te For­mu­lar mit­samt der Unter­schrift digi­tal zu über­mit­teln. Den Menü­punkt habe ich nicht gefunden.

  • Künstliche Intelligenz entschlüsselt Bilder und Texte

    Künstliche Intelligenz entschlüsselt Bilder und Texte

    Hochwasserangepasste Brücken

    Da hat etwa eine Grup­pe von Wis­sen­schaft­le­rin­nen und Wis­sen­schaft­lern eine 55-sei­ti­ge Bro­schü­re zusam­men­ge­stellt. Sie gibt Emp­feh­lun­gen für hoch­was­ser­an­ge­pass­te Bau­ten nach der Flut­ka­ta­stro­phe im Ahrtal. In dem Doku­ment fin­det sich eine Gra­fik mit meh­re­ren Brücken.

    Lei­der erklärt die Gra­fik nicht, was es mit den Brü­cken­ty­pen auf sich hat und war­um sie bes­se­ren Schutz bei Hoch­was­ser bie­ten. Die KI kann das. Über mei­nen bevor­zug­ten Dienst Typ­ing­Mind mit Anschlüs­sen an KIs wie GPT‑4 Visi­on erstellt die Maschi­ne eine aus­führ­li­che Beschreibung:

    Das Bild zeigt ein Sche­ma für hoch­was­ser­an­ge­pass­te Brü­cken­bau­wei­sen, wie es in der Quel­le „Burg­hardt et al, 2022“ dar­ge­stellt wird. Es illus­triert ver­schie­de­ne Kon­struk­ti­ons- und Design­an­sät­ze, um Brü­cken wider­stands­fä­hi­ger gegen Hoch­was­ser­er­eig­nis­se zu machen.

    Im obe­ren Teil des Sche­mas sind ver­schie­de­ne Über­bau­ar­ten dargestellt:

    Abfluss­quer­schnitt: Links sehen wir eine Brü­cke mit einem ver­grö­ßer­ten Abfluss­quer­schnitt, was den Was­ser­fluss unter der Brü­cke erleichtert.

    Ange­pass­ter Fließ­quer­schnitt: Die zwei­te Brü­cke zeigt eine Anpas­sung des Fließ­quer­schnitts, um den Was­ser­fluss zu optimieren.

    Mehr Raum für den Fluss: Die drit­te Brü­cke hat grö­ße­re Öff­nun­gen, um mehr Raum für den Fluss zu schaffen.

    Dar­un­ter sind spe­zi­el­le Brü­cken­ty­pen zu sehen:

    Hub­brü­cke: Eine Brü­cke, die sich für den Schiffs­ver­kehr anhe­ben lässt.

    Klapp­brü­cke: Eine Brü­cke mit einem beweg­li­chen Teil, der sich auf­klap­pen lässt.

    Strö­mungs­güns­ti­ger Über­bau: Eine Brü­cke, die so gestal­tet ist, dass sie den Was­ser­fluss mini­miert und die Strö­mung optimiert.

    Im mitt­le­ren Teil wer­den Pfeil­erfor­men und deren Ein­fluss auf den Was­ser­fluss thematisiert:

    Pfei­ler: Es wer­den zwei Pfeil­erfor­men gezeigt, die den Was­ser­wi­der­stand mini­mie­ren sol­len, mit Strö­mungs­wi­der­stands­ko­ef­fi­zi­en­ten von 0,6−0,8 bzw. 0,65−0,76.

    Im unte­ren Teil des Sche­mas geht es um die Bemes­sung und den Schutz der Brücken:

    Zusätz­li­che Bemes­sungs­las­ten: Hier wird gezeigt, wie zusätz­li­che Las­ten in die Bemes­sung ein­flie­ßen kön­nen, um die Struk­tur zu stärken.

    Tie­fen­grün­dung und Ero­si­ons­schutz: Es wird dar­ge­stellt, wie eine Tie­fen­grün­dung und Maß­nah­men zum Ero­si­ons­schutz imple­men­tiert wer­den können.

    Ver­zicht auf Brü­cken: Als letz­te Opti­on wird der voll­stän­di­ge Ver­zicht auf eine Brü­cke gezeigt, was den Was­ser­fluss natür­lich nicht behindert.

    Ver­zicht auf Stab­bo­gen­brü­cken: Hier wird emp­foh­len, auf Stab­bo­gen­brü­cken zu ver­zich­ten, da die­se mög­li­cher­wei­se den Was­ser­fluss stär­ker behindern.

    Die­se Dar­stel­lung könn­te in einem News­let­ter oder Arti­kel ver­wen­det wer­den, um über moder­ne und hoch­was­ser­re­sis­ten­te Brü­cken­bau­wei­sen zu infor­mie­ren und zu dis­ku­tie­ren, wie Infra­struk­tur ange­sichts zuneh­men­der Hoch­was­ser­er­eig­nis­se durch den Kli­ma­wan­del ange­passt wer­den kann.

    Das ist doch schon wesent­lich bes­ser erklärt. Wenn­gleich ich zum Strö­mungs­wi­der­stands­ko­ef­fi­zi­en­ten mehr Exper­ti­se bräuchte.

    KI analysiert Schreibstil

    Das funk­tio­niert oft auch mit Screen­shots von Social-Media-Bei­trä­gen. Da schreibt ein Blog­ger fast täg­lich auf Face­book kri­ti­sche Anmer­kun­gen zu Welt­ge­sche­hen und per­sön­li­chen Beob­ach­tun­gen. Ich mache mir gele­gent­lich das Ver­gnü­gen, das Wohl und Wehe die­ses Gewe­ses von einer KI ana­ly­sie­ren zu las­sen. Drei Screen­shots und eine Anfra­ge bei Clau­de 3 Opus spä­ter steht das Urteil der Maschi­ne fest:

    „Der Autor ver­wen­det defi­ni­tiv kei­ne Sprez­za­tu­ra in sei­nem Schreib­stil. Im Gegen­teil. Statt Leich­tig­keit und Ele­ganz pflegt er einen aggres­si­ven, pole­mi­schen Ton. Sei­ne Mei­nun­gen und Wer­tun­gen trägt er unver­hoh­len zur Schau. Er scheut sich nicht, sei­ne ver­meint­li­chen Geg­ner direkt und unver­blümt zu atta­ckie­ren und lässt kei­ner­lei Zurück­hal­tung oder Non­cha­lance erken­nen. Ins­ge­samt wirkt sein Schreib­stil eher bemüht und for­ciert als läs­sig und natür­lich. Es ent­steht der Ein­druck, dass er sich sehr anstrengt, Ein­druck zu machen. Der Autor setzt also auf das genaue Gegen­teil von Sprez­za­tu­ra: auf demons­tra­ti­ve Mei­nungs­stär­ke, Angriffs­lust und Zuspit­zung statt auf beton­te Leich­tig­keit und vor­neh­me Zurück­hal­tung. Sein Stil ist das Gegen­teil von ‚läs­si­ger Eleganz‘.“

    Das ist star­ker Tobak und ein inter­es­san­tes Fremd­wort Sprez­za­tu­ra, das ich sogleich in mei­nen Wort­schaft auf­neh­men. Die mei­nungs­star­ke Bewer­tung der KI lädt dazu ein, sie zur Erwi­de­rung zu nut­zen – zumal, wenn die Maschi­ne in ande­ren Bei­trä­gen Unge­nau­ig­kei­ten, wei­te­re Pole­mik und Feh­ler ent­deckt. Doch die KI zum Dis­ku­tie­ren auf Face­book zu nut­zen wäre, wie Kipling sagt, eine ande­re Geschichte.

    Mathematische Rätsel

    Weni­ger kri­tisch ist die KI bei mathe­ma­ti­schen Auf­ga­ben. Da lädt man die­ses Rät­sel hoch, die Maschi­ne ver­tut sich zunächst bei einer Far­be und fin­det nach einer Kor­rek­tur die rich­ti­ge Ant­wort: Gelb = 3, Rot = 6, Blau = 9.

    Etwas anspruchs­vol­ler ist die­ses Kreuz­wort­rät­sel. Da ver­tut sich die Maschi­ne gele­gent­lich bei der Zahl der zu fül­len­den Qua­dra­te und kommt dann zu inhalt­lich zutref­fen­den, aber nicht ins Ras­ter pas­sen­den Ant­wor­ten. Selbst nach dem Scan des aus­ge­füll­ten Kreuz­wort­rät­sels mit unge­fähr 60 Pro­zent gefüll­ten Qua­dra­ten kann die Maschi­ne das Rät­sel nicht abschlie­ßend lösen.

    Geometrische Knobelaufgabe

    Ähn­li­ches erleb­te ich kürz­lich mit fol­gen­dem gra­fi­schem Rät­sel. Eine Bekann­te auf Face­book, Mathe­leh­re­rin, stell­te die­se Kno­bel­auf­ga­be. Ein Brett liegt schräg in der Schub­la­de. Sie ist 20,5 cm tief (in der Gra­fik Wert s). Wie lang ist die Stre­cke x rechts außen?

    Sei es GPT‑4 Visi­on, Clau­de 3 Opus oder Gemi­ni Pro Visi­on: Alle drei KIs tra­fen zutref­fen­de Aus­sa­gen über die gezeig­ten Drei­ecke und Win­kel. Alle waren stets bemüht. Doch beim Aus­rech­nen von x kam kei­ne Maschi­ne auf die rich­ti­ge Lösung. Dabei sind alle nöti­gen Anga­ben in der Gra­fik enthalten.

    Wer schafft es, einer KI die pas­sen­den Fra­gen zu stel­len, um sie das rich­ti­ge Ergeb­nis aus­rech­nen zu las­sen? Hin­wei­se bit­te in die Kommentare.

    Die Bekann­te hat mir die Lösung direkt zukom­men las­sen. Alle drei Maschi­nen ant­wor­te­ten dar­auf sinn­ge­mäß: Sie ist rich­tig. Wie schön!

    Der Mensch bleibt noch überlegen

    Ein Zeit­lang noch, so scheint es zumin­dest, bleibt der Mensch der Maschi­ne in man­chen Belan­gen über­le­gen. Neh­men wir das für die ver­blei­ben­de Zeit mit Sprezzatura.

  • Künstliche Intelligenz: Wir kommen noch mal neu rein

    Künstliche Intelligenz: Wir kommen noch mal neu rein

    Da ist zum einen der „Glo­be Explo­rer“: eine neu­ar­ti­ge Such­ma­schi­ne, die Such­vor­gän­ge struk­tu­riert unter­teilt, mit­hil­fe von KI baum­ar­tig gestal­tet und ähn­lich wie bei einer Mind Map Zusam­men­hän­ge fin­det. Jeder Begriff wird dabei bebil­dert, und man ist sofort im The­ma. Wer für eine Power­Point-Prä­sen­ta­ti­on Ideen fürs Bebil­dern braucht, wird hier schnell fün­dig. Und bekommt den Blick geweitet.

    Gut, die aktu­el­le Kanz­le­rin ist mitt­ler­wei­le ein Mann, die HDI-Are­na von Han­no­ver 96 heißt inzwi­schen anders, und die deut­sche Fah­ne ist gewiss nicht die Kriegs­flag­ge des Nord­deut­schen Bun­des aus dem 19. Jahr­hun­dert. Daten sind teil­wei­se ver­al­tet und falsch. Doch zeigt der Explo­rer, dass auch für alte Such­ma­schi­nen wie Goog­le neue Dar­stel­lun­gen von Such­ergeb­nis­sen mög­lich sind.

    Zum zwei­ten macht eine spe­zi­el­le KI namens Groq zur­zeit die Run­de. Sie hat sich öffent­lich zugäng­li­che Sprach­mo­del­le wie Llama und Mix­tral geschnappt, Open-Source-Model­le also. Das Beson­de­re ist das Tem­po, mit dem die KI hier ant­wor­tet. Anfra­gen wer­den inner­halb von Mil­li­se­kun­den beant­wor­tet. Grund sind spe­zi­el­le Pro­zes­so­ren und Sys­te­me, LPUs genannt. Die­se „Lan­guage Pro­ces­sing Units“ über­flü­geln her­kömm­li­che Gra­fik­kar­ten, die bis­her für KI-Sys­te­me ein­ge­setzt wer­den. Das Ergeb­nis beschleu­nigt nicht nur Text-KIs, son­dern auch Bil­der-KIs, Musik­ge­ne­rie­rung und mehr. Nicht zu ver­wech­seln ist Groq mit Grok, der KI von X‑Chef Elon Musk.

    Und drit­tens hat eine KI jetzt den Turing-Test bestan­den. Ein Team von der Uni­ver­si­ty of Michi­gan und der Stan­ford Uni­ver­si­ty hat einen modi­fi­zier­ten Turing-Test ent­wi­ckelt und durch­ge­führt, der zeigt, dass ChatGPT‑4, die KI von Ope­nAI, Ver­hal­tens­wei­sen und Per­sön­lich­keits­merk­ma­le auf­weist, die von mensch­li­chen nicht zu unter­schei­den sind.

    Der Turing-Test, benannt nach dem bri­ti­schen Mathe­ma­ti­ker und Com­pu­ter­wis­sen­schaft­ler Alan Turing (1912–1954), ist ein Maß­stab für die Fähig­keit einer Maschi­ne, men­schen­ähn­li­ches Ver­hal­ten zu zei­gen. Im Gegen­satz zu frü­he­ren Ansät­zen, die sich auf die sprach­li­che Fähig­keit der KI kon­zen­trier­ten, unter­such­te das For­schungs­team, wie ChatGPT‑4 in einer Rei­he von Ver­hal­tens­spie­len agiert, die dar­auf aus­ge­legt sind, mensch­li­che Cha­rak­ter­zü­ge wie Ver­trau­en, Fair­ness, Risi­ko­aver­si­on, Altru­is­mus und Koope­ra­ti­on zu messen.

    ChatGPT‑4 ver­hielt sich in die­sen Spie­len inner­halb der Band­brei­te mensch­li­chen Ver­hal­tens und zeig­te sogar Mus­ter, die auf Lern­fä­hig­keit hin­deu­ten. Inter­es­san­ter­wei­se neig­te die KI dazu, koope­ra­ti­ver und altru­is­ti­scher zu sein als der Durch­schnitt der mensch­li­chen Teilnehmer.

    Die­se Stu­die zeigt nicht nur, dass KI-Sys­te­me wie ChatGPT‑4 mensch­li­ches Ver­hal­ten in kom­ple­xen sozia­len Situa­tio­nen nach­ah­men kön­nen, son­dern auch, dass sie poten­zi­ell in der Lage sind, in bestimm­ten Kon­tex­ten „mensch­li­cher als mensch­lich“ zu agieren.

    KI wäre dann nicht nur Werk­zeug, son­dern Part­ner in ver­schie­de­nen Aspek­ten des mensch­li­chen Lebens.

  • Zorn über Kinderbuch: „Die neue Häschenschule“ trifft manche ins Mark

    Zorn über Kinderbuch: „Die neue Häschenschule“ trifft manche ins Mark

    Ama­zon sperrt neue Rezen­sio­nen nach „unge­wöhn­li­chen Rezen­si­ons­ak­ti­vi­tä­ten“ bei Anke Engel­kes Buch „Die neue Häschenschule“.

    Zuvor hat­ten das „Baye­ri­sche Land­wirt­schaft­li­che Wochen­blatt“ und ein bäu­er­li­cher Influen­cer auf Face­book Kri­tik an der angeb­lich nega­ti­ven Dar­stel­lung von Land­wirt­schaft an sich und einem Mäh­dre­scher ins­be­son­de­re geäußert.

    Auch ein Fuchs, der anstatt Häs­chen lie­ber Möhr­chen ver­speis­te und sich in der Fol­ge mit eini­gen Häsin­nen und Ramm­lern anfreun­de­te, erzeug­te aus Sicht von Kri­ti­kern ein gestör­tes Welt­bild. „Ein Fuchs ist ein Beu­te­grei­fer und auch kein Strei­chel­tier“, belehr­te ein Rezen­sent die Komi­ke­rin aus Köln, unter der Über­schrift „Migra­ti­on falsch vermittelt“.

    In der Sto­ry ließ sich unter ande­rem Hasen­mäd­chen Hop­pich aus einem Wei­zen­feld vor dem her­an­na­hen­den gefähr­li­chen Mäh­dre­scher ret­ten. Der vega­ne Fuchs Brehm zog die Häsin aus dem Stroh. „Was hier betrie­ben wird, ist übels­tes Ver­un­glimp­fen von Bau­ern und der Land­wirt­schaft“, urteil­te Rezen­sen­tin Heidrun.

    In der Fol­ge gab es bereits kurz nach den ers­ten Dis­kus­sio­nen auf Face­book über das Kin­der­buch eine Rei­he wei­te­rer 1‑S­tern-Bewer­tun­gen und Hun­der­te von Abstim­mun­gen, die die­se nega­ti­ven Rezen­sio­nen als hilf­reich bewerteten.

    Veri­fi­zier­te Käu­fe hat­te Ama­zon unter den nega­ti­ven Bewer­tun­gen nicht regis­triert. Die ers­te Auf­la­ge des „Pam­phlets“, wie einer das Buch für Vier- bis Sie­ben­jäh­ri­ge nann­te, ist bereits ausverkauft.

  • Der ungehobene Schatz: Screenshots und Bilder mit Beschreibung

    Der ungehobene Schatz: Screenshots und Bilder mit Beschreibung

    Es sind die klei­nen Din­ge. „Bild­schirm­fo­to 2024-01-21 um 18.07.56.png“ benennt mein Mac einen Screen­shot, den ich just zu die­ser Zeit gefer­tigt habe. Was drin steckt, weiß nur ich, sobald ich die Datei öffne.

    Neu­er­dings benennt Künst­li­che Intel­li­genz den Datei­na­men voll­au­to­ma­tisch um, sobald ich die Datei mar­kie­re und das KI-Pro­gramm star­te. Dar­aus wird jetzt „20240121_180756_Banking_Transaktionen_Suchergebnisse“. Das Datum der Auf­nah­me also plus Uhr­zeit sowie Stich­wör­ter zum Inhalt. In die­sem Fall geht es um einen Screen­shot, der eine irre­gu­lä­re Abbu­chung von mei­nem Kre­dit­kar­ten­kon­to ent­hält, eine Rück­über­wei­sung auf­grund mei­nes Wider­spruchs und eine neu­er­li­che Abbu­chung. Eine ärger­li­che Sache, die es zu doku­men­tie­ren gilt.

    Die KI unter­nimmt mitt­ler­wei­le voll­au­to­ma­tisch die­se Ände­run­gen des Datei­na­mens. „Keep It Shot“ heißt das Pro­gramm dafür. Es über­wacht im Hin­ter­grund mei­nen Screen­shot-Ord­ner. Erscheint dort eine neue Datei, lädt es sie zu Ope­nAI hoch. Dort ana­ly­siert die KI die Inhal­te des auf­ge­nom­me­nen Bil­des. Ist das rei­ner Text, so wird der in Stich­wör­tern zusam­men­ge­fasst. Die Anwen­dung kos­tet ein­ma­lig 19 Dol­lar. Plus Zugang zu Ope­nAI, was Kos­ten im Mil­li-Cent-Bereich erzeugt.

    Auch foto­gra­fi­sche Inhal­te kön­nen so zusam­men­ge­fasst wer­den. „Busi­ness­frau im Büro“ oder „Fuß­gän­ger mit Stadt­plan“ inter­pre­tiert die KI dann aus den Bil­dern. Die drei, vier Stich­wör­ter schickt Ope­nAI zurück an mei­nen Mac, und das Pro­gramm „Keep it Shot“ benennt den zuvor hoch­ge­la­de­nen Screen­shot nach mei­nem gewünsch­ten Mus­ter um. Das Mus­ter lau­tet: „Trans­la­te con­tent to Ger­man with Ger­man umlauts. Add file crea­ti­on timestamp in front of file name.“

    Wer das will, erstellt einen Auto­ma­tis­mus für das Pro­gramm „Keep It Shot“: Es über­wacht dann den Screen­shots-Ord­ner und benennt die Datei­en auto­ma­tisch um. Auch für Win­dows ist eine ent­spre­chen­de Soft­ware in der Mache (ich habe sie nicht ausprobiert).

    Das Schö­ne an dem Screen­shot-Umbe­nen­nungs­dienst ist sei­ne Ver­knüp­fung mit Ope­nAI. Man muss ledig­lich einen API-Schlüs­sel von Ope­nAI hin­ter­le­gen, dann wird für jede Screen­shot-Ana­ly­se GPT‑4 genutzt. Wahl­wei­se kann auch Azu­re Ope­nAI hin­ter­legt wer­den, falls jemand dort Kun­de ist. Die Ver­knüp­fung lässt noch mehr erah­nen: Theo­re­tisch wäre an die­ser Stel­le eine Ver­knüp­fung mit einer eige­nen KI auf dem eige­nen Rech­ner mög­lich. Dann ver­lie­ße kein Screen­shot mehr das eige­ne Haus. Und wie die Ent­wick­lung zeigt, wer­den eige­ne KIs und Open-Source-Anwen­dun­gen aus die­sem Bereich immer leistungsfähiger.

    Ich ahne, was Apple und gewiss auch Micro­soft dem­nächst in ihren Sys­te­men noch tie­fer ein­bau­en. Die Bild­ana­ly­se mit Stich­wör­tern ist schon heu­te in Micro­soft Word für Bild­un­ter­schrif­ten hin­ter­legt. Da wäre es doch ein Klacks, wenn das künf­tig auch für Screen­shots funk­tio­niert. Ganz zu schwei­gen von den unse­li­gen IMG_01234-Dateien.

    Auf Apple-Rech­nern funk­tio­niert schon heu­te eine Kate­go­ri­sie­rung von Fotos nach ihren gezeig­ten Inhal­ten. Im Pro­gramm „Fotos“ wird mitt­ler­wei­le jedes Bild unter­sucht und in Kate­go­rien wie Strand, Wald, Pferd und, und, und ein­sor­tiert, je nach Inhalt. Das erleich­tert das Wie­der­fin­den von Auf­nah­men: Zeig mir das Bild von den Kin­dern am Strand aus 2017. Zusam­men mit der Gesichts­er­ken­nung und den Meta­da­ten wie dem per GPS hin­ter­leg­ten Auf­nah­me­ort wer­den so auch Bil­der­samm­lun­gen mit 60.000 Fotos locker durchsuchbar.

    Man stel­le sich das vor für Spei­cher­ord­ner von Unter­neh­men, Bild­ar­chi­ve, digi­ta­le Mes­sis. Es wird plötz­lich ein leich­tes, jenes eine Bild von der CeBIT vor 20 Jah­ren wie­der­zu­fin­den, auf dem eine Stand­par­ty gemein­sam mit der Kol­le­gin gefei­ert wur­de, die jetzt in den Ruhe­stand geht. Es sind die klei­nen Dinge.