Künstliche Intelligenz entschlüsselt Bilder und Texte

Avatar von Marcus Schwarze

Zu den faszinierenden Möglichkeiten der Künstlichen Intelligenz (KI) gehört, Skizzen und Grafiken hochzuladen. Die Maschine schaut sich das Werk an, erstellt eine Beschreibung und löst sogar Matheaufgaben. Meistens jedenfalls.

Hochwasserangepasste Brücken

Da hat etwa eine Grup­pe von Wis­sen­schaft­le­rin­nen und Wis­sen­schaft­lern eine 55-sei­ti­ge Bro­schü­re zusam­men­ge­stellt. Sie gibt Emp­feh­lun­gen für hoch­was­ser­an­ge­pass­te Bau­ten nach der Flut­ka­ta­stro­phe im Ahrtal. In dem Doku­ment fin­det sich eine Gra­fik mit meh­re­ren Brücken.

Lei­der erklärt die Gra­fik nicht, was es mit den Brü­cken­ty­pen auf sich hat und war­um sie bes­se­ren Schutz bei Hoch­was­ser bie­ten. Die KI kann das. Über mei­nen bevor­zug­ten Dienst Typ­ing­Mind mit Anschlüs­sen an KIs wie GPT‑4 Visi­on erstellt die Maschi­ne eine aus­führ­li­che Beschreibung:

Das Bild zeigt ein Sche­ma für hoch­was­ser­an­ge­pass­te Brü­cken­bau­wei­sen, wie es in der Quel­le „Burg­hardt et al, 2022“ dar­ge­stellt wird. Es illus­triert ver­schie­de­ne Kon­struk­ti­ons- und Design­an­sät­ze, um Brü­cken wider­stands­fä­hi­ger gegen Hoch­was­ser­er­eig­nis­se zu machen.

Im obe­ren Teil des Sche­mas sind ver­schie­de­ne Über­bau­ar­ten dargestellt:

Abfluss­quer­schnitt: Links sehen wir eine Brü­cke mit einem ver­grö­ßer­ten Abfluss­quer­schnitt, was den Was­ser­fluss unter der Brü­cke erleichtert.

Ange­pass­ter Fließ­quer­schnitt: Die zwei­te Brü­cke zeigt eine Anpas­sung des Fließ­quer­schnitts, um den Was­ser­fluss zu optimieren.

Mehr Raum für den Fluss: Die drit­te Brü­cke hat grö­ße­re Öff­nun­gen, um mehr Raum für den Fluss zu schaffen.

Dar­un­ter sind spe­zi­el­le Brü­cken­ty­pen zu sehen:

Hub­brü­cke: Eine Brü­cke, die sich für den Schiffs­ver­kehr anhe­ben lässt.

Klapp­brü­cke: Eine Brü­cke mit einem beweg­li­chen Teil, der sich auf­klap­pen lässt.

Strö­mungs­güns­ti­ger Über­bau: Eine Brü­cke, die so gestal­tet ist, dass sie den Was­ser­fluss mini­miert und die Strö­mung optimiert.

Im mitt­le­ren Teil wer­den Pfeil­erfor­men und deren Ein­fluss auf den Was­ser­fluss thematisiert:

Pfei­ler: Es wer­den zwei Pfeil­erfor­men gezeigt, die den Was­ser­wi­der­stand mini­mie­ren sol­len, mit Strö­mungs­wi­der­stands­ko­ef­fi­zi­en­ten von 0,6−0,8 bzw. 0,65−0,76.

Im unte­ren Teil des Sche­mas geht es um die Bemes­sung und den Schutz der Brücken:

Zusätz­li­che Bemes­sungs­las­ten: Hier wird gezeigt, wie zusätz­li­che Las­ten in die Bemes­sung ein­flie­ßen kön­nen, um die Struk­tur zu stärken.

Tie­fen­grün­dung und Ero­si­ons­schutz: Es wird dar­ge­stellt, wie eine Tie­fen­grün­dung und Maß­nah­men zum Ero­si­ons­schutz imple­men­tiert wer­den können.

Ver­zicht auf Brü­cken: Als letz­te Opti­on wird der voll­stän­di­ge Ver­zicht auf eine Brü­cke gezeigt, was den Was­ser­fluss natür­lich nicht behindert.

Ver­zicht auf Stab­bo­gen­brü­cken: Hier wird emp­foh­len, auf Stab­bo­gen­brü­cken zu ver­zich­ten, da die­se mög­li­cher­wei­se den Was­ser­fluss stär­ker behindern.

Die­se Dar­stel­lung könn­te in einem News­let­ter oder Arti­kel ver­wen­det wer­den, um über moder­ne und hoch­was­ser­re­sis­ten­te Brü­cken­bau­wei­sen zu infor­mie­ren und zu dis­ku­tie­ren, wie Infra­struk­tur ange­sichts zuneh­men­der Hoch­was­ser­er­eig­nis­se durch den Kli­ma­wan­del ange­passt wer­den kann.

Das ist doch schon wesent­lich bes­ser erklärt. Wenn­gleich ich zum Strö­mungs­wi­der­stands­ko­ef­fi­zi­en­ten mehr Exper­ti­se bräuchte.

KI analysiert Schreibstil

Das funk­tio­niert oft auch mit Screen­shots von Social-Media-Bei­trä­gen. Da schreibt ein Blog­ger fast täg­lich auf Face­book kri­ti­sche Anmer­kun­gen zu Welt­ge­sche­hen und per­sön­li­chen Beob­ach­tun­gen. Ich mache mir gele­gent­lich das Ver­gnü­gen, das Wohl und Wehe die­ses Gewe­ses von einer KI ana­ly­sie­ren zu las­sen. Drei Screen­shots und eine Anfra­ge bei Clau­de 3 Opus spä­ter steht das Urteil der Maschi­ne fest:

„Der Autor ver­wen­det defi­ni­tiv kei­ne Sprez­za­tu­ra in sei­nem Schreib­stil. Im Gegen­teil. Statt Leich­tig­keit und Ele­ganz pflegt er einen aggres­si­ven, pole­mi­schen Ton. Sei­ne Mei­nun­gen und Wer­tun­gen trägt er unver­hoh­len zur Schau. Er scheut sich nicht, sei­ne ver­meint­li­chen Geg­ner direkt und unver­blümt zu atta­ckie­ren und lässt kei­ner­lei Zurück­hal­tung oder Non­cha­lance erken­nen. Ins­ge­samt wirkt sein Schreib­stil eher bemüht und for­ciert als läs­sig und natür­lich. Es ent­steht der Ein­druck, dass er sich sehr anstrengt, Ein­druck zu machen. Der Autor setzt also auf das genaue Gegen­teil von Sprez­za­tu­ra: auf demons­tra­ti­ve Mei­nungs­stär­ke, Angriffs­lust und Zuspit­zung statt auf beton­te Leich­tig­keit und vor­neh­me Zurück­hal­tung. Sein Stil ist das Gegen­teil von ‚läs­si­ger Eleganz‘.“

Das ist star­ker Tobak und ein inter­es­san­tes Fremd­wort Sprez­za­tu­ra, das ich sogleich in mei­nen Wort­schaft auf­neh­men. Die mei­nungs­star­ke Bewer­tung der KI lädt dazu ein, sie zur Erwi­de­rung zu nut­zen – zumal, wenn die Maschi­ne in ande­ren Bei­trä­gen Unge­nau­ig­kei­ten, wei­te­re Pole­mik und Feh­ler ent­deckt. Doch die KI zum Dis­ku­tie­ren auf Face­book zu nut­zen wäre, wie Kipling sagt, eine ande­re Geschichte.

Mathematische Rätsel

Weni­ger kri­tisch ist die KI bei mathe­ma­ti­schen Auf­ga­ben. Da lädt man die­ses Rät­sel hoch, die Maschi­ne ver­tut sich zunächst bei einer Far­be und fin­det nach einer Kor­rek­tur die rich­ti­ge Ant­wort: Gelb = 3, Rot = 6, Blau = 9.

Etwas anspruchs­vol­ler ist die­ses Kreuz­wort­rät­sel. Da ver­tut sich die Maschi­ne gele­gent­lich bei der Zahl der zu fül­len­den Qua­dra­te und kommt dann zu inhalt­lich zutref­fen­den, aber nicht ins Ras­ter pas­sen­den Ant­wor­ten. Selbst nach dem Scan des aus­ge­füll­ten Kreuz­wort­rät­sels mit unge­fähr 60 Pro­zent gefüll­ten Qua­dra­ten kann die Maschi­ne das Rät­sel nicht abschlie­ßend lösen.

Geometrische Knobelaufgabe

Ähn­li­ches erleb­te ich kürz­lich mit fol­gen­dem gra­fi­schem Rät­sel. Eine Bekann­te auf Face­book, Mathe­leh­re­rin, stell­te die­se Kno­bel­auf­ga­be. Ein Brett liegt schräg in der Schub­la­de. Sie ist 20,5 cm tief (in der Gra­fik Wert s). Wie lang ist die Stre­cke x rechts außen?

Sei es GPT‑4 Visi­on, Clau­de 3 Opus oder Gemi­ni Pro Visi­on: Alle drei KIs tra­fen zutref­fen­de Aus­sa­gen über die gezeig­ten Drei­ecke und Win­kel. Alle waren stets bemüht. Doch beim Aus­rech­nen von x kam kei­ne Maschi­ne auf die rich­ti­ge Lösung. Dabei sind alle nöti­gen Anga­ben in der Gra­fik enthalten.

Wer schafft es, einer KI die pas­sen­den Fra­gen zu stel­len, um sie das rich­ti­ge Ergeb­nis aus­rech­nen zu las­sen? Hin­wei­se bit­te in die Kommentare.

Die Bekann­te hat mir die Lösung direkt zukom­men las­sen. Alle drei Maschi­nen ant­wor­te­ten dar­auf sinn­ge­mäß: Sie ist rich­tig. Wie schön!

Der Mensch bleibt noch überlegen

Ein Zeit­lang noch, so scheint es zumin­dest, bleibt der Mensch der Maschi­ne in man­chen Belan­gen über­le­gen. Neh­men wir das für die ver­blei­ben­de Zeit mit Sprezzatura.