Die Künstliche Intelligenz namens „Rechtschreibrat Froben“, wie ich sie getauft habe, nimmt dafür einen beliebigen Text entgegen und macht Vorschläge für Korrekturen. Grundlage sind die Regeln und das Wörterverzeichnis des Rats für Deutsche Rechtschreibung. Das vor ein paar Tagen veröffentlichte Werk kommt auf 348 Seiten. Es steht unter der Creative-Commons-Lizenz 4.0 (CC BY 4.0). „Eine verbindliche Umsetzung in den Schulen soll spätestens zum Schuljahr 2027⁄28 erfolgen“, teilte die Kultusministerkonferenz am vergangenen Freitag mit. Auch für die öffentliche Verwaltung und für die Rechtspflege ist das Regelwerk bindend.
Nun kann weiterhin jeder schreiben, whatsappen oder faken, wie es ihm behagt. Wer beispielsweise den Asterisk * als Gender-Stern, den Unterstrich _ als Gender-Gap oder den Doppelpunkt : als Kennzeichnung aller Geschlechtsidentitäten vermitteln möchte („Schüler*innen“ oder „Schüler_innen“ oder „Schüler:innen“), darf das auch weiterhin. Nur dürfte er in der Schule oder in der Verwaltung dafür auf die Finger bekommen – wobei unklar ist, ob die Schreibweisen als Fehler angestrichen oder mit Sanktionen geahndet werden. Die Vorgaben für die Bewertungspraxis lägen in der Zuständigkeit der Schulpolitik, teilte der Rechtschreibrat mit.
Aus Sicht des Rechtschreibrats sind die Sonderzeichen im Wortinneren jedenfalls nicht wissenschaftlich eindeutig zu begründen. Gleichwohl beobachtet er eine Zunahme solcher Schreibungen. Andere Schreibweisen hat der Rat dagegen getilgt – etwa den Jogurt ohne h und die Polonäse wegen des ä.
Im Zweifel kann man nun dem GPT Froben seinen Text vorlegen. Die KI ist beauftragt, sich streng an das Regelwerk zu halten. In der Praxis ergänzt sie allerdings schon mal abweichende Schreibweisen aus dem Duden, die offensichtlich als Weltwissen bei ChatGPT nicht ganz ausschaltbar sind. Eine hundertprozentige Genauigkeit beherrscht, warum auch immer, die KI nicht.
In Perplexity ist es seit vergangenem Donnerstag möglich, eigene Seiten einzurichten. „Kuratiert von marcusschwarze“, steht dann darüber. Doch in Wahrheit unternimmt Perplexity die Zusammenstellung. Zu einem beliebigen Thema schnappt sich die Maschine öffentlich zugängliche Informationen. Ich habe es mit den Nachwirkungen auf das Rassismus-Video von Sylt ausprobiert. Innerhalb von Sekunden hat die KI nahezu alles zusammengetragen, was man dazu wissen muss; die Reaktionen aus der Politik, Auswirkungen auf Betroffene (wobei die Maschine die diskriminierten Personen meint, nicht die im Video sichtbaren Grölheinis), die Rolle der sozialen Medien und die Konsequenzen für die Partygäste. Illustriert wird das Thema mit einem Screenshot eines YouTube-Videos des NDR.
Wer sich als Redaktion ernsthaft mit dem Thema befasst, hat so ohne Weiteres die nötigen Informationen. Immerhin verlinkt Perplexity auf dieser Seite die jeweils genutzten Quellen, von „Süddeutscher Zeitung“ bis Tagesschau. Dass hierbei auch die „Junge Freiheit“ als Sprachrohr der „Neuen Rechten“ vorkommt, zeigt die Unbedarftheit der KI.
Auch an anderer Stelle macht Perplexity Bedenkliches. In einer kuratierten Seite über mein Lieblingsthema KI zitiert sie aus einem Text, der eigentlich hinter der Bezahlschranke des Mediums steht. Wo menschliche Leser zum Abschluss eines Abos aufgefordert werden, holt sich die KI den Inhalt aus dem Quelltext der Seite. Vermutlich werden einige Betreiber von Content-Management-Systemen ihre Bezahlschranken umprogrammieren müssen, damit sie die Inhalte nicht im Quelltext preisgeben.
Verstörend ist die Leichtigkeit, mit der die Maschine die Themen abarbeitet. In einer Rubrik „Entdecken“ zeigt Perplexity die wichtigsten Themen der vergangenen Tage: den Sieg von Real Madrid in der Champions League, einen neuen Streamingdienst für KI-Inhalte, den Startabbruch einer Nasa-Rakete. Das sind Themen, die ein „Perplexity-Team“ eingestellt hat. Wer will, stellt sich auf gleiche Weise die Top-Kochbücher für 2024 zusammen oder die Top Zehn der YouTuber.
Das ist alles nur geklaut, was die KI hier als „eigene“ Inhalte auswirft. Der eine und die andere wird eventuell als verlinkte Quelle einige Klicks abbekommen, doch dürfte vielen die handliche Übersicht reichen.
Wie Journalismus mittelfristig zu finanzieren ist, bleibt unklar. Die aufwendige Recherche einer klassischen Redaktion wird die KI wahrscheinlich weiterhin nicht ersetzen. An dieser Nachrichtenaufbereitung verdient zurzeit nur Perplexity: Der Pro-Dienst kostet 20 Dollar im Monat. Dahinter stehen als Investoren unter anderem Jeff Bezos, der Gründer von Amazon, und Nvidia, der Hersteller von Grafikkarten für PCs. Freilich hat Perplexity auch Kosten durch solche Seiten und die Aufbereitung der Texte durch KI-Maschinen. Zum Einsatz kommen wahlweise ein eigenes Perplexity-Modell oder die KI-Dienste GPT-4o oder GPT‑4 Turbo von OpenAI sowie Claude 3 von Anthropics.
„Marcus’s AI Notetaker“ hieß dieser Teilnehmer. Seine Videokamera und das Mikrofon waren ausgeschaltet. Lustig, dachte ich mir, da nutzt also ein anderer Teilnehmer mit meinem Namen das gleiche Konferenzprotokollprogramm, das ich vor ein paar Tagen ausprobiert hatte. „tl;dv“ heißt die Software: Sie klinkt sich in Videokonferenzen ein, zeichnet alles auf, verschriftlicht das Gesagte und fasst die Beschlüsse zusammen. Das klappte in einem Test mit einem eingeweihten Gesprächspartner sehr gut.
Kurzes Handgemenge
In diesem virtuellen Stammtisch aber galt die Regel: Nichts wird aufgezeichnet. Also thematisierten wir „Marcus’s AI Notetaker“ und wurden uns schnell einig. Der KI-Bursche sollte die Runde verlassen. Doch schwörte der andere Marcus in der Runde, aus irgendwo in Norddeutschland, Stein und Bein: Er habe lediglich die Untertitelungsfunktion der Konferenzsoftware Zoom eingeschaltet. Und tatsächlich wurde alles Gesagte nahezu live vom „Zoom“-Konferenzprogramm vertextet. Ausschalten ließ sich die Funktion im Nachhinein nicht mehr. Kurzes Handgemenge mit mir, dem anderen Marcus aus Koblenz: Das ist eine andere KI als dieser mysteriöse Teilnehmer.
Und plötzlich ging mir ein Licht auf: Verdammt, der KI-Schnüffler kam aus meinem eigenen Rechner! Hektische Mausbewegungen, auf dem Mac durchsuchte ich die Einstellungen von „tl;dv“. Doch ließ sich der digitale Geselle nur für künftige Videokonferenzen stoppen, nicht für die laufende. Auch der Gastgeberin des KI-Stammtischs waren die Hände gebunden: Sie konnte den ungewünschten Teilnehmer nicht einfach aus der Runde kicken. Denn eingeladen hatte jemand anders, der heute nicht anwesend war. Wir waren alle nur Gäste an diesem Tisch, die Administration verloren gegangen oder zumindest unauffindbar.
Man spricht anders
So plauderten wir leicht amüsiert weiter, nichts war groß geheim. „Wer nichts zu verbergen hat, hat auch nichts zu befürchten“, lautet ein geflügeltes Wort; an das ich allerdings nicht glaube, Vorratsdatenspeicherung hin, Verfassungsgerichtsurteile her. So meinte ich auch hier zu bemerken: Man spricht anders unter Beobachtung, und sei es durch eine Maschine.
Tatsächlich ließ sich die laufende Aufnahme auch nicht in meinem Webkonto des KI-Protokollanten abstellen. Mir fiel ein, dass ich ihn mit meinem Kalender verknüpft hatte, und irgendwo war ein Haken gesetzt, dass er an „allen“ Treffen teilnehmen sollte. Wer denkt sich so etwas aus? Rückwirkend und fürs laufende Treffen war die Maschine nicht zu stoppen.
Die Katze mischt mit
Tatsächlich lieferte der Dienst Sekunden nach dem Stammtisch den Wortlaut alles Gesagten. Dazu gehörten unsere Diskussionen über die scheinbar unabschaltbare Untertitelfunktion und den zusätzlich mithörenden KI-Gesellen sowie Bemerkungen über eine Katze, die bei einer Teilnehmerin über die Tastatur huschte.
Flugs löschte ich die illegalen Aufzeichnungen, den Wortlaut und die Zusammenfassung, und stoppte das Programm auf meinem Rechner.
Als ich Tage später den Computer einmal neu starten musste, war „tl;dv“ wieder präsent. Die Software musste auch aus dem Startordner meines Macs gelöscht werden. Und zusätzlich war der Zugriff auf meinen Kalender aus der Serversoftware der Anwendung zu entfernen.
Ich habe mich da nun komplett gelöscht. Wir sind alle verloren, wenn wir die Kontrolle über die Maschinen verlieren.
Leider waren die ersten Ergebnisse ernüchternd. Doch jetzt, im Frühjahr 2024, macht es die KI deutlich besser. Die KIs werden ständig weiterentwickelt, neu trainiert, die Algorithmen verstehen besser, was ein Mensch im Chat erfragt. Und entsprechend angeleitet und eingestellt, halluzinieren die Bots weniger, erfinden seltener Dinge hinzu. Eine KI bringt zunächst ihr vom Hersteller antrainiertes Weltwissen mit. Was ihr fehlt, ist Spezialwissen für bestimmte Zwecke.
Wissenslücken: Spezialisieren und anpassen
Zum Beispiel zu Förderverfahren. Wer die Häufig gestellten Fragen (FAQ) zum Wiederaufbau in Rheinland-Pfalz ausdruckt, bekommt allein bei den Informationen für Privatpersonen an die 42 DIN-A4-Seiten. Das wäre viel Lektüre – und eine gute Sammlung für einen Chatbot, der das Dokument komplett erfasst und Fragen dazu beantwortet. Zum Beispiel zu der Frage, wie man als Betroffener Geld beantragen kann und welche Voraussetzungen gelten, um eine Förderung zu bekommen. 15 Milliarden Euro stehen in Rheinland-Pfalz zur Verfügung. Damit alles gerecht und mit rechten Dingen zugeht, gelten Regeln für vorzulegende Nachweise, Fristen und Grenzen.
Ernüchternde Anfänge: Fehler einräumen
Die ersten Tests der Entwicklungsagentur vor einem Jahr mit KI-Systemen waren ernüchternd. Bei Diensten wie MyAskAI und Dante AI konnten wir zwar die FAQ hinterlegen. Doch die Antworten der anschließend bereitgestellten Chatbots, die man in eine Webseite hätte einbauen können, waren fehlerhaft. Mal erfand die Maschine Obergrenzen, die in den FAQ nicht genannt waren, mal verrechnete sie sich, wenn für einen sechsköpfigen Haushalt der zerstörte Hausrat ersetzt werden sollte.
Da ist etwa in den FAQ für den Ersatz von Hausrat ausdrücklich von 13.000 Euro für die erste im Haushalt gemeldete Person die Rede, 8.500 Euro für die zweite Person und 3.500 Euro für jede weitere Person. Bei sechs Leuten ergibt das 35.500 Euro – und die KI errechnete stattdessen mal 32.000 Euro, mal 28.500 Euro. Für eine „offizielle“ KI, waren und sind solche Rechenfehler intolerabel, selbst wenn man dazu schreibt, dass die KI fehlerhafte Antworten liefern kann.
Fortschritt messen: Präziser antworten
In den vergangenen Monaten hat sich die KI stark weiterentwickelt. Die Qualität der Antworten wurde vielfach verbessert. Zwar ist ChatGPT weiterhin eine „Black Box“, aus der für Außenstehende nicht ersichtlich ist, wie sie auf ihre Antworten kommt. Doch ergeben sich in vielen Versuchen neuerdings präzisere und zunehmend fehlerfreie Ergebnisse. So auch bei unserem experimentellen „WiederaufbauGPT“.
Dialoge testen: Umgangssprache verstehen
„Mein Haus ist hin. Wie viel Kohle gibt’s?“ So burschikos und umgangssprachlich lautet seit Jahr und Tag unsere Einstiegsfrage beim Testen diverser KIs im Zusammenspiel mit den FAQ. Das Ergebnis nennt heute, im Frühjahr 2024, richtigerweise die Fördersätze für den Ersatz vom verlorenen Hausrat und die bis zu 80 Prozent hohe Förderung für den Wiederaufbau eines zerstörten Hauses.
Interessant werden Antworten im weiteren Verlauf: Auf fiktive Neubaukosten von 500.000 Euro berechnet die KI richtigerweise aus den bis zu 80 Prozent Fördergeld eine Summe von 400.000 Euro. Bei sechs gemeldeten Personen im Haushalt kommt die KI zusätzlich für den Hausrat auf 35.500 Euro. Und selbst bei dem ausgedachten Ereignis, dass einen Monat nach der Katastrophe Zwillinge geboren wurden, zählt die Maschine eins und eins zusammen: Eine Bestimmung besagt, dass jüngere Kinder hinzuzurechnen sind, sofern sie vor dem 15. Januar 2022 geboren wurden.
Unterm Strich ergeben sich durch solche präziseren KIs vielfältige Möglichkeiten fürs Übersetzen von Bestimmungen und Verfahrensregeln.
Zugangsbarrieren: Kosten aufdecken
Getrübt wird diese Einschätzung allerdings durch die Geschäftsmodelle der amerikanischen KI-Dienste. Der oben verlinkte Chat ist zwar zum Nachlesen frei zugänglich; wer diese spezialisierte WiederaufbauGPT-KI einmal selbst ausprobieren wollte, müsste Abonnent des kostenpflichtigen ChatGPT‑4 sein. Die Kosten betragen 20 US-Dollar im Monat. Dann steht die WiederaufbauGPT-KI unter der Adresse https://chat.openai.com/g/g‑JeZDrcxUE-wiederaufbaugpt zur Verfügung. Achtung, die Anwendung ist weiterhin nur experimentell; die FAQ werden immer mal wieder ergänzt, in unserem Test-Bot allerdings nicht aktualisiert. Es bleibt ein Test.
Technische Hürden: Integration ermöglichen
Das Unternehmen OpenAI bietet für die auf seiner Webseite angebotenen KI-Dienste keine Mechanik an, den bereitgestellten Chatbot auf einer fremden Webseite wie wiederaufbau.rlp.de einzubauen. Das allerdings wäre eine wichtige Voraussetzung für die Nutzung dieser KI. Über andere technische Wege, Stichwort API-Anbindung und Hinterlegen von eigenen Trainingsdaten, wäre ein solches Widget möglich – sei es für bestimmte FAQ, gezielt gecrawlte Webseiten-Inhalte und bereitgestellte PDF-Sammlungen.
Zukunftsaussichten: Weiterentwickeln und prüfen
Nötig wird dann auch eine erprobte Nachverfolgung: Wenn ein Bot auf einer Webseite Antworten gibt, sollte er nicht unbeobachtet bleiben. Es braucht Protokolle und nachträgliche Prüfungen. Gegebenenfalls müssen hinterlegte Dokumente aufgrund der gewonnenen Erfahrung anders formuliert werden. Doch wenn sich die KIs so weiterentwickeln wie in den vergangenen Monaten, ergeben sich vielseitige neue Bots, die sich seltener als bisher verrechnen oder Falschauskünfte geben. Die Tests und Bewertungen der Ergebnisse gehen weiter.
Sie fragt also bei der Alten (Tschuldigung) nach monatlichen Daueraufträgen und regelmäßigen Überweisungen, kontaktiert eigenständig jeden Geschäftspartner und teilt ihm die neue Bankverbindung mit. Zur Belohnung gibt’s 50 Euro extra Guthaben auf dem neuen Konto. Und eine ziemlich gut gemachte App fürs Handy.
Läuft alles wie geschmiert. Bis auf eine Ausnahme. Das Finanzamt.
Das Amt schickt ein Blatt Papier. Zum Ausfüllen. Mitsamt Adresse, Geburtsdatum, Steuernummer, Steuer-ID, einem Feld für die händische Unterschrift. Alles natürlich nicht vorausgefüllt.
Kann doch nicht sein, denke ich: Es gibt Elster, die elektronische Verbindung zum Finanzamt. Das Zertifikat zum Einwählen dort aus 2019 funktioniert noch immer, mittlerweile gibt es außerdem Elster Secure, dann klappt’s auch durch Scannen eines QR-Codes auf dem Handy. Und es gibt MeinElster+, irgendwas für die Belege, aber nicht die künftigen Lastschriften.
Kurze Suche nach dem SEPA-Lastschriftmandat bei Elster: 77 Treffer! Donnerwetter.
Keiner der Treffer erlaubt die Eingabe des neuen Lastschriftmandats für Privatpersonen. Dann der Lichtblick: Bankverbindung ändern! Und die Ernüchterung: „Bitte denken Sie daran, ein SEPA-Lastschriftmandat zu erteilen. Dies kann aus rechtlichen Gründen derzeit noch nicht über Mein ELSTER angeboten werden.“
Also fülle ich wie vor 20 Jahren ein Papier aus. Verzähle mich bei der Anzahl von Nullen in der neuen IBAN, weswegen erstmals seit 2003 ein Ding namens Tipp-Ex zum Einsatz kommt. Die Chemieindustrie hat bei der Haltbarkeit dieser Korrigiertinktur tolle Dienste geleistet.
Und ich stelle mir vor, wie jemand im Finanzamt dieses Papier aus dem Umschlag nimmt, sich über die Sauklaue von dem Herrn Schwarze ärgert, weil nun schwer lesbar ist, ob in den winzigen Ausfüllfeldern eine 6 oder eine 0 geschrieben ist.
Noch immer ungläubig über dieses Verfahren, google ich etwas weiter, kann mir einfach nicht vorstellen, dass eine bundes- oder landesweit agierende Behörde solch ein Standarddokument nicht auch digital anbietet. Und tatsächlich: Mein Bundesland Rheinland-Pfalz bietet es auch digital.
Zum Ausfüllen am Bildschirm. Und dann zum Ausdrucken und händischen Unterschreiben.
Nun suche ich bei Elster eine Möglichkeit, das eingescannte Formular mitsamt der Unterschrift digital zu übermitteln. Den Menüpunkt habe ich nicht gefunden.
Da hat etwa eine Gruppe von Wissenschaftlerinnen und Wissenschaftlern eine 55-seitige Broschüre zusammengestellt. Sie gibt Empfehlungen für hochwasserangepasste Bauten nach der Flutkatastrophe im Ahrtal. In dem Dokument findet sich eine Grafik mit mehreren Brücken.
Leider erklärt die Grafik nicht, was es mit den Brückentypen auf sich hat und warum sie besseren Schutz bei Hochwasser bieten. Die KI kann das. Über meinen bevorzugten Dienst TypingMind mit Anschlüssen an KIs wie GPT‑4 Vision erstellt die Maschine eine ausführliche Beschreibung:
Das Bild zeigt ein Schema für hochwasserangepasste Brückenbauweisen, wie es in der Quelle „Burghardt et al, 2022“ dargestellt wird. Es illustriert verschiedene Konstruktions- und Designansätze, um Brücken widerstandsfähiger gegen Hochwasserereignisse zu machen.
Im oberen Teil des Schemas sind verschiedene Überbauarten dargestellt:
Abflussquerschnitt: Links sehen wir eine Brücke mit einem vergrößerten Abflussquerschnitt, was den Wasserfluss unter der Brücke erleichtert.
Angepasster Fließquerschnitt: Die zweite Brücke zeigt eine Anpassung des Fließquerschnitts, um den Wasserfluss zu optimieren.
Mehr Raum für den Fluss: Die dritte Brücke hat größere Öffnungen, um mehr Raum für den Fluss zu schaffen.
Darunter sind spezielle Brückentypen zu sehen:
Hubbrücke: Eine Brücke, die sich für den Schiffsverkehr anheben lässt.
Klappbrücke: Eine Brücke mit einem beweglichen Teil, der sich aufklappen lässt.
Strömungsgünstiger Überbau: Eine Brücke, die so gestaltet ist, dass sie den Wasserfluss minimiert und die Strömung optimiert.
Im mittleren Teil werden Pfeilerformen und deren Einfluss auf den Wasserfluss thematisiert:
Pfeiler: Es werden zwei Pfeilerformen gezeigt, die den Wasserwiderstand minimieren sollen, mit Strömungswiderstandskoeffizienten von 0,6−0,8 bzw. 0,65−0,76.
Im unteren Teil des Schemas geht es um die Bemessung und den Schutz der Brücken:
Zusätzliche Bemessungslasten: Hier wird gezeigt, wie zusätzliche Lasten in die Bemessung einfließen können, um die Struktur zu stärken.
Tiefengründung und Erosionsschutz: Es wird dargestellt, wie eine Tiefengründung und Maßnahmen zum Erosionsschutz implementiert werden können.
Verzicht auf Brücken: Als letzte Option wird der vollständige Verzicht auf eine Brücke gezeigt, was den Wasserfluss natürlich nicht behindert.
Verzicht auf Stabbogenbrücken: Hier wird empfohlen, auf Stabbogenbrücken zu verzichten, da diese möglicherweise den Wasserfluss stärker behindern.
Diese Darstellung könnte in einem Newsletter oder Artikel verwendet werden, um über moderne und hochwasserresistente Brückenbauweisen zu informieren und zu diskutieren, wie Infrastruktur angesichts zunehmender Hochwasserereignisse durch den Klimawandel angepasst werden kann.
Das ist doch schon wesentlich besser erklärt. Wenngleich ich zum Strömungswiderstandskoeffizienten mehr Expertise bräuchte.
KI analysiert Schreibstil
Das funktioniert oft auch mit Screenshots von Social-Media-Beiträgen. Da schreibt ein Blogger fast täglich auf Facebook kritische Anmerkungen zu Weltgeschehen und persönlichen Beobachtungen. Ich mache mir gelegentlich das Vergnügen, das Wohl und Wehe dieses Geweses von einer KI analysieren zu lassen. Drei Screenshots und eine Anfrage bei Claude 3 Opus später steht das Urteil der Maschine fest:
„Der Autor verwendet definitiv keine Sprezzatura in seinem Schreibstil. Im Gegenteil. Statt Leichtigkeit und Eleganz pflegt er einen aggressiven, polemischen Ton. Seine Meinungen und Wertungen trägt er unverhohlen zur Schau. Er scheut sich nicht, seine vermeintlichen Gegner direkt und unverblümt zu attackieren und lässt keinerlei Zurückhaltung oder Nonchalance erkennen. Insgesamt wirkt sein Schreibstil eher bemüht und forciert als lässig und natürlich. Es entsteht der Eindruck, dass er sich sehr anstrengt, Eindruck zu machen. Der Autor setzt also auf das genaue Gegenteil von Sprezzatura: auf demonstrative Meinungsstärke, Angriffslust und Zuspitzung statt auf betonte Leichtigkeit und vornehme Zurückhaltung. Sein Stil ist das Gegenteil von ‚lässiger Eleganz‘.“
Das ist starker Tobak und ein interessantes Fremdwort Sprezzatura, das ich sogleich in meinen Wortschaft aufnehmen. Die meinungsstarke Bewertung der KI lädt dazu ein, sie zur Erwiderung zu nutzen – zumal, wenn die Maschine in anderen Beiträgen Ungenauigkeiten, weitere Polemik und Fehler entdeckt. Doch die KI zum Diskutieren auf Facebook zu nutzen wäre, wie Kipling sagt, eine andere Geschichte.
Mathematische Rätsel
Weniger kritisch ist die KI bei mathematischen Aufgaben. Da lädt man dieses Rätsel hoch, die Maschine vertut sich zunächst bei einer Farbe und findet nach einer Korrektur die richtige Antwort: Gelb = 3, Rot = 6, Blau = 9.
Etwas anspruchsvoller ist dieses Kreuzworträtsel. Da vertut sich die Maschine gelegentlich bei der Zahl der zu füllenden Quadrate und kommt dann zu inhaltlich zutreffenden, aber nicht ins Raster passenden Antworten. Selbst nach dem Scan des ausgefüllten Kreuzworträtsels mit ungefähr 60 Prozent gefüllten Quadraten kann die Maschine das Rätsel nicht abschließend lösen.
Geometrische Knobelaufgabe
Ähnliches erlebte ich kürzlich mit folgendem grafischem Rätsel. Eine Bekannte auf Facebook, Mathelehrerin, stellte diese Knobelaufgabe. Ein Brett liegt schräg in der Schublade. Sie ist 20,5 cm tief (in der Grafik Wert s). Wie lang ist die Strecke x rechts außen?
Sei es GPT‑4 Vision, Claude 3 Opus oder Gemini Pro Vision: Alle drei KIs trafen zutreffende Aussagen über die gezeigten Dreiecke und Winkel. Alle waren stets bemüht. Doch beim Ausrechnen von x kam keine Maschine auf die richtige Lösung. Dabei sind alle nötigen Angaben in der Grafik enthalten.
Wer schafft es, einer KI die passenden Fragen zu stellen, um sie das richtige Ergebnis ausrechnen zu lassen? Hinweise bitte in die Kommentare.
Die Bekannte hat mir die Lösung direkt zukommen lassen. Alle drei Maschinen antworteten darauf sinngemäß: Sie ist richtig. Wie schön!
Der Mensch bleibt noch überlegen
Ein Zeitlang noch, so scheint es zumindest, bleibt der Mensch der Maschine in manchen Belangen überlegen. Nehmen wir das für die verbleibende Zeit mit Sprezzatura.
Da ist zum einen der „Globe Explorer“: eine neuartige Suchmaschine, die Suchvorgänge strukturiert unterteilt, mithilfe von KI baumartig gestaltet und ähnlich wie bei einer Mind Map Zusammenhänge findet. Jeder Begriff wird dabei bebildert, und man ist sofort im Thema. Wer für eine PowerPoint-Präsentation Ideen fürs Bebildern braucht, wird hier schnell fündig. Und bekommt den Blick geweitet.
Gut, die aktuelle Kanzlerin ist mittlerweile ein Mann, die HDI-Arena von Hannover 96 heißt inzwischen anders, und die deutsche Fahne ist gewiss nicht die Kriegsflagge des Norddeutschen Bundes aus dem 19. Jahrhundert. Daten sind teilweise veraltet und falsch. Doch zeigt der Explorer, dass auch für alte Suchmaschinen wie Google neue Darstellungen von Suchergebnissen möglich sind.
Zum zweiten macht eine spezielle KI namens Groq zurzeit die Runde. Sie hat sich öffentlich zugängliche Sprachmodelle wie Llama und Mixtral geschnappt, Open-Source-Modelle also. Das Besondere ist das Tempo, mit dem die KI hier antwortet. Anfragen werden innerhalb von Millisekunden beantwortet. Grund sind spezielle Prozessoren und Systeme, LPUs genannt. Diese „Language Processing Units“ überflügeln herkömmliche Grafikkarten, die bisher für KI-Systeme eingesetzt werden. Das Ergebnis beschleunigt nicht nur Text-KIs, sondern auch Bilder-KIs, Musikgenerierung und mehr. Nicht zu verwechseln ist Groq mit Grok, der KI von X‑Chef Elon Musk.
Und drittens hat eine KI jetzt den Turing-Test bestanden. Ein Team von der University of Michigan und der Stanford University hat einen modifizierten Turing-Test entwickelt und durchgeführt, der zeigt, dass ChatGPT‑4, die KI von OpenAI, Verhaltensweisen und Persönlichkeitsmerkmale aufweist, die von menschlichen nicht zu unterscheiden sind.
Der Turing-Test, benannt nach dem britischen Mathematiker und Computerwissenschaftler Alan Turing (1912–1954), ist ein Maßstab für die Fähigkeit einer Maschine, menschenähnliches Verhalten zu zeigen. Im Gegensatz zu früheren Ansätzen, die sich auf die sprachliche Fähigkeit der KI konzentrierten, untersuchte das Forschungsteam, wie ChatGPT‑4 in einer Reihe von Verhaltensspielen agiert, die darauf ausgelegt sind, menschliche Charakterzüge wie Vertrauen, Fairness, Risikoaversion, Altruismus und Kooperation zu messen.
ChatGPT‑4 verhielt sich in diesen Spielen innerhalb der Bandbreite menschlichen Verhaltens und zeigte sogar Muster, die auf Lernfähigkeit hindeuten. Interessanterweise neigte die KI dazu, kooperativer und altruistischer zu sein als der Durchschnitt der menschlichen Teilnehmer.
Diese Studie zeigt nicht nur, dass KI-Systeme wie ChatGPT‑4 menschliches Verhalten in komplexen sozialen Situationen nachahmen können, sondern auch, dass sie potenziell in der Lage sind, in bestimmten Kontexten „menschlicher als menschlich“ zu agieren.
KI wäre dann nicht nur Werkzeug, sondern Partner in verschiedenen Aspekten des menschlichen Lebens.
Amazon sperrt neue Rezensionen nach „ungewöhnlichen Rezensionsaktivitäten“ bei Anke Engelkes Buch „Die neue Häschenschule“.
Zuvor hatten das „Bayerische Landwirtschaftliche Wochenblatt“ und ein bäuerlicher Influencer auf Facebook Kritik an der angeblich negativen Darstellung von Landwirtschaft an sich und einem Mähdrescher insbesondere geäußert.
Auch ein Fuchs, der anstatt Häschen lieber Möhrchen verspeiste und sich in der Folge mit einigen Häsinnen und Rammlern anfreundete, erzeugte aus Sicht von Kritikern ein gestörtes Weltbild. „Ein Fuchs ist ein Beutegreifer und auch kein Streicheltier“, belehrte ein Rezensent die Komikerin aus Köln, unter der Überschrift „Migration falsch vermittelt“.
In der Story ließ sich unter anderem Hasenmädchen Hoppich aus einem Weizenfeld vor dem herannahenden gefährlichen Mähdrescher retten. Der vegane Fuchs Brehm zog die Häsin aus dem Stroh. „Was hier betrieben wird, ist übelstes Verunglimpfen von Bauern und der Landwirtschaft“, urteilte Rezensentin Heidrun.
In der Folge gab es bereits kurz nach den ersten Diskussionen auf Facebook über das Kinderbuch eine Reihe weiterer 1‑Stern-Bewertungen und Hunderte von Abstimmungen, die diese negativen Rezensionen als hilfreich bewerteten.
Verifizierte Käufe hatte Amazon unter den negativen Bewertungen nicht registriert. Die erste Auflage des „Pamphlets“, wie einer das Buch für Vier- bis Siebenjährige nannte, ist bereits ausverkauft.
Es sind die kleinen Dinge. „Bildschirmfoto 2024-01-21 um 18.07.56.png“ benennt mein Mac einen Screenshot, den ich just zu dieser Zeit gefertigt habe. Was drin steckt, weiß nur ich, sobald ich die Datei öffne.
Neuerdings benennt Künstliche Intelligenz den Dateinamen vollautomatisch um, sobald ich die Datei markiere und das KI-Programm starte. Daraus wird jetzt „20240121_180756_Banking_Transaktionen_Suchergebnisse“. Das Datum der Aufnahme also plus Uhrzeit sowie Stichwörter zum Inhalt. In diesem Fall geht es um einen Screenshot, der eine irreguläre Abbuchung von meinem Kreditkartenkonto enthält, eine Rücküberweisung aufgrund meines Widerspruchs und eine neuerliche Abbuchung. Eine ärgerliche Sache, die es zu dokumentieren gilt.
Die KI unternimmt mittlerweile vollautomatisch diese Änderungen des Dateinamens. „Keep It Shot“ heißt das Programm dafür. Es überwacht im Hintergrund meinen Screenshot-Ordner. Erscheint dort eine neue Datei, lädt es sie zu OpenAI hoch. Dort analysiert die KI die Inhalte des aufgenommenen Bildes. Ist das reiner Text, so wird der in Stichwörtern zusammengefasst. Die Anwendung kostet einmalig 19 Dollar. Plus Zugang zu OpenAI, was Kosten im Milli-Cent-Bereich erzeugt.
Auch fotografische Inhalte können so zusammengefasst werden. „Businessfrau im Büro“ oder „Fußgänger mit Stadtplan“ interpretiert die KI dann aus den Bildern. Die drei, vier Stichwörter schickt OpenAI zurück an meinen Mac, und das Programm „Keep it Shot“ benennt den zuvor hochgeladenen Screenshot nach meinem gewünschten Muster um. Das Muster lautet: „Translate content to German with German umlauts. Add file creation timestamp in front of file name.“
Wer das will, erstellt einen Automatismus für das Programm „Keep It Shot“: Es überwacht dann den Screenshots-Ordner und benennt die Dateien automatisch um. Auch für Windows ist eine entsprechende Software in der Mache (ich habe sie nicht ausprobiert).
Das Schöne an dem Screenshot-Umbenennungsdienst ist seine Verknüpfung mit OpenAI. Man muss lediglich einen API-Schlüssel von OpenAI hinterlegen, dann wird für jede Screenshot-Analyse GPT‑4 genutzt. Wahlweise kann auch Azure OpenAI hinterlegt werden, falls jemand dort Kunde ist. Die Verknüpfung lässt noch mehr erahnen: Theoretisch wäre an dieser Stelle eine Verknüpfung mit einer eigenen KI auf dem eigenen Rechner möglich. Dann verließe kein Screenshot mehr das eigene Haus. Und wie die Entwicklung zeigt, werden eigene KIs und Open-Source-Anwendungen aus diesem Bereich immer leistungsfähiger.
Ich ahne, was Apple und gewiss auch Microsoft demnächst in ihren Systemen noch tiefer einbauen. Die Bildanalyse mit Stichwörtern ist schon heute in Microsoft Word für Bildunterschriften hinterlegt. Da wäre es doch ein Klacks, wenn das künftig auch für Screenshots funktioniert. Ganz zu schweigen von den unseligen IMG_01234-Dateien.
Auf Apple-Rechnern funktioniert schon heute eine Kategorisierung von Fotos nach ihren gezeigten Inhalten. Im Programm „Fotos“ wird mittlerweile jedes Bild untersucht und in Kategorien wie Strand, Wald, Pferd und, und, und einsortiert, je nach Inhalt. Das erleichtert das Wiederfinden von Aufnahmen: Zeig mir das Bild von den Kindern am Strand aus 2017. Zusammen mit der Gesichtserkennung und den Metadaten wie dem per GPS hinterlegten Aufnahmeort werden so auch Bildersammlungen mit 60.000 Fotos locker durchsuchbar.
Man stelle sich das vor für Speicherordner von Unternehmen, Bildarchive, digitale Messis. Es wird plötzlich ein leichtes, jenes eine Bild von der CeBIT vor 20 Jahren wiederzufinden, auf dem eine Standparty gemeinsam mit der Kollegin gefeiert wurde, die jetzt in den Ruhestand geht. Es sind die kleinen Dinge.
Das ist für mich eher der Wikipedia-Moment: Weltweites Wissen wird lokal und transparent zugänglich, und das geschieht nun auch bei den Interpretationen der Künstlichen Intelligenz (KI).
Doch passiert das nicht allein durch vermeintliche Zauberei bei den geschlossenen, uneinsehbaren Modellen wie ChatGPT, Claude oder Google Gemini. Sondern künftig mehr und mehr bei downloadbaren Open-Source-Modellen wie LlaMA vom Facebook-Konzern Meta, Falcon von TII aus den Vereinigten Arabischen Emiraten oder Yi von 01.AI aus China.
Hintergrund ist ein Leistungsvergleich mehrerer Sprachmodelle. Demnach holen die frei zugänglichen bei der Korrektheit ihrer Antworten gegenüber den geschlossenen Modellen auf. Die grüne Trendlinie in der Grafik dürfte bald auf die blaue Trendlinie treffen. Grün sind die Open-Source-Modelle, blau die Closed-Source-Versionen. Die Leistungsfähigkeit wird hier bei der sogenannten MMLU-Performance gemessen. MMLU steht für „Massive Multitasking Language Understanding“ und beinhaltet einen Test für 57 Themen. Demnach gilt GPT‑4 weiterhin als das „beste“ Sprachmodell unter jenen, die keine extra Trainingsdaten enthalten. Das neuere Modell Gemini Ultra von Google rangiert bei diesem Vergleich zwar oberhalb von GPT‑4, doch enthält es extra Trainingsdaten, die speziell auf die Testfragen abgestimmt sein könnten.
In der Praxis kann man sich heute bereits eine eigene KI zusammenstöpseln. Basissoftware ist zum Beispiel GPT4All, das für Windows, macOS und Linux erhältlich ist. Aus der Software heraus lassen sich bereits diverse Sprachmodelle herunterladen, die Namen tragen wie Mistral OpenOrca oder GPT4All Falcon. Auch Metas Llama 2 lässt sich dazu installieren, vorausgesetzt, man akzeptiert deren etwas eigenwillige Open-Source-Lizenz. Die erlaubt auch die kommerzielle Nutzung des Sprachmodells, außer man kommt auf mehr als 700 Millionen monatlich aktive Nutzer. Zudem ist für den Download und den Einbau bei GPT4All neuerdings ein Sprachmodell im sogenannten .gguf-Format notwendig, ältere .bin-Dateien funktionieren nicht mehr.
Vorbote einer personalisierten KI: GPT4All. (Screenshot: Schwarze)
Das zunächst nerdig erscheinende Thema hat auf der Plattform Hugging Face einen weltweiten Marktplatz gefunden. Hier sammelt die KI-Community Open-Source-Bibliotheken und Sprachmodelle. Mehr als 50.000 Organisationen nutzen die Ressourcen von Hugging Face. So können etwa maschinelle Lernprojekte direkt ausprobiert werden. GPT4All ist dabei nur einer von vielen Protagonisten der Szene. Auch Microsoft hat hier Modelle veröffentlicht, etwa Phi‑2 als besonders kleines, aber besonders hochwertiges Modell.
Interessant wird GPT4All als vergleichsweise einfache Anwendung, die auf dem eigenen Rechner genutzt werden kann, aus zweierlei Gründen: Zum einen können private Daten fürs sogenannte Finetuning hinterlegt werden. So habe ich etwa meine eigenen Artikel von GPT4All indexieren lassen. Und kann der persönlichen KI Fragen stellen zu Themen, die ich bereits vor Jahren oder Jahrzehnten beschrieben habe.
Zum zweiten können die gewonnenen Daten in einem sogenannten Open Source Datalake beim Unternehmen Nomic aus New York eingespeist werden. Nomic hat die Anwendung GPT4All bereitgestellt. Hier gilt es freilich, genau zu wissen, was man tut. Die Daten werden unter atlas.nomic.ai öffentlich. Deswegen sind personenbezogene Daten auszuschließen und Geschäftsunterlagen gesondert zu schützen.
Punktwolke aus mehreren Millionen Tweets: Bei Atlas von Nomic lassen sich Millionen Datenpunkte hochladen und später als Basis für eigene Sprachmodelle nutzen. (Screenshot: Schwarze)
Nomic generiert daraus zunächst Punktwolken, beispielsweise aus Millionen von eingespeisten öffentlichen Tweets oder aus Wikipedia-Beiträgen. Und so schließt sich der Kreis: Die Daten können von Nomic, aber auch von anderen dazu verwendet werden, neue Sprachmodelle zu trainieren. Und es lassen sich sowohl öffentliche als auch private Datenpunkte festlegen – letztere für Informationen, die nicht für andere zugänglich sein sollen. Daraus wird letztlich Nomics Geschäftsmodell. Wer Geschäftsunterlagen vor der KI privat halten möchte, muss dafür bei Nomic zahlen.