In Perplexity ist es seit vergangenem Donnerstag möglich, eigene Seiten einzurichten. „Kuratiert von marcusschwarze“, steht dann darüber. Doch in Wahrheit unternimmt Perplexity die Zusammenstellung. Zu einem beliebigen Thema schnappt sich die Maschine öffentlich zugängliche Informationen. Ich habe es mit den Nachwirkungen auf das Rassismus-Video von Sylt ausprobiert. Innerhalb von Sekunden hat die KI nahezu alles zusammengetragen, was man dazu wissen muss; die Reaktionen aus der Politik, Auswirkungen auf Betroffene (wobei die Maschine die diskriminierten Personen meint, nicht die im Video sichtbaren Grölheinis), die Rolle der sozialen Medien und die Konsequenzen für die Partygäste. Illustriert wird das Thema mit einem Screenshot eines YouTube-Videos des NDR.
Wer sich als Redaktion ernsthaft mit dem Thema befasst, hat so ohne Weiteres die nötigen Informationen. Immerhin verlinkt Perplexity auf dieser Seite die jeweils genutzten Quellen, von „Süddeutscher Zeitung“ bis Tagesschau. Dass hierbei auch die „Junge Freiheit“ als Sprachrohr der „Neuen Rechten“ vorkommt, zeigt die Unbedarftheit der KI.
Auch an anderer Stelle macht Perplexity Bedenkliches. In einer kuratierten Seite über mein Lieblingsthema KI zitiert sie aus einem Text, der eigentlich hinter der Bezahlschranke des Mediums steht. Wo menschliche Leser zum Abschluss eines Abos aufgefordert werden, holt sich die KI den Inhalt aus dem Quelltext der Seite. Vermutlich werden einige Betreiber von Content-Management-Systemen ihre Bezahlschranken umprogrammieren müssen, damit sie die Inhalte nicht im Quelltext preisgeben.
Verstörend ist die Leichtigkeit, mit der die Maschine die Themen abarbeitet. In einer Rubrik „Entdecken“ zeigt Perplexity die wichtigsten Themen der vergangenen Tage: den Sieg von Real Madrid in der Champions League, einen neuen Streamingdienst für KI-Inhalte, den Startabbruch einer Nasa-Rakete. Das sind Themen, die ein „Perplexity-Team“ eingestellt hat. Wer will, stellt sich auf gleiche Weise die Top-Kochbücher für 2024 zusammen oder die Top Zehn der YouTuber.
Das ist alles nur geklaut, was die KI hier als „eigene“ Inhalte auswirft. Der eine und die andere wird eventuell als verlinkte Quelle einige Klicks abbekommen, doch dürfte vielen die handliche Übersicht reichen.
Wie Journalismus mittelfristig zu finanzieren ist, bleibt unklar. Die aufwendige Recherche einer klassischen Redaktion wird die KI wahrscheinlich weiterhin nicht ersetzen. An dieser Nachrichtenaufbereitung verdient zurzeit nur Perplexity: Der Pro-Dienst kostet 20 Dollar im Monat. Dahinter stehen als Investoren unter anderem Jeff Bezos, der Gründer von Amazon, und Nvidia, der Hersteller von Grafikkarten für PCs. Freilich hat Perplexity auch Kosten durch solche Seiten und die Aufbereitung der Texte durch KI-Maschinen. Zum Einsatz kommen wahlweise ein eigenes Perplexity-Modell oder die KI-Dienste GPT-4o oder GPT‑4 Turbo von OpenAI sowie Claude 3 von Anthropics.
Zum Beispiel Dante AI: Neben GPT‑4 von OpenAI und dem Vorgängermodell GPT‑3.5‑Turbo können neuerdings auch das Open-Source-Modell Falcon LLM und das Modell LlaMA 2 von Facebook-Anbieter Meta hinterlegt werden.
Zum Beispiel Perplexity AI: Hier kann statt GPT‑4 von OpenAI wahlweise auch das Modell Claude 2 oder ein eigenes Modell von Perplexity eingerichtet werden.
Hinzu kommt, dass GPT‑4 nach Beobachtung von Fachleuten zuletzt an Qualität eingebüßt hat. So konnten Anwaltskanzleien vor vier, fünf Monaten der Maschine durchaus brauchbare Vorlagen fürs rechtskonforme Internet-Impressum oder eine Datenschutzerklärung entlocken. Mittlerweile produziert GPT‑4 häufiger Müll.
Auch mir erging es zuletzt häufiger so: Einst gut funktionierende Prompts fürs Zusammenfassen von Sachverhalten in meinem, der Maschine antrainierten Duktus lassen nun häufiger Anforderungen offen. Es half, auf GPT‑3.5 statt 4 zu wechseln.
GPT‑4 mit nachlassender Qualität
Die nachlassende Qualität von GPT‑4 bestätigt in Teilen eine Studie der Universitäten Stanford und Berkeley: In drei von vier getesteten Feldern nahm die Leistung zwischen März und Juni ab. Konnte die Maschine im März noch 97,6 Prozent an Primzahlen erkennen, waren es im Juni nur noch 2,4 Prozent.
Nun könnte man schlussfolgern, dass die Vielzahl aus Gagafragen aus aller Welt bei GPT‑4 in den vergangenen Monaten für Verwirrung und Durcheinander sorgt. Doch hat Open AI stets betont, dass die Chatverläufe aus Datenschutzgründen nicht in das Modell einfließen. Wahrscheinlicher ist, dass die Macher ihr Modell weiterentwickeln und vor allem Rechenzeit pro Anfrage einsparen – nicht immer zum Besten.
Wie einst in der Schrauberszene für Autos tunen heute Enthusiasten ihre zusammengeklickten KI-Maschinen, bauen etwa ein anderes Sprachmodell als GPT‑4 als neuen Motor ein. Wie sich die Motoren unterscheiden, erschließt sich bei den merkwürdigen Namen wie LlaMA und Falcon allerdings nur Spezialisten. Schrauben dann zusätzlich die Macher von GPT‑4 im Hintergrund an den Parametern, ist guter Rat teuer: Warum schwankt die Qualität der Antworten?
Die Ingenieure bei OpenAI halten sich mit Antworten dazu eher zurück. Doch scheint der Markt sich neu zu orientieren: Der Traffic auf der Webseite openai.com ging laut Similarweb von Mai (1,9 Milliarden Visits) bis Juli (1,5 Milliarden) deutlich zurück.
Wer will, baut sich vielleicht lieber auf dem eigenen Rechner eine eigene KI nach, dafür gibt es die Anwendung GPT4All. Auch hier können GPT‑4 und 3.5, aber auch LlaMA 2 und andere Modelle hinterlegt werden.
Wer sind Sie und was wollen Sie?
Hinzu kommen bei den kommerziellen Diensten Perplexity und Dante AI vorzugebende Randumstände, an denen sich die jeweiligen KIs orientieren sollen. Beim herkömmlichen GPT‑4 füllt man dafür zwei Felder aus, in denen man zunächst die eigene Rolle („Ich bin CEO und brauche klare, pointierte Antworten, auch Hinweise auf mögliche fehlerhafte Entscheidungen“) und dann die Wünsche an die Antworten formuliert („Genaue Antworten, erfinde nichts“).
Bei Perplexity AI wird das ausführlicher. Die Maschine möchte Infos über den eigenen Standort, in welcher Sprache zu antworten ist, eigene Hobbys und Interessen, den Beruf und künftige Ziele.
Perplexity gibt dadurch genauere Antworten, die auf den Fragenden besser abgestimmt sind. Hinzuschaltbar ist außerdem ein „Copilot“: Dann antwortet Perplexity nicht einfach drauflos, sondern stellt durchaus intelligente Verständnisfragen. Oder schaut im Internet nach.
Das Nutzerinterface ist dabei gewöhnungsbedürftig. So wird fürs Zusammenfassen eines längeren Textes zurückgefragt, welchen thematischen Schwerpunkt die Zusammenfassung haben soll – und macht auch gleich kommaseparierte Vorschläge. Will man dann zwei, drei Schwerpunkte auswählen, verschwinden sie beim Anklicken und müssen manuell eingetippt werden – lästig.
Die Maschine schaut selbst im Internet nach
Interessant ist Perplexity aber auch deshalb, weil es von Haus aus Internetrecherchen zum Beantworten anstellen kann. Die Quellen werden angegeben. Auch ist es möglich, eine Datei hochzuladen und gezielt Fragen dazu zu beantworten. „Worum geht es in dem Video?“ – die Frage samt benannter YouTube-Adresse bringt die Maschine zu einer ordentlichen Zusammenfassung; wenngleich sie auch Dinge aus anderen Quellen hineinmengt, dies aber meist transparent macht.
Perplexity kostet wie GPT‑4 20 Dollar im Monat. Voreingestellt ist die Nutzung der eigenen Chatverläufe durch das Unternehmen dahinter, um das Perplexity-Sprachmodell zu verbessern. Das kann man abschalten.
Insgesamt bietet Perplexity über GPT‑4 hinausgehende Funktionen wie die Alternative Claude 2 als Sprachmodell, das viel längere Prompts erlaubt, und die schnelle Live-Suche auf Internetseiten. Beim alten GPT‑4 gelingt Vergleichbares nur mit Plugins.
Sind Perplexity und Dante damit Aspiranten auf die Nachfolge oder Wachablösung von GPT‑4? Nein, dazu fehlen ihnen weitgehend die eigenen Trainingsdaten. Doch ist der simple Austausch des Motors auch von fremden Anbietern unter der Haube etwas, das ChatGPT nicht bietet. Und dann ist auch noch die Funktion „Advanced Data Analysis“ bei GPT‑4, die das Hochladen eigener Dokumente erlaubt.
Der Markt wird unübersichtlich
Die Funktionalitäten der KIs werden weiter rasant erweitert. Der Markt wird für Laien zusehends unübersichtlich. Rund 7.500 KI-Dienste versammelt die „Übersicht“ namens There’s an AI for that. Was da jeweils unter der Motorhaube steckt und Erfolg hat, muss der Markt sichten und richten.
Und da haben wir bisher nicht über weiterhin agierende große alternative Dienste wie von Google („Bart“ und „Duet AI“) und der angeblichen europäischen Alternative Aleph Alpha aus Heidelberg gesprochen. Für Duet AI habe ich meine Freischaltung zum Testen beantragt, bei Aleph Alpha befand ich die Antwortqualität nach einem Test auf deren Spielwiese nicht konkurrenzfähig. Die Ansprüche steigen.